Le poste Site Reliability Engineering (SRE)
Partager cette offre
Nous sommes Ă la recherche dâun SRE pour renforcer lâĂ©quipe technique de notre client et accompagner la montĂ©e en puissance de sa plateforme e-commerce.
Ce rĂŽle stratĂ©gique implique une vision globale de lâarchitecture, une forte sensibilitĂ© sĂ©curitĂ©, ainsi quâune capacitĂ© Ă intervenir rapidement et efficacement sur les incidents tout en amĂ©liorant la rĂ©silience de la plateforme.
đ Missions principales :Gestion de la fiabilitĂ© et rĂ©ponse Ă incident
âą Suivre les budgets dâerreur et arbitrer avec les Ă©quipes produit : pas de nouvelles features si la
fiabilité est en danger.
âą Ătre en premiĂšre ligne sur les incidents
⹠Coordonner la réponse (diagnostic, communication, mitigation).
⹠Rédiger et animer les post-mortems, identifier les causes racines et mettre en place des
correctifs systémiques.
Capacité, Performance et Sécurité
⹠Planifier la capacité (scaling horizontal/vertical).
⹠Effectuer des tests de charge, de résilience et du chaos engineering.
âą Anticiper les goulets dâĂ©tranglement.
âą Optimiser les coĂ»ts de lâinfrastructure
âą Veiller Ă ce que lâinfrastructure respecte les standards en matiĂšre de sĂ©curitĂ©
Build
âą Ăliminer les tĂąches rĂ©currentes par des scripts, pipelines, auto-healing.
⹠Construire des mécanismes de déploiement et de rollback sécurisés et fiables.
⹠Optimiser le Disaster Recovery Plan en collaboration avec l'équipe platform engineering
Observabilité & excellence opérationnelle
⹠Maintenir et améliorer la stack d'observability basée sur OTEL et Elastic.
âą DĂ©velopper de nouvelles metrics et renforcer lâobservabilitĂ© globale.
⹠Améliorer les temps de détection (MTTD) et de résolution (MTTR).
⹠Garantir que les déploiements respectent les standards de fiabilité
⹠Mise en place de process de déploiement fiables (blue/green, canary releases, progressive
delivery).
Culture & pratiques
⹠Former les devs à la responsabilité de la production, tout en restant gardien de la fiabilité.
âą Instaurer une approche âreliability-firstâ dans la roadmap.
⹠Former et accompagner les équipes internes dans la prise en main des outils.
âą RĂ©daction et mise Ă jour de la documentation relative Ă lâinfrastructure, aux processus et aux meilleures pratiques pour faciliter le partage des connaissances et lâintĂ©gration des nouveaux
membres de lâĂ©quipe.
Profil recherché
Techniques :
⹠Maßtrise des environnements Cloudflare, Elastic, CI/CD (Github ou équivalent), Terraform ou autre IaC.
⹠Solides compétences en sécurité applicative.
⹠Bonnes bases en observabilité, monitoring et métriques.
⹠Expérience sur stack JS
Transverses :
⹠Capacité à documenter et formaliser (ADR, guidelines)
⹠Pédagogie et accompagnement des équipes
âą CapacitĂ© dâanalyse et de debugging dans une architecture distribuĂ©e
⹠Langages & environnements appréciés : TypeScript, Nuxt, C#, Azure, GCP, Elastic, outils CI/CD, solutions de monitoring.
âą ExpĂ©rience au sein dâun univers e-commerce et/ou retail
Environnement de travail
đđ Mission en full tĂ©lĂ©travail (depuis la France)
âł Mission longue, contrats de 6 mois renouvelables
đ DĂ©but de mission : ASAP
â Freelance uniquement, pas dâESN
Postulez Ă cette offre !
Trouvez votre prochaine mission parmi +8âŻ000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critÚres importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthĂšque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Site Reliability Engineering (SRE)
DEV AND CONNECT