Le poste Platform Reliability Engineer SRE & DevOps
Partager cette offre
Contexte et approche : La mission s’inscrit dans une démarche SRE et DevOps, avec une intégration à l’équipe Plateforme pour garantir fiabilité, exploitabilité et qualité des microservices.
Principales responsabilités :
- Assurer l’intégration et l’exploitation opérationnelle des applications de la plateforme.
- Vérifier la conformité des livraisons selon les standards (nommage, logs, documentation, monitoring).
- Améliorer la documentation des releases.
- Définir et suivre des indicateurs de fiabilité (SLI/SLO), error budgets, en lien avec les équipes de développement.
- Configurer et maintenir dans Datadog les dashboards, règles d’alerting, runbooks, et améliorer l’observabilité.
- Diagnostiquer en profondeur les applications (.NET, PHP, JavaScript) via logs, traces et métriques (Datadog APM/Logs/RUM).
- Automatiser l’exploitation par la configuration d’autoscaling, health probes, politiques de redémarrage et procédures de failover.
- Conduire des post-mortems après incidents, documenter et piloter les actions correctives.
- Mettre à jour et optimiser les pipelines de déploiement dans Azure DevOps.
- Maintenir et faire évoluer les Helm charts pour le déploiement sur Kubernetes (AKS).
- Intégrer SonarQube dans les processus de livraison pour renforcer la qualité du code.
- Collaborer avec les tech leads, développeurs et QA pour intégrer les tests automatisés en CI/CD et renforcer la résilience des services.
- Assurer un support de niveau 3 sur les services de la plateforme et participer aux analyses post-incident.
Profil recherché
Compétences techniques requises :
- Maîtrise de la mise en œuvre de pipelines Azure DevOps (YAML, templates).
- Expérience avec Kubernetes (AKS) et gestion des déploiements via Helm charts.
- Pratique de Datadog (APM, Logs, RUM, dashboards, alerting, runbooks).
- Connaissance de SonarQube et de son intégration dans la CI/CD.
- Bonnes notions de Windows Servers et environnements hybrides.
- Compréhension des principes SRE : SLI/SLO, error budgets, observabilité, postmortems.
- Connaissances en développement (C#, PHP, JavaScript) appréciées.
- Familiarité avec Octopus Deploy est un atout.
Compétence linguistique : Anglais courant indispensable.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +8 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Platform Reliability Engineer SRE & DevOps
Codezys