Job position Platform Reliability Engineer SRE & DevOps
Share this job
Contexte et approche : La mission s’inscrit dans une démarche SRE et DevOps, avec une intégration à l’équipe Plateforme pour garantir fiabilité, exploitabilité et qualité des microservices.
Principales responsabilités :
- Assurer l’intégration et l’exploitation opérationnelle des applications de la plateforme.
- Vérifier la conformité des livraisons selon les standards (nommage, logs, documentation, monitoring).
- Améliorer la documentation des releases.
- Définir et suivre des indicateurs de fiabilité (SLI/SLO), error budgets, en lien avec les équipes de développement.
- Configurer et maintenir dans Datadog les dashboards, règles d’alerting, runbooks, et améliorer l’observabilité.
- Diagnostiquer en profondeur les applications (.NET, PHP, JavaScript) via logs, traces et métriques (Datadog APM/Logs/RUM).
- Automatiser l’exploitation par la configuration d’autoscaling, health probes, politiques de redémarrage et procédures de failover.
- Conduire des post-mortems après incidents, documenter et piloter les actions correctives.
- Mettre à jour et optimiser les pipelines de déploiement dans Azure DevOps.
- Maintenir et faire évoluer les Helm charts pour le déploiement sur Kubernetes (AKS).
- Intégrer SonarQube dans les processus de livraison pour renforcer la qualité du code.
- Collaborer avec les tech leads, développeurs et QA pour intégrer les tests automatisés en CI/CD et renforcer la résilience des services.
- Assurer un support de niveau 3 sur les services de la plateforme et participer aux analyses post-incident.
Candidate profile
Compétences techniques requises :
- Maîtrise de la mise en œuvre de pipelines Azure DevOps (YAML, templates).
- Expérience avec Kubernetes (AKS) et gestion des déploiements via Helm charts.
- Pratique de Datadog (APM, Logs, RUM, dashboards, alerting, runbooks).
- Connaissance de SonarQube et de son intégration dans la CI/CD.
- Bonnes notions de Windows Servers et environnements hybrides.
- Compréhension des principes SRE : SLI/SLO, error budgets, observabilité, postmortems.
- Connaissances en développement (C#, PHP, JavaScript) appréciées.
- Familiarité avec Octopus Deploy est un atout.
Compétence linguistique : Anglais courant indispensable.
Apply to this job!
Find your next career move from +900 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Platform Reliability Engineer SRE & DevOps
Codezys