Le poste SRE - Domain Manager
Partager cette offre
Responsable de Domaine (Domain Manager)
Responsable de :
Garantir la fiabilité des services, l’excellence opérationnelle et la conformité des performances sur l’ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) au sein de l’Agile Release Train et du cycle de livraison produit.
Conditions de télétravail
Aucun télétravail pendant les 3 premiers mois de la mission
Présence sur site requise 3 jours par semaine par la suite
Mission
Garantir la stabilité, la performance et la disponibilité des services dans les environnements de production et hors production, tout en favorisant une culture orientée fiabilité au sein des équipes de delivery.
Pour assurer cette mission, ce rôle agit comme garant des évolutions produit avant leur mise en production, en veillant à ce que la qualité soit toujours conforme aux attentes des clients.
Collaborer avec les équipes Produit, Tech et Plateforme afin de maintenir le bon équilibre entre innovation, rapidité d’exécution et robustesse opérationnelle.
Principales activités
Définir, suivre et communiquer les objectifs de niveau de service (SLO), les indicateurs de niveau de service (SLI) et les budgets d’erreur sur les différents environnements afin d’assurer une fiabilité mesurable par domaine applicatif.
Garantir la mise en place et l’amélioration continue des dispositifs d’observabilité, de supervision et d’alerting.
Superviser la préparation opérationnelle de chaque release afin d’assurer la stabilité en production grâce à une coordination transverse avec les équipes Produit et Tech.
Possibilité de bloquer une mise en production lorsque la qualité mesurée ne correspond pas aux attentes des clients.
Gérer la réponse aux incidents, les analyses des causes racines et les revues post-mortem afin d’assurer la responsabilité et l’amélioration continue par domaine applicatif.
Collaborer avec les équipes Core Platform et Observability & FinOps afin de renforcer la résilience des systèmes, optimiser les coûts et maintenir les performances de la plateforme.
Communiquer l’état de la fiabilité, les risques et les actions d’amélioration aux Agile Release Managers et aux responsables de domaine afin d’assurer l’alignement entre les ARTs (Agile Release Trains).
Participer activement à l’Agile Release Train en représentant la voix de la fiabilité et des opérations, afin de soutenir le rythme de livraison et la qualité.
Compétences
Techniques
Solide expertise en Site Reliability Engineering (SRE) dans des environnements SaaS ou cloud-native.
Excellente compréhension de l’observabilité des systèmes, de l’automatisation et des frameworks de monitoring.
Expérience dans la définition et la gestion des SLO, SLI et budgets d’erreur en collaboration avec les équipes d’ingénierie.
Maîtrise des pratiques DevSecOps, des pipelines CI/CD et du monitoring continu.
Fonctionnelles
Expérience significative en gestion des incidents, analyses post-mortem et préparation opérationnelle.
Capacité démontrée à coordonner des initiatives de fiabilité entre les équipes Produit, Tech et Plateforme.
Forte orientation sur les indicateurs de performance, la prévention des causes racines et la gouvernance opérationnelle.
Soft Skills
Esprit analytique et approche orientée données pour le suivi de la fiabilité.
Profil recherché
Techniques
Solide expertise en Site Reliability Engineering (SRE) dans des environnements SaaS ou cloud-native.
Excellente compréhension de l’observabilité des systèmes, de l’automatisation et des frameworks de monitoring.
Expérience dans la définition et la gestion des SLO, SLI et budgets d’erreur en collaboration avec les équipes d’ingénierie.
Maîtrise des pratiques DevSecOps, des pipelines CI/CD et du monitoring continu.
Fonctionnelles
Expérience significative en gestion des incidents, analyses post-mortem et préparation opérationnelle.
Capacité démontrée à coordonner des initiatives de fiabilité entre les équipes Produit, Tech et Plateforme.
Forte orientation sur les indicateurs de performance, la prévention des causes racines et la gouvernance opérationnelle.
Soft Skills
Esprit analytique et approche orientée données pour le suivi de la fiabilité.
Environnement de travail
Responsable de Domaine (Domain Manager)
Responsable de :
Garantir la fiabilité des services, l’excellence opérationnelle et la conformité des performances sur l’ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) au sein de l’Agile Release Train et du cycle de livraison produit.
Conditions de télétravail
Aucun télétravail pendant les 3 premiers mois de la mission
Présence sur site requise 3 jours par semaine par la suite
Mission
Garantir la stabilité, la performance et la disponibilité des services dans les environnements de production et hors production, tout en favorisant une culture orientée fiabilité au sein des équipes de delivery.
Pour assurer cette mission, ce rôle agit comme garant des évolutions produit avant leur mise en production, en veillant à ce que la qualité soit toujours conforme aux attentes des clients.
Collaborer avec les équipes Produit, Tech et Plateforme afin de maintenir le bon équilibre entre innovation, rapidité d’exécution et robustesse opérationnelle.
Principales activités
Définir, suivre et communiquer les objectifs de niveau de service (SLO), les indicateurs de niveau de service (SLI) et les budgets d’erreur sur les différents environnements afin d’assurer une fiabilité mesurable par domaine applicatif.
Garantir la mise en place et l’amélioration continue des dispositifs d’observabilité, de supervision et d’alerting.
Superviser la préparation opérationnelle de chaque release afin d’assurer la stabilité en production grâce à une coordination transverse avec les équipes Produit et Tech.
Possibilité de bloquer une mise en production lorsque la qualité mesurée ne correspond pas aux attentes des clients.
Gérer la réponse aux incidents, les analyses des causes racines et les revues post-mortem afin d’assurer la responsabilité et l’amélioration continue par domaine applicatif.
Collaborer avec les équipes Core Platform et Observability & FinOps afin de renforcer la résilience des systèmes, optimiser les coûts et maintenir les performances de la plateforme.
Communiquer l’état de la fiabilité, les risques et les actions d’amélioration aux Agile Release Managers et aux responsables de domaine afin d’assurer l’alignement entre les ARTs (Agile Release Trains).
Participer activement à l’Agile Release Train en représentant la voix de la fiabilité et des opérations, afin de soutenir le rythme de livraison et la qualité.
Compétences
Techniques
Solide expertise en Site Reliability Engineering (SRE) dans des environnements SaaS ou cloud-native.
Excellente compréhension de l’observabilité des systèmes, de l’automatisation et des frameworks de monitoring.
Expérience dans la définition et la gestion des SLO, SLI et budgets d’erreur en collaboration avec les équipes d’ingénierie.
Maîtrise des pratiques DevSecOps, des pipelines CI/CD et du monitoring continu.
Fonctionnelles
Expérience significative en gestion des incidents, analyses post-mortem et préparation opérationnelle.
Capacité démontrée à coordonner des initiatives de fiabilité entre les équipes Produit, Tech et Plateforme.
Forte orientation sur les indicateurs de performance, la prévention des causes racines et la gouvernance opérationnelle.
Soft Skills
Esprit analytique et approche orientée données pour le suivi de la fiabilité.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +8 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
SRE - Domain Manager
CAT-AMANIA
