Job position SRE / DevOps Expert Datadog (H/F)
Share this job
Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
Candidate profile
Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
Working environment
Mission Longue – SRE / DevOps Expert Datadog (H/F)
Paris (hybride possible)
Mission longue durée
Contexte :
Dans le cadre du renforcement de l’équipe SRE, nous recherchons un Expert Datadog – profil SRE/DevOps senior (5–8 ans d’expérience) pour piloter la gouvernance et l’optimisation de la plateforme d’observabilité dans un environnement AWS / Kubernetes exigeant (forte volumétrie, idéalement média).
Profil recherché
5 à 8 ans d’expérience DevOps / SRE
Expertise avancée Datadog (indispensable)
Solide maîtrise AWS & Kubernetes
Expérience en gouvernance d’outil d’observabilité
Expérience en environnement média fortement appréciée
Certification Datadog appréciée
Environnement Technique
Cloud : AWS (100%)
Orchestration : Kubernetes
CI/CD & pratiques DevOps
Observabilité : Datadog (expertise avancée requise)
Vos missions
Gouvernance & Structuration Datadog
Définition des standards d’implémentation (naming, tagging, templates)
Mise en place d’une stratégie globale d’observabilité
Structuration des données remontées (logs, métriques, traces)
Normalisation des dashboards et monitors
Gestion des accès (RBAC), rôles et policies
Optimisation des coûts (ingestion logs/APM/custom metrics)
Monitoring & Observabilité avancée avec Datadog
Vous interviendrez notamment sur :
Monitoring & Metrics
Création et optimisation de monitors avancés (multi-alerting, composite monitors)
Mise en place de SLO / SLA / Error Budgets
Déploiement de métriques custom (DogStatsD)
Monitoring infra AWS (EC2, RDS, ELB, Lambda, etc.)
Monitoring Kubernetes (nodes, pods, HPA, etc.)
Capacity planning & forecasting
Logs Management
Structuration des pipelines de logs
Création de processors (parsing, remapping, enrichment)
Définition des règles d’indexation & retention
Mise en place d’alertes sur logs critiques
Optimisation coûts ingestion logs
APM & Tracing
Implémentation APM sur applications
Analyse des traces distribuées
Identification des bottlenecks applicatifs
Suivi de latence, erreurs, throughput
Service mapping & dépendances
Real User Monitoring (RUM)
Monitoring expérience utilisateur
Analyse des performances frontend
Corrélation RUM ↔ backend traces
Sécurité & Compliance
Implémentation de Security Monitoring
Détection d’anomalies
Mise en place de règles de sécurité
Audit et suivi des accès
Automatisation & IaC
Gestion Datadog via Terraform
Industrialisation des monitors & dashboards
Intégration CI/CD
Mise en place d’alerting automatisé
Incident Management
Optimisation de l’alerting (réduction du bruit)
Mise en place d’alertes intelligentes
Intégration avec outils d’incident (PagerDuty, Slack, etc.)
Post-mortem & amélioration continue
Soft skills
Leadership technique
Capacité à structurer & standardiser
Vision stratégique de l’observabilité
Forte culture fiabilité / performance
Excellente communication
Merci à vous et belle journée 😉
Apply to this job!
Find your next career move from +800 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
SRE / DevOps Expert Datadog (H/F)
Sapiens Group
