Job position Engineer Azure / Ingénieur Fiabilité Cloud
Share this job
Garantir la fiabilité, la performance, la sécurité et la maîtrise des coûts du socle Azure (AKS, Data Platform Databricks, ADF, App Services, VMs, réseau hybride). Définir et industrialiser les pratiques SRE (SLI/SLO/SLA, error budgets, observabilité, automatisation, post-mortems) et contribuer activement à la gouvernance FinOps et à la réduction des dérives de consommation.
Objectifs et livrables
Missions principales :
Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation.
Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting.
FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation.
Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC.
Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives.
Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute.
Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil.
Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA.
Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture).
Livrables attendus :
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Profil recherché :
Bac +5 en informatique, systèmes, réseaux ou cloud computing.
Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2
ans sur un rôle SRE / Platform / Cloud Ops.
Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate.
Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée.
Anglais technique requis (échanges réguliers avec partenaires internationaux).
Compétences demandéesCompétences
Niveau de compétence
Autonomie Expert
Bon communiquant Expert
LanguesNiveau de langue
Anglais Courant
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Candidate profile
Bac +5 en informatique, systèmes, réseaux ou cloud computing.
Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2
ans sur un rôle SRE / Platform / Cloud Ops.
Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate.
Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée.
Anglais technique requis (échanges réguliers avec partenaires internationaux).
Working environment
Autonomie Expert
Bon communiquant Expert
LanguesNiveau de langue
Anglais Courant
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Apply to this job!
Find your next career move from +10,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Engineer Azure / Ingénieur Fiabilité Cloud
R&S TELECOM
