Le poste Engineer Azure / Ingénieur Fiabilité Cloud
Partager cette offre
Garantir la fiabilité, la performance, la sécurité et la maîtrise des coûts du socle Azure (AKS, Data Platform Databricks, ADF, App Services, VMs, réseau hybride). Définir et industrialiser les pratiques SRE (SLI/SLO/SLA, error budgets, observabilité, automatisation, post-mortems) et contribuer activement à la gouvernance FinOps et à la réduction des dérives de consommation.
Objectifs et livrables
Missions principales :
Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation.
Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting.
FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation.
Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC.
Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives.
Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute.
Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil.
Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA.
Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture).
Livrables attendus :
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Profil recherché :
Bac +5 en informatique, systèmes, réseaux ou cloud computing.
Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2
ans sur un rôle SRE / Platform / Cloud Ops.
Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate.
Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée.
Anglais technique requis (échanges réguliers avec partenaires internationaux).
Compétences demandéesCompétences
Niveau de compétence
Autonomie Expert
Bon communiquant Expert
LanguesNiveau de langue
Anglais Courant
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Profil recherché
Bac +5 en informatique, systèmes, réseaux ou cloud computing.
Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2
ans sur un rôle SRE / Platform / Cloud Ops.
Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate.
Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée.
Anglais technique requis (échanges réguliers avec partenaires internationaux).
Environnement de travail
Autonomie Expert
Bon communiquant Expert
LanguesNiveau de langue
Anglais Courant
Catalogue de SLI/SLO des services critiques et tableaux de bord associés.
Modules Terraform documentés et pipelines CI/CD de déploiement.
Runbooks d’exploitation et procédures d’incident.
Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation).
Post-mortems des incidents majeurs et suivi des actions correctives.
Feuille de route d’amélioration continue de la plateforme Azure.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +9 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Engineer Azure / Ingénieur Fiabilité Cloud
R&S TELECOM
