Job position Ops Engineer / Ingénieur SRE (H/F)
Share this job
Contexte
Notre client souhaite renforcer son équipe Accompagnement Résilience. L’objectif : maintenir un équilibre optimal entre performance, fiabilité et maîtrise budgétaire au sein de ses plateformes Cloud.
Nous recherchons un Ops Engineer / SRE confirmé (H/F), capable d’intervenir sur des environnements AWS complexes et orientés résilience.
MissionsPilotage et ingénierie de la résilience
Participer à la définition, au suivi et au pilotage des SLO / SLI / SLA
Réaliser des audits de résilience et présenter les recommandations
Contribuer aux analyses d’incidents et aux post-mortems
Industrialisation & automatisation
Industrialiser les processus de déploiement, exploitation et tests de résilience
Concevoir et maintenir des scripts d’automatisation (Bash, Python)
Administrer et optimiser les outils de résilience : Gatling, Gremlin, tableaux de bord SLO…
AWS & performance
Exploiter, optimiser et sécuriser les environnements AWS dans une démarche SRE
Challenger les équipes sur les choix techniques / architecturaux
Être force de proposition pour l’optimisation performance / coût
Livrables attendusLivrables techniques
Plateformes et outils de résilience opérationnels
Scripts d’automatisation / industrialisation
Tableaux de bord SLO, métriques & KPIs Cloud
Scénarios de tests de charge et de chaos engineering
Documentation
Documentation d’exploitation
Procédures de résilience
Guides d’usage des outils
Rapports d’audit & comptes-rendus d’incidents
Plans d’amélioration continue
Compétences requises
Compétences techniques
Maîtrise avancée Linux / Unix
Expertise AWS, dont : EC2, ECS/EKS, Lambda, IAM, VPC, RDS, S3, CloudWatch
Architectures Cloud natives & distribuées
Haute disponibilité & résilience Cloud
Outils de test de charge : Gatling (ou équivalent)
Chaos Engineering : Gremlin (ou équivalent)
Observabilité & monitoring : Datadog, Prometheus, Grafana
Automatisation & CI/CD
IaC : Terraform, CloudFormation
Scripts Bash / Python
Git & gestion de configuration
Méthodologies
Approche SRE & DevOps
Définition / pilotage SLO, SLI, SLA
Pratique d’analyses d’incidents
Expérience en environnement agile
Apply to this job!
Find your next career move from +1,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Ops Engineer / Ingénieur SRE (H/F)
WINSIDE Technology
