Job position Ingénieur SRE / Exploitation Systèmes (F/H)
Share this job
Contexte :
L’entreprise, acteur international de référence dans les technologies spatiales, la data-science et les solutions d’observation de la Terre, opère des services critiques présents dans plus de 30 pays. Avec plus de 1000 collaborateurs, elle conçoit et exploite des systèmes complexes combinant infrastructures on-premise, cloud, logiciels et chaînes de traitement data.
Au sein de la Direction des Systèmes d’Information (DSI), le département Opérations garantit le maintien en conditions opérationnelles (MCO), la fiabilité, la disponibilité et la performance de l’ensemble des services techniques fournis aux clients finaux.
Pour accompagner la forte croissance et renforcer la résilience des plateformes opérationnelles, l’entreprise recherche un :
Ce rôle est au cœur des services critiques 24/7. Il combine pratiques SRE, ingénierie d’exploitation, automatisation, système, monitoring et coordination transverse. Vous interviendrez sur des environnements hybrides (cloud + on-premise), à forte exigence de disponibilité et de performance.
Missions :
1. Gestion des incidents :
Piloter les incidents majeurs et coordonner l’ensemble des équipes techniques jusqu’au rétablissement complet du service.
Mener les analyses post-incident, identifier les causes racines, proposer et suivre les actions préventives.
Formaliser et optimiser les processus et procédures opérationnelles.
2. Observabilité et monitoring :
Maintenir et faire évoluer les outils de supervision, d’observabilité et d’alerting.
Développer dashboards, métriques, logs et traces pour une visibilité complète sur l’état de santé des services.
Détecter faiblesses techniques, dépendances critiques et risques opérationnels.
Définir et suivre SLI/SLO avec les équipes produit et les parties prenantes métier.
3. Automatisation et industrialisation :
Automatiser les tâches répétitives pour réduire le toil opérationnel.
Mettre en place et améliorer les pipelines CI/CD et l’Infrastructure as Code.
Collaboration étroite avec les équipes de développement pour intégrer les bonnes pratiques SRE dans le cycle de vie logiciel.
Standardiser configurations, environnements et processus pour améliorer la fiabilité globale.
4. Coordination pluridisciplinaire :
Support niveau 2/3, en lien direct avec les équipes d’exploitation H24.
Coopération avec les équipes IT, les développeurs et les responsables produit pour corriger les incidents et prévenir les récidives.
Contribution au respect des engagements techniques, contractuels et calendaires.
Application des politiques de sécurité et maintien en condition de sécurité (MCS) des systèmes en lien avec la sécurité SSI.
Candidate profile
Bac+5 en informatique, systèmes ou équivalent.
3 à 5 ans d’expérience en exploitation, ingénierie système ou SRE dans des environnements critiques.
Compétences techniques :
Systèmes & scripting : Linux, Bash, automatisation.
Conteneurs & orchestration : Docker, Kubernetes.
CI/CD & IaC : Git / GitLab, Ansible.
Cloud : connaissances AWS et/ou Azure.
Infrastructure IT : stockage, virtualisation, bases de données, réseaux.
Observabilité & monitoring : Zabbix, Grafana, CloudWatch, Prometheus, ELK / OpenSearch.
Compétences transverses :
Excellente capacité d’analyse en contexte critique.
Rigueur, autonomie, proactivité et sens des responsabilités.
Aisance de communication, travail en équipe, partage de connaissances.
Capacité à coordonner plusieurs acteurs dans des environnements techniques complexes.
Apply to this job!
Find your next career move from +10,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Ingénieur SRE / Exploitation Systèmes (F/H)
ODHCOM - FREELANCEREPUBLIK
