Missions freelance et emplois Site Reliability Engineering (SRE)

Connexion

Offres

Forum

Index des forums

Mes sujets favoris

Les sujets auxquels je participe

Les derniers sujets

Les sujets les plus discutés

Avantages exclusifs

Tests de soft skills

Free-Work Deals

Free-Work MyBusiness

Médias

Ressources

Baromètre IT

Rémunérations IT

Vos contributions

Annuaire des recruteurs IT

Simulation de revenu

Je suis recruteur

Connexion Inscription

1 / 2

Freelance

Mission freelance
Responsable d'Exploitation / Pilote d'Exploitation

Les Filles et les Garçons de la Tech

Publiée le 06/07/2026

Exploitation

ITIL

Site Reliability Engineering (SRE)

5 mois

130-600 €

Île-de-France, France

En tant que Responsable d'exploitation et Pilote de l'amélioration continue , vous assurez la gestion opérationnelle, la surveillance continue des ressources informatiques et vous garantissez le respect des engagements de service (SLA/SLO). Votre rôle central est de transformer la production IT en véritable levier de performance. Vos missions principales s'articulent autour des axes suivants : Pilotage et Sécurisation du RUN : Superviser les opérations courantes, gérer les incidents majeurs (incluant la résolution de premier niveau, l'escalade et l'analyse post-mortem RCA), et sécuriser le Maintien en Condition Opérationnelle et de Sécurité (MCO/MCS). Amélioration Continue et Optimisation : Définir et piloter le plan d'amélioration continue de la production, optimiser les processus (ITSM/ITIL) ainsi que les outils, et automatiser les tâches récurrentes pour réduire la charge manuelle. Conduite du changement et Projets : Accompagner la transformation technologique des métiers et des solutions depuis un environnement Legacy vers le Cloud. Vous piloterez également les projets clés liés au RUN. Coordination et Coaching : Coordonner les différents intervenants techniques, agir comme interface RUN pour les clients internes, et coacher les équipes d'exploitation pour harmoniser les pratiques et optimiser la productivité.

Freelance

Mission freelance
Devops SRE (H/F) - 92

Mindquest

Publiée le 01/07/2026

Ansible

DevOps

Kubernetes

2 ans

520-620 €

Châtillon, Île-de-France

1. Contexte Au sein de la Direction Digital, vous rejoignez la DSI Alimentaire et plus particulièrement l’équipe OPS du Digital Conso Lab, en charge de la plateforme e-commerce du client. La plateforme évolue dans un environnement hybride (On Premise + Cloud) et s’appuie sur un écosystème riche de solutions internes et partenaires. L’objectif global du projet est d’améliorer la plateforme e-commerce en garantissant sa cohérence technique, sa fiabilité opérationnelle et sa disponibilité 24/7. Vous évoluerez dans une équipe OPS expérimentée, en interaction constante avec les équipes DEV, QA et Release Management, dans un contexte de modernisation continue et d’industrialisation des pratiques DevOps/SRE. 2. Mission En tant que DevOps / SRE Senior, vous êtes responsable du maintien en conditions opérationnelles et de l’évolution de la plateforme e-commerce. Vos principales missions sont : Assurer le MCO des infrastructures virtualisées (diagnostic, résolution d’incidents, fiabilité) Configurer, dimensionner et optimiser les plateformes selon les besoins de performance Industrialiser les architectures et automatiser la gestion des infrastructures (CI/CD, IaC) Mettre en place et maintenir les solutions de supervision, monitoring et logging Participer à la modernisation de la plateforme e-commerce et à son amélioration continue Garantir la sécurité, la sauvegarde et la robustesse des environnements Contribuer aux phases de mise en production et de validation technique des évolutions Maintenir et enrichir la documentation technique Participer aux astreintes techniques (plateforme 24/7)

CDI

Freelance

Offre d'emploi
DEVOPS/ SRE

Genwaves Group

Publiée le 24/06/2026

DevOps

Site Reliability Engineering (SRE)

24 mois

65k-70k €

350-700 €

Paris, France

Intégré à l'équipe SRE, vous pilotez la fiabilité, la performance et l'automatisation des plateformes cloud – avec un fort focus sur OpenShift en environnement critique. Missions principales Supervision et fiabilisation des clusters OpenShift Gestion des CI/CD (GitLab), Terraform, Helm, Argo CD Mise en œuvre de GitOps, monitoring Prometheus/Grafana Résolution des incidents, optimisation performance, résilience Collaboration transverse avec les équipes dev, infra, sécu 5+ ans d'expérience DevOps ou SRE Expertise OpenShift en production (must-have) Solides bases Kubernetes, Cloud, API, microservices Bonne maîtrise : GitLab CI/CD, Prometheus, Terraform, Helm Bonus : scripting (Python, Bash), sécurité Cloud, large scale clusters

Freelance

Mission freelance
Senior Site Reliability Engineer — OpenStack / On-Prem Cloud (H/F) 75

Mindquest

Publiée le 06/07/2026

Ansible

DevOps

Linux

6 mois

540-600 €

Paris, France

Senior Platform Engineer / DevOps OpenStack & AI-Assisted Engineering 1. Contexte Dans le cadre du développement de sa plateforme cloud privée basée sur OpenStack, notre client recherche un(e) Senior Platform Engineer / DevOps pour rejoindre une équipe d'experts en charge de concevoir, industrialiser et exploiter une infrastructure cloud on-premise de nouvelle génération. Vous intégrerez une équipe senior responsable de l'infrastructure OpenStack , de la plateforme Kubernetes et des workflows GitOps qui supportent les services cloud de production. L'environnement de travail place l' AI-assisted engineering au cœur des pratiques d'ingénierie. L'utilisation quotidienne des LLM et des outils de développement assistés par IA (Claude Code, Cursor, agents de développement, génération de code et de tests, documentation automatisée, etc.) fait partie intégrante de la méthodologie de travail et constitue un véritable levier d'industrialisation. Cette mission offre une forte visibilité technique et une réelle capacité d'influence sur : l'architecture de la plateforme cloud ; la stratégie d'automatisation ; l'évolution des pratiques GitOps et Infrastructure as Code ; l'intégration des technologies d'IA dans les activités de Platform Engineering. Le poste s'inscrit dans un environnement fortement automatisé, orienté sécurité et exploitation de plateformes critiques. 2. Mission Au sein de l'équipe Platform Engineering, vous contribuerez à la conception, à l'automatisation et à l'exploitation d'une infrastructure cloud OpenStack hautement industrialisée. Vos principales responsabilités seront les suivantes : Concevoir et faire évoluer une infrastructure cloud OpenStack capable de s'installer et de se déployer de manière autonome. Développer et maintenir les infrastructures Infrastructure as Code avec Terraform et Ansible . Participer au développement de la plateforme Kubernetes ainsi qu'à l'amélioration des processus GitOps (FluxCD / ArgoCD). Administrer l'ensemble du cycle de vie des infrastructures de calcul : serveurs bare-metal ; firmware et BIOS ; provisioning matériel ; hyperviseurs ; nœuds de calcul virtualisés. Concevoir les mécanismes d'automatisation garantissant la disponibilité de la capacité, les mises à jour sans interruption et les opérations de maintenance. Développer des solutions favorisant l'auto-remédiation et l'auto-réparation de la plateforme. Mettre en œuvre des pratiques d' AI-assisted engineering pour accélérer : le développement ; la génération de tests ; la documentation ; la gestion des incidents ; les workflows d'ingénierie. Concevoir et maintenir une base de connaissances structurée destinée à alimenter les outils IA. Développer les tests fonctionnels, techniques, de performance et de sécurité. Documenter les solutions afin de faciliter leur déploiement et leur exploitation. Contribuer à l'amélioration continue de la plateforme à partir des retours utilisateurs et des données de supervision. Assurer un rôle de référent technique et accompagner les autres membres de l'équipe sur les sujets Platform Engineering, automatisation et IA.

Freelance

CDI

CDD

Offre d'emploi
Expert OpenStack et écosystème sous-jacent

R&S TELECOM

Publiée le 06/07/2026

Linux

OpenStack

Réseaux

6 mois

Paris, France

Contexte de la mission DCP est en production. L’équipe Socle souhaite renforcer sa capacité à exploiter, diagnostiquer et stabiliser la plateforme OpenStack ainsi que les composants techniques qui la supportent. La prestation vise à apporter une expertise opérationnelle sur OpenStack et son écosystème sous-jacent, avec un objectif de fiabilisation, d’industrialisation et de transfert de compétences. Profil attendu Profil expert OpenStack production, autonome, avec expérience réelle d’exploitation de plateformes critiques. Compétences attendues : maîtrise d’OpenStack et de ses principaux composants ; compréhension forte de l’écosystème sous-jacent : Linux, réseau, stockage, virtualisation ; expérience en diagnostic incident et production ; capacité à analyser les causes racines ; capacité à formaliser des procédures exploitables ; rigueur documentaire et transfert de compétences. Objectifs et livrables Objectifs Renforcer l’expertise OpenStack de l’équipe Socle. Diagnostiquer les incidents de production. Identifier les causes racines et proposer les remédiations. Stabiliser les composants OpenStack et leur socle technique. Améliorer les procédures d’exploitation. Transférer les compétences aux équipes internes. Périmètre technique Le profil interviendra sur : OpenStack : Nova, Neutron/OVN, Keystone, Glance, Cinder, Octavia. Virtualisation / compute : hyperviseurs, capacity planning, scheduling, ressources. Réseau : routage, VLAN/VXLAN, floating IP, provider networks, security groups, DNS, load balancing. Stockage : volumes, attachements, performance, intégration backend. Systèmes Linux : exploitation, logs, services, troubleshooting. Automatisation : scripts, contrôles, runbooks, industrialisation. Observabilité : métriques, alerting, diagnostic, amélioration de l’exploitabilité. Activités attendues -Analyse et résolution d’incidents OpenStack. Qualification technique avant escalade. RCA et plans de remédiation. Contribution aux corrections et optimisations. Amélioration des runbooks de production. Appui à l’industrialisation et à l’observabilité. Transfert de compétences à l’équipe Socle / SRE. Livrables : Concevoir, développer et déployer et maintenir un IaaS openstack. Concevoir, développer et déployer et maintenir un socle sous jacent au cloud: réseau, serveurs, écosystème. Intégrer les services aux outils d’exploitation : monitoring, logging, alerting. Compétences demandéesCompétences Niveau de compétence capacité à analyser les causes racines ; Confirmé expérience en diagnostic incident et production ; Confirmé compréhension forte de l’écosystème sous-jacent : Linux, réseau, stockage, virtualisation ; Confirmé maîtrise d’OpenStack et de ses principaux composants Confirmé

Freelance

Mission freelance
Site Reliability Engineer (SRE) Azure (H/F) - Freelance

GROUPE ARTEMYS

Publiée le 06/07/2026

Azure

Monitoring

Site Reliability Engineering (SRE)

12 mois

480-500 €

69005, Lyon, Auvergne-Rhône-Alpes

Qui sommes-nous ? Artemys, acteur de la transformation numérique est une entreprise à taille humaine, avec plus de 30 ans d’expérience composée de plusieurs entités, chacune spécialisée dans leur domaine (Système, data, réseaux/sécu…) Ce qui nous distingue vraiment ? Ce n’est pas de dire que nous valorisons nos collaborateurs, c’est de le montrer chaque jour. Chez Artemys, l’humain est au cœur de tout ce que nous faisons. Nos valeurs, concrètes et vécues au quotidien : Convivialité : travailler dans une bonne ambiance, ça change tout Proximité : chaque membre de l’équipe a sa place et sa voix Écoute : vos idées comptent autant que votre travail Artemys Paris , située dans le 10ᵉ arrondissement, est une entité spécialisée en infrastructures systèmes. Forte de 36 ans d’expertise , elle accompagne les entreprises, principalement implantées en Ile-de-France , dans leur transformation digitale. C’est au sein de cette entité, la plus ancienne du groupe, que l’aventure a débuté. Au fil des années, Artemys a su fidéliser une clientèle exigeante de Grands Comptes, certains clients accompagnant l’entreprise depuis sa création, dans des secteurs variés. Reconnue pour son exigence technique et ses valeurs humaines, elle est aujourd’hui un acteur clé des Infrastructures, Cloud et Modern Workplace. Votre mission (si vous l’acceptez) : Dans le cadre d'un programme d'industrialisation du RUN, vous interviendrez sur des applications critiques afin de les rendre plus fiables, observables et transférables vers un infogérant (MSP). Au quotidien, vous serez amené à : Reprendre des applications critiques en production. Analyser les incidents récurrents et piloter les RCA. Définir et améliorer les SLI, SLO et Error Budgets. Concevoir et standardiser les runbooks et dossiers d'exploitation. Définir les standards d'exploitabilité des applications. Mettre en place les plans de remédiation et d'amélioration continue. Développer l'observabilité des services et définir les indicateurs de supervision. Préparer et accompagner le transfert des applications vers le MSP. Collaborer avec les équipes Infrastructure, Patrimoine Applicatif, Architecture et Service Delivery. Participer activement à l'industrialisation des opérations et à la fiabilisation du SI. Le terrain de jeu ? Cloud & Infrastructure Azure Terraform (IaC) RUN & Production SRE Exploitation d'applications critiques RCA & gestion des incidents Observabilité Monitoring SLI / SLO / Error Budget Industrialisation Runbooks Standardisation du RUN Documentation d'exploitation Environnement MSP / Infogérance Amélioration continue Le profil que nous recherchons : Vous justifiez d'au moins 7 années d'expérience en exploitation, production ou Site Reliability Engineering. Vous possédez une solide expérience des environnements Azure. Vous êtes expert sur les problématiques de RUN, de production et de gestion d'incidents. Vous maîtrisez les démarches d'observabilité et de fiabilisation des applications. Vous savez rédiger des runbooks et structurer des processus d'exploitation. Vous avez déjà évolué dans des environnements complexes à fort enjeu métier. Une expérience avec un MSP ou un infogérant constitue un véritable atout. Vous disposez d'un anglais professionnel . Vous faites preuve d'un excellent esprit d'analyse, d'autonomie, de rigueur et appréciez les environnements nécessitant une forte collaboration transverse Le process pour nous rejoindre : simple et clair ! Échange RH : On discute de vos motivations et de l’adéquation avec nos valeurs (promis, pas de robotisation ici). Échange opérationnel : Je propose votre candidature au référent (Commercial, SDM, coordinateur…) du compte client, qui échange ensuite avec vous afin de valider votre adéquation avec le besoin. Proposition de mission : Si tout colle, on propose votre CV à notre client ! Conditions de rémunération : Statut : Indépendant / Freelance TJM : Entre 480 € et 500 € (Selon votre expertise) Localisation : Lyon Démarrage : Dès que possible (au plus tard le 1er septembre 2026) Bienvenue dans l’aventure ARTEMYS Chez nous, chaque talent compte. Peu importe votre âge, vos origines, votre identité, votre religion ou votre orientation : ce qui nous intéresse, c’est vous et ce que vous avez à apporter. On s’engage à répondre à toutes les candidatures sous 72 heures, parce qu’on sait combien l’attente peut être stressante. Et ici, l’inclusion n’est pas qu’un mot : tous nos postes sont ouverts aux personnes en situation de handicap, et on fait tout pour créer un environnement où chacun peut s’épanouir. Prêt, feu, candidatez !

Freelance

Mission freelance
Expert SRE Legacy / Bilingue Anglais H/F

Cheops Technology

Publiée le 16/06/2026

Site Reliability Engineering (SRE)

12 mois

400-550 €

La Défense, Île-de-France

Dans le cadre de la fiabilisation de son patrimoine applicatif critique, le client renforce sa squad SRE. Un premier profil SRE orienté Cloud a déjà intégré l'équipe ; le besoin prioritaire porte désormais sur une ressource SRE expérimentée sur les technologies legacy / on-premise, afin de couvrir l'exploitation des environnements historiques qui constituent le cœur du système d'information. L'objectif est d'éviter la redondance de compétences Cloud et de sécuriser une expertise rare sur les socles techniques existants, jugés aujourd'hui les plus critiques. Le profil recherché doit faire le pont entre les pratiques SRE modernes (observabilité, automatisation, post-mortem) et la réalité opérationnelle d'environnements legacy à forte volumétrie et forte criticité. Description Livrables Compétences Le SRE Legacy assure l'exploitation, la fiabilité et la résolution d'incidents sur les environnements on-premise du client. Ses principales responsabilités sont : Garantir la disponibilité et la performance des applications critiques s'appuyant sur les socles DB2, WebSphere, Apache et AIX. Assurer la résolution d'incidents complexes : diagnostic, analyse des causes racines (RCA), remédiation et capitalisation via post-mortems « blameless ». Mettre en place et améliorer l'observabilité des environnements historiques (monitoring, alerting, supervision applicative et système). Automatiser les tâches d'exploitation récurrentes et fiabiliser les opérations de run (scripts, ordonnancement, procédures). Contribuer à la stabilisation des chaînes critiques et à la réduction des incidents récurrents (MTTR, volumétrie d'incidents). Travailler en mode transverse avec les équipes de développement, l'infrastructure et les autres SRE (Cloud) dans une logique « You build it, you run it ». Documenter les architectures, runbooks et procédures d'exploitation.

CDI

Freelance

Offre d'emploi
Site Reliability Engineering (SRE)

WHIZE

Publiée le 08/06/2026

DevOps

Dynatrace

Incident Management

12 mois

40k-58k €

550-700 €

Île-de-France, France

Le bénéficiaire souhaite une prestation de Site Reliability Engineering (SRE) afin de participer à la sécurisation des activités RUN sur le périmètre Finance et Actuariat. Les missions sont : Au sein d'un équipage applicatif en charge des domaines Finance et Actuariat, le SRE est un acteur clef dans le maintient en condition opérationnelle et la stabilité des environnements techniques (Production/ hors Production). Les principales missions seront les suivantes : - Maintien du coverage avec la DSI sur un périmètre applicatif RUN. - Mise en place des indicateurs / SLA, SLO avec la DSI. - Mise en place, suivi et analyse des métriques de performance et disponibilité de la Production (via Dynatrace). - Etre le référent Dynatrace pour l'équipage APS. - Définition et mise en place via Ansible et scripting les actions d'automatisation sur le périmètre (arrêts relances, déploiement automatisé, sanity check,...) - Participation aux rituels de l’équipe. - Consultation lors de l’instruction des projets sur l'exploitabilité des solutions. - Émission des avis de production pour les comités d’architecture. - Veille pour le respect des bonnes pratiques Groupes dans le cadre des déploiements et livraisons. - Contribution au maintien en conditions opérationnelles des applications. - Accompagnement et conseil auprès de la DSI , participation à leurs cérémonies. - Participation à la vie de l'application en étant force de proposition dans la résolution d'incidents ou de problèmes.

Freelance

Mission freelance
Manager de Transition – CPTO / CTO - Editeur de logiciel - Full remote

KatchMe Consulting

Publiée le 01/07/2026

PHP

React

6 mois

France

Société Éditeur SaaS en forte croissance spécialisé dans la digitalisation des processus des entreprises. La société accompagne plusieurs milliers de professionnels. Organisation d'une centaine de collaborateurs, entièrement en remote, avec une équipe Tech d'environ 35 personnes. Mission & responsabilités Dans un contexte d'accélération et de structuration de l'organisation produit & engineering, vous intervenez en tant que CPTO / CTO de transition afin de redonner de la vitesse aux équipes et d'accompagner l'entreprise dans sa croissance. Vos principales responsabilités seront notamment de : Piloter l'organisation Product & Engineering en collaboration directe avec les fondateurs. Manager une équipe d'environ 35 collaborateurs au travers de 5 Team Leads, d'un Lead QA et d'un SRE. Exécuter la roadmap produit et technique tout en améliorant la capacité de livraison des équipes. Remettre en place des indicateurs de pilotage (KPIs, vélocité, delivery, ROI). Accompagner les managers dans leur montée en compétence et renforcer les pratiques de management à distance. Participer au recrutement des profils clés de l'équipe Tech. Structurer les processus d'exécution et de collaboration entre Product, Engineering et Business. Préparer la transition avec le futur CPTO qui sera recruté à l'issue de la mission.

Freelance

Mission freelance
DevOps / SRE Senior Freelance

SURICATE IT

Publiée le 25/06/2026

DevOps

Kubernetes

Monitoring

3 ans

500-650 €

Châtillon, Île-de-France

Mission DevOps / SRE Senior Freelance 📅 Démarrage : ASAP 📍 Lieu : Hauts-de-Seine (92) 🎯 Expérience : 10 ans minimum 🏠 Télétravail : 2 jours/ semaine (NON NEGOCIABLE) 🏦 Secteur : Grande distribution 💶 TJM : 650€ 🏢 Contexte de la mission Au sein de la Direction Digital d'un grand groupe de grande distribution, vous rejoindrez la DSI au sein de l'équipe OPS en charge de la plateforme e-commerce. Vous travaillerez en étroite collaboration avec les équipes OPS, DEV, QA et Release Management sur une plateforme hébergée en mode hybride (On Premise + Cloud), à haute disponibilité (24/7). ⚙️ Environnement technique Infrastructure : VMware vSphere, Windows, Linux Conteneurs : Docker, Kubernetes CI/CD : Azure DevOps IaC : Terraform, Terragrunt, Ansible Monitoring : OpenTelemetry, VictoriaMetrics, Grafana, Dynatrace Réseau : NLB F5, DNS, DHCP Web : Microsoft IIS, Nginx Messaging : RabbitMQ Sécurité : Vault, Active Directory Bases de données : PostgreSQL, Redis, SQL Server Qualité : SonarQube 🛠️ Missions principales Maintenir en condition opérationnelle les infrastructures virtualisées Configurer et dimensionner les plateformes selon les besoins de performance Industrialiser les architectures cibles et automatiser la configuration (CI/CD) Implémenter et administrer les outils de supervision (haute disponibilité) Participer à la modernisation et l'amélioration continue de la plateforme e-commerce Assurer la sauvegarde des données, la sécurité des accès et la fiabilité des solutions Contribuer aux phases de validation technique lors des mises en production Maintenir et enrichir la documentation technique

CDI

Offre d'emploi
Ingénieur SRE / Platform Engineer (H/F)

Link Consulting

Publiée le 16/06/2026

Docker

Kubernetes

Site Reliability Engineering (SRE)

45k-50k €

Toulouse, Occitanie

Notre client, acteur reconnu dans le secteur bancaire, recherche son futur Ingénieur SRE / Platform Engineer (H/F) pour son site de Toulouse, dans le cadre du renforcement de sa plateforme technique et de ses pratiques d’industrialisation. Poste Intégré à une équipe transverse dédiée à la plateforme et à l’intégration, vous intervenez principalement sur des sujets Build avec pour objectif de structurer un environnement technique fiable, automatisé et orienté self-service. Votre rôle est de faciliter le travail des équipes de développement en mettant à disposition des outils et standards robustes, dans une logique de Platform Engineering, avec une forte culture Infrastructure as Code. Vous évoluerez dans un environnement hybride combinant GCP et Kubernetes On-Premise. Missions * Concevoir et maintenir des infrastructures automatisées (Terraform, Helm) * Développer des outils et templates en self-service pour les équipes applicatives * Construire et optimiser les pipelines CI/CD * Mettre en place des solutions d’observabilité (monitoring, alerting, logs) * Assurer un support avancé sur les incidents applicatifs critiques (N3) * Intégrer les exigences de sécurité dans les processus CI/CD * Collaborer étroitement avec les équipes de développement pour faciliter les déploiements * Participer à la structuration et à l’évolution de la plateforme technique Compétences techniques * Cloud : GCP (environnement principal) * Conteneurisation : Kubernetes, Docker * Infrastructure as Code : Terraform * CI/CD : GitLab CI, GitHub Actions ou Jenkins * Observabilité : Datadog, Prometheus * Environnements distribués : microservices, APIs Une expérience en développement (Node.js, Go ou Python) sera un réel atout.

Freelance

CDI

Offre d'emploi
Expert Observabilité et Cloud sur le mans

EterniTech

Publiée le 26/06/2026

Ansible

DevOps

Dynatrace

6 mois

Le Mans, Pays de la Loire

Je cherche pour un de mes client un Expert Observabilité et Cloud sur le mans Mission sur site client au Mans Présentiel 3j/sem attendu Contexte de la mission Dans le cadre de la modernisation du SI, la mission vise à : - Apporter une expertise pour accompagner les équipes ITOM en charge de l observabilité dans l intégration du standard OpenTelemetry, afin d unifier la collecte des données d observabilité (logs, métriques, traces) et de couvrir les environnements hybrides - Réaliser une phase d analyse et d adaptation de l'existant - Mettre en uvre les OpenTelemetry Collectors et l instrumentation applicative avec des responsables - Assurer l interfaçage et la mise en conformité des backends d observabilité (Dynatrace, ELK) avec le standard OpenTelemetry Localisation : site du Mans uniquement Détails de la prestationLa société devra fournir les prestations suivantes : - Contribuer à la conception et au déploiement d une architecture d observabilité moderne basée sur OpenTelemetry, garantissant une collecte unifiée, fiable et scalable dans des environnements cloud hybrides et distribués (Kubernetes, cloud public, on premise) - Définir et industrialiser les pipelines de télémétrie OpenTelemetry (instrumentation, collectors, routing, enrichment), en assurant la qualité, la cohérence et la gouvernance des données à l échelle du SI - Intégrer de manière optimisée les flux de télémétrie avec les plateformes existantes (Dynatrace, ELK, etc.), en maximisant la corrélation inter signaux et la visibilité end to end - Mettre en oeuvre une approche Observability as Code (Monaco, Terraform, CI/CD), intégrant les SLO/SLI et les pratiques de fiabilité - Accompagner les équipes ITOM / DevSecOps dans l adoption des standards OpenTelemetry (instrumentation, bonnes pratiques, analyse d incidents)Compétences clés : - Expertise OpenTelemetry (instrumentation, Collector, standardisation des données) - Maîtrise des logs, métriques et traces distribuées (collecte, corrélation, exploitation) - Expertise confirmée sur une plateforme d observabilité, en particulier Dynatrace et ELK - Expérience des environnements cloud hybrides et cloud native (Kubernetes, OpenShift, AWS/Azure) - Maîtrise des pratiques DevOps / SRE et des pipelines CI/CD - Compétences en Infrastructure as Code et Observability as Code (Ansible, Terraform, Monaco) - Compétences en développement et scripting (Python, Bash, Go) appliquées à l automatisation - Connaissance des environnements techniques et middleware (Linux, Windows, Apache, J2EE, Java)Softskills souhaitées pour évoluer dans un contexte agile, complexité forte du SI, Ansible,2-Expérimenté, DevOps Engineering,2-Expérimenté, Kubernetes,2-Expérimenté, Python,2-Expérimenté, Dynatrace,2-Expérimenté, Site Reliability Engineering (SRE),2-Expérimenté, Elasticsearch, Logstash, and Kibana (ELK),2-Expérimenté, Observability,2-Expérimenté

Freelance

CDI

Offre d'emploi
SRE - Domain Manager

CAT-AMANIA

Publiée le 29/05/2026

Site Reliability Engineering (SRE)

6 mois

40k-80k €

400-650 €

Paris, France

Responsable de Domaine (Domain Manager) Responsable de : Garantir la fiabilité des services, l’excellence opérationnelle et la conformité des performances sur l’ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) au sein de l’Agile Release Train et du cycle de livraison produit. Conditions de télétravail Aucun télétravail pendant les 3 premiers mois de la mission Présence sur site requise 3 jours par semaine par la suite Mission Garantir la stabilité, la performance et la disponibilité des services dans les environnements de production et hors production, tout en favorisant une culture orientée fiabilité au sein des équipes de delivery. Pour assurer cette mission, ce rôle agit comme garant des évolutions produit avant leur mise en production, en veillant à ce que la qualité soit toujours conforme aux attentes des clients. Collaborer avec les équipes Produit, Tech et Plateforme afin de maintenir le bon équilibre entre innovation, rapidité d’exécution et robustesse opérationnelle. Principales activités Définir, suivre et communiquer les objectifs de niveau de service (SLO), les indicateurs de niveau de service (SLI) et les budgets d’erreur sur les différents environnements afin d’assurer une fiabilité mesurable par domaine applicatif. Garantir la mise en place et l’amélioration continue des dispositifs d’observabilité, de supervision et d’alerting. Superviser la préparation opérationnelle de chaque release afin d’assurer la stabilité en production grâce à une coordination transverse avec les équipes Produit et Tech. Possibilité de bloquer une mise en production lorsque la qualité mesurée ne correspond pas aux attentes des clients. Gérer la réponse aux incidents, les analyses des causes racines et les revues post-mortem afin d’assurer la responsabilité et l’amélioration continue par domaine applicatif. Collaborer avec les équipes Core Platform et Observability & FinOps afin de renforcer la résilience des systèmes, optimiser les coûts et maintenir les performances de la plateforme. Communiquer l’état de la fiabilité, les risques et les actions d’amélioration aux Agile Release Managers et aux responsables de domaine afin d’assurer l’alignement entre les ARTs (Agile Release Trains). Participer activement à l’Agile Release Train en représentant la voix de la fiabilité et des opérations, afin de soutenir le rythme de livraison et la qualité. Compétences Techniques Solide expertise en Site Reliability Engineering (SRE) dans des environnements SaaS ou cloud-native. Excellente compréhension de l’observabilité des systèmes, de l’automatisation et des frameworks de monitoring. Expérience dans la définition et la gestion des SLO, SLI et budgets d’erreur en collaboration avec les équipes d’ingénierie. Maîtrise des pratiques DevSecOps, des pipelines CI/CD et du monitoring continu. Fonctionnelles Expérience significative en gestion des incidents, analyses post-mortem et préparation opérationnelle. Capacité démontrée à coordonner des initiatives de fiabilité entre les équipes Produit, Tech et Plateforme. Forte orientation sur les indicateurs de performance, la prévention des causes racines et la gouvernance opérationnelle. Soft Skills Esprit analytique et approche orientée données pour le suivi de la fiabilité.

Freelance

Mission freelance
Domain Manager Monétique

MEETSHAKE

Publiée le 10/06/2026

CI/CD

DevSecOps

Site Reliability Engineering (SRE)

12 mois

Paris, France

Responsable de garantir la fiabilité des services, l’excellence opérationnelle et le respect des performances sur l’ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) dans l’Agile Release Train et le cycle de livraison produit. Activités principales Définir, suivre et reporter les SLO (Service Level Objectives) , SLI (Service Level Indicators) et error budgets afin de garantir une fiabilité mesurable par domaine applicatif Mettre en place et améliorer en continu les systèmes de monitoring, observabilité et alerting Superviser la mise en production des releases, en s’assurant de la stabilité via une coordination transverse (Produit & Tech) Gérer les incidents , les analyses de causes racines (RCA) et les post-mortems pour améliorer en continu Travailler avec les équipes plateforme (Core Platform, Observability, FinOps) pour : Améliorer la résilience Optimiser les coûts Maintenir les performances Reporter l’état de la fiabilité, les risques et plans d’amélioration aux responsables (Agile Release Managers, leadership) Participer activement à l’Agile Release Train en représentant la voix de la production et de la fiabilité

Freelance

Mission freelance
Responsable de Production SysOps

TEOLIA CONSULTING

Publiée le 17/06/2026

AWS Cloud

Site Reliability Engineering (SRE)

36 mois

650-670 €

La Défense, Île-de-France

Je cherche pour l'un de nos clients un reponsable de Production SysopS pour l'un de mes clients basé à la Défense: Missions: Animer et accompagner l'équipe SysOps (daily, 1:1, montée en compétence) Prioriser et organiser les activités de RUN et de BUILD Recueillir les besoins techniques des équipes produit en matière d'infrastructure et d'exploitation et préparer les cycles trimestriels Garantir la disponibilité et la qualité des services fournis aux métiers (SLO/SLA) Superviser incidents, alertes, météo applicative et batchs Communiquer avec les parties prenantes en cas d'incident majeur Standardiser les pipelines CI/CD sous GitLab et assurer la MCO de l'ensemble des outils et composants de la plateforme Accompagner les évolutions majeures : migrations cloud AWS, Kubernetes Renforcer l'observabilité : logs (OpenSearch), métriques (Prometheus, CloudWatch), dashboards (Grafana) Définir et maintenir les bonnes pratiques de déploiement, de sécurité et de monitoring Environnement Technique: • Cloud & Infra : AWS, Kubernetes (EKS), Linux RHEL • Automatisation : GitLab CI, Docker, Terraform, Helm, Ansible • Monitoring & Logs : Prometheus, CloudWatch, Grafana, Checkly, OpenSearch • Applicatif : Java/JS/Springboot, Tomcat/NGINX, Dollar Universe, PostgreSQL, Oracle, SolR, Elasticsearch • Expertise confirmée en exploitation, SRE ou DevOps ; maîtrise des environnements cloud, CI/CD, conteneurisation et observabilité ; expérience en industrialisation, automatisation et gestion d'infrastructures complexes. • Leadership et sens des responsabilités ; • Excellente communication et capacité à prioriser ; • Proactivité, rigueur et goût pour l'amélioration continue ; • Le management d'équipe

Freelance

Mission freelance
Expert SI Cloud AWS (H/F)

Insitoo Freelances

Publiée le 25/06/2026

AWS Cloud

Conduite du changement

DevOps

2 ans

500-600 €

Bordeaux, Nouvelle-Aquitaine

Nous recherchons un Expert afin d’accompagner les équipes produits sur les enjeux de delivery, d’exploitation, de qualité logicielle et d’industrialisation des pratiques DevSecOps. La mission s’inscrit dans un environnement agile, cloud-native et fortement orienté excellence opérationnelle. Localisation Mérignac Démarrage estimé : septembre 2026 2 jours de présentiel par semaine Descriptif de la mission : Missions Vous interviendrez notamment sur : Accompagnement des équipes produits sur les pratiques de delivery Mise en place et amélioration des standards de développement Animation d’ateliers techniques et méthodologiques Suivi des métriques DORA et amélioration continue Industrialisation des pratiques CI/CD Contribution à la capitalisation des bonnes pratiques Run / Excellence opérationnelle Mise en place des bonnes pratiques d’exploitation Observabilité, monitoring et alerting Diagnostics et audits techniques Accompagnement SRE / DevSecOps Gestion de la qualité de service et amélioration du RUN Qualité logicielle Clean Code, DDD, TDD Stratégies de tests (JUnit, Cypress, Playwright) Réduction de la dette technique Revue de code et sécurisation des développements Environnement technique Cloud & DevOps AWS Terraform GitLab / GitLab CI Docker Jenkins CloudWatch Grafana Backend Java / Spring Boot NodeJS / TypeScript Python Frontend Angular TypeScript Outils Jira Confluence Sonar VS Code

1 / 2

Déposez votre CV

Fixez vos conditions

Rémunération, télétravail... Définissez tous les critères importants pour vous.
Faites-vous chasser

Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
100% gratuit

Aucune commission prélevée sur votre mission freelance.

Derniers posts sur le forum

Voir tous les derniers posts

Offres par ville

31 résultats

Contrats

Freelance

CDI

CDD

Alternance

Stage

Lieu

Télétravail

Télétravail partiel

Télétravail 100%

Présentiel

Taux Journalier Moyen min.

150 € 1300 € et +

Salaire brut annuel min.

20k € 250k €

Durée

0 mois 48 mois

Expérience

≤ 2 ans d’expérience

3 à 5 ans d’expérience

6 à 10 ans d’expérience

> 10 ans d’expérience

Publication

Moins de 24 heures

Moins de 7 jours

Moins de 14 jours

Moins de 30 jours

Trouvez votre prochaine offre d’emploi ou de mission freelance Site Reliability Engineering (SRE)

Déposez votre CV

Derniers posts sur le forum

Contrats

Lieu

Télétravail

Taux Journalier Moyen min.

Salaire brut annuel min.

Durée

Expérience

Publication