Find your next tech and IT Job or contract Site Reliability Engineering (SRE)

Your search returns 9 results.
Contractor

Contractor job
DevOps / Site Reliability Engineer (SRE)

Atlas Connect
Published on
Ansible
AWS Cloud
CI/CD

12 months
Ile-de-France, France

Dans le cadre de la modernisation et de l’industrialisation des environnements IT, nous recherchons un Ingénieur DevOps / SRE pour renforcer une équipe en charge de l’automatisation, de la fiabilité et de la performance des systèmes et applications. Le consultant interviendra sur la mise en place de pipelines CI/CD, l’automatisation des infrastructures, le monitoring et l’optimisation de la production , en collaboration avec les équipes de développement et d’exploitation. Missions Concevoir, maintenir et améliorer des pipelines CI/CD (Jenkins, GitLab CI, GitHub Actions). Automatiser le déploiement et la gestion des environnements via l’ Infrastructure as Code (Terraform, Ansible, Helm). Gérer et optimiser les environnements conteneurs et orchestration (Docker, Kubernetes, OpenShift). Mettre en place et superviser des solutions de monitoring et observabilité (Prometheus, Grafana, ELK, Datadog). Assurer la sécurité et la résilience des plateformes (gestion des secrets, durcissement des environnements, haute disponibilité). Collaborer avec les équipes de développement pour fiabiliser et automatiser les déploiements applicatifs. Optimiser les coûts, la performance et la scalabilité des environnements. Contribuer à une culture SRE (fiabilité, automatisation, gestion des incidents et post-mortem).

Permanent

Job Vacancy
Site Reliability Engineer (SRE) Azure (CDI)

Codezys
Published on
Bash
DevOps
Github

Paris, France

Lieu : Paris Type de contrat : CDI Démarrage : Dès que possible À propos du poste Nous recherchons un Site Reliability Engineer (SRE) spécialisé Azure pour renforcer notre équipe technique. Vous serez au cœur de la fiabilité, de la performance et de l’automatisation de nos plateformes cloud. Votre mission sera de garantir la disponibilité et la résilience des services tout en apportant une expertise DevOps et une culture forte de l’observabilité. Responsabilités principales Assurer la fiabilité, la performance et la sécurité de nos environnements Azure. Mettre en œuvre et maintenir des infrastructures as code avec Terraform. Définir, suivre et améliorer les SLA, SLO et SLI pour garantir la qualité de service. Déployer et optimiser des pipelines CI/CD avec GitHub Actions. Mettre en place et maintenir des solutions d’observabilité et monitoring (Grafana, Prometheus, alerting). Collaborer avec les équipes de développement pour améliorer la résilience et l’efficacité des applications. Participer à la gestion des incidents et à l’amélioration continue des processus d’exploitation.

Contractor

Contractor job
Ingénieur SRE (F/H)

Quick Source
Published on
Azure
CI/CD
Grafana

1 year
500-550 €
Vélizy-Villacoublay, Ile-de-France

Missions : Définir et implémenter des mécanismes d’ observabilité (Azure Monitor, KQL, Application Insights, Log Analytics, Container Insights) et d’alerting multi‑niveaux. Mettre en place des dashboards et SLI/SLO/SLA pour la supervision proactive. Contribuer à la résilience : sauvegardes/restaurations natives Azure/AWS, DRP , tests réguliers. Concevoir et exécuter des scénarios de Chaos Engineering (Azure/AWS). Optimiser la gestion des incidents : runbooks, Status Page, webhooks Teams/Jira, post‑mortem. Automatiser via Terraform (modules AzureRM), Ansible et pipelines CI/CD (Azure DevOps/GitHub). Être force de proposition pour intégrer des solutions AIOps/GenAI (observabilité, remédiation).

Contractor
Permanent

Job Vacancy
Site Reliability Engineer SRE Golang Rust Linux

Digistrat consulting
Published on
Go (language)
Linux
Rust

3 years
40k-60k €
400-600 €
Paris, France

🏭 Secteurs stratégiques : Banque d’investissement 🗓 Démarrage : ASAP PAS DE FULL REMOTE NI SOUS TRAITANCE MERCI 💡 Contexte /Objectifs : Mise en place des métriques pour assurer la fiabilité de l'écosystème Lire le code, le comprendre Suggérer les patchs pour les développeurs, pas d'un point de vue fonctionnel mais stabilité Suggérer des améliorations et les mettre en œuvre La personne déchargera entre autre les tâches d'administration et de production que le manager assume aujourd'hui Pas de connaissance obligée en finance (souhaitable qu'il n'en ait pas) Pas d'exigence sur l'environnement de départ

Contractor

Contractor job
Devops

ESENCA
Published on
Datadog
Go (language)
Google Cloud Platform (GCP)

1 year
400-450 €
Lille, Hauts-de-France

Vous venez renforcer l’équipe Observabilité en charge des outils de Log Management, monitoring, alerting, tracing pour le groupe. En pleine refonte de sa stratégie, l’équipe Observabilité met à disposition des Feature Teams les outils nécessaires à la supervision de l’état de santé et la compréhension du comportement de leurs applications, hébergées on-premise ou dans le cloud, ou consommées en SaaS. L’équipe offre aux Dev et Ops du groupe une plateforme d’observabilité intégrée qui s’appuie sur les solutions leaders du marché. Elle leur fournit également son support au quotidien dans l'utilisation des outils et le respect des bonnes pratiques de l'observabilité. Votre mission : Vous participez de manière active à la construction et l'évolution de la plateforme d'observabilité, de la collecte (logs, métriques, traces) à l'exploitation dans les backends: - Design, intégration, templatisation, déploiement, paramétrage, supervision des composants de la plateforme (déployés sur k8s ou consommés en SaaS). - Développement en Go et Python de composants custom - Administration, gestion des incidents/problèmes, industrialisation, et amélioration continue des outils qui composent la plateforme. - Accompagnement, conseils, support aux utilisateurs dans l'utilisation de la plateforme d'observabilité et sur l'amélioration de la performance des applications/projets métiers (à l'international) - Rédaction de la documentation et les dossiers d’exploitation afin de former et de transférer les compétences aux équipes techniques internes. Environnement technique : Vous avez une bonne connaissance de la sécurité et des architectures orientées cloud et on premise. Vous disposez des compétences techniques suivantes : - Maîtrise de Kubernetes - Maîtrise de GCP, connaissances Azure - Maîtrise de Terraform/AWX/ArgoCD - Connaissances en développement GO et Python - Culture SRE et SLO - Connaissances en instrumentation d’applications et observabilité via Opentelemetry, Datadog, Grafana Loki/Mimir, Centreon

Permanent

Job Vacancy
Site Reliability Engineer (SRE) - Nantes (44)

AUBAY
Published on
Ansible
Dynatrace

40k-50k €
Nantes, Pays de la Loire

Tu es passionné(e) par la fiabilité des systèmes, l’automatisation et les environnements de production complexes ? Rejoins-nous et prends part à des projets stratégiques au cœur du secteur bancaire, en contribuant à la performance et à l’exploitabilité des solutions. 🧬 Notre ADN : 🔹 Expertise 🔹 Innovation 🔹 Collaboration 🔹 Excellence opérationnelle 🔹 Engagement Intégré(e) à une équipe projet en mode Agile/DevOps, tu accompagneras la mise en production de solutions critiques et leur maintien en conditions opérationnelles, tout en apportant ton expertise sur les bonnes pratiques de delivery et de supervision. 🎯 Tes responsabilités principales Piloter un projet de production de bout en bout : étude, mise en production, suivi et bilan. Mettre en place et industrialiser les chaînes CI/CD (Jenkins, GitLab). Déployer et fiabiliser les mécanismes de supervision et d’alerting (Dynatrace). Garantir l’exploitabilité des solutions en participant aux phases d’instruction et aux comités d’architecture. Veiller au respect des standards et bonnes pratiques de déploiement/livraison. Mettre en place et maintenir les processus d’exploitation (sauvegardes, surveillance, purges). Contribuer à des chantiers transverses (automatisation avec Ansible, modèles DevOps, industrialisation). Participer activement aux rituels d’équipe et accompagner le client dans leurs cérémonies. Être force de proposition dans la résolution d’incidents/problèmes et garantir le maintien en conditions opérationnelles du produit. Intervenir sur le traitement des incidents en mode « produit ». 🧰 Ton environnement technique CI/CD : Jenkins, GitLab Supervision & Monitoring : Dynatrace Automatisation : Ansible Méthodologie : Agile / DevOps Bonnes pratiques : Exploitabilité, résilience, qualité de service, amélioration continue

Contractor

Contractor job
Site Reliability Engineer (SRE) cloud GCP – Full remote (H/F)

EASY PARTNER
Published on
CI/CD
Docker
Google Cloud Platform (GCP)

3 months
530-630 €
Toulouse, Occitania

Contexte du poste Nous sommes un grand groupe dans le secteur Génie Civil. Nous recherchons un SRE spécialisé sur le cloud GCP pour renforcer nos équipes et nous aider à améliorer nos infrastructures ainsi que la stabilité de nos produits. Venez apporter votre pierre à l’édifice et partagez vos expériences au sein de l’équipe SRE mais aussi avec les équipes de développement. Rejoignez un environnement international, collaboratif et stimulant. Missions Concevoir et mettre en œuvre l’infrastructure automatisée des plates-formes sur Google Cloud Platform (GCP). Développer, actualiser et optimiser les pipelines CI/CD. Automatiser la gestion et le déploiement cloud. Diagnostiquer les problèmes de performance et de stabilité. Assurer la résolution des incidents en production. Contribuer à la construction d’une base de connaissances sur les incidents récurrents. Fournir un support aux équipes de développement. Stack technique : Conteneurisation : Google Kubernetes Engine (GKE), Docker Automatisation : Ansible, Puppet, Chef, Saltstack GCP, Terraform, libcloud, Spinnake Jenkin, Artifactory, Pipelines CI/CD / GitLab Elasticsearch Linux Python,PowerShell, bash ou JavaScript.

Permanent

Job Vacancy
Deputy Director Enterprise Live Service - HMRC - SCS1

Government Digital & Data
Published on
microsoft

£95k
United Kingdom

Develop & Manage Live Service Strategy: Accountable for defining, communicating, and managing the strategic vision for HMRC's entire live IT service estate. This includes setting the direction for operational processes, governance, and controls to ensure the availability and performance of critical digital infrastructure. Drive Operational Excellence: Lead the Enterprise Live Service (ELS) function, a team of ~200 FTE, to ensure high standards of live service. You will use and create metrics to hold directors, service, and platform owners accountable for operational performance, balancing traditional approaches for legacy systems with modern practices like Site Reliability Engineering (SRE) for digital platforms. Champion Modern Practices: Drive agile principles and an outcome-driven culture within ELS. The role requires an understanding of modern change practices (e.g., canary deploys, feature flagging) to increase speed while managing risk. You will also own and direct the ServiceNow platform roadmap, promoting 'citizen development' and effective IT Asset Management (ITAM). Influence and Advise Senior Leadership: Advise the CDIO Senior Leadership Team (SLT) and the CIO Director General on investment decisions to balance project delivery with the need for a stable and effective live service. You will engage with senior stakeholders across HMRC and the Cabinet Office to manage enterprise-level risk and secure funding for improvements.

Permanent

Job Vacancy
Site Reliability Engineer - Cloud & Orchestration

METALINE SERVICES
Published on
Docker
Gitlab
Kubernetes

Seine-Saint-Denis, France

Dans le cadre d'une mission pour l'un de nos clients, nous recherchons un(e) Site Reliability Engineer (SRE) pour assurer le maintien en condition opérationnelle de différentes plateformes et orchestrateurs, aussi bien onPremises que dans le Cloud. Ces orchestrateurs reposent sur les outils HashiCorp Terraform et Apache Airflow, avec des développements complémentaires en Java ou Python. Vous interviendrez dans un environnement basé sur Linux et Kubernetes, dans le respect des bonnes pratiques SRE. Vos missions principales Assurer le RUN : monitoring, alerting, inventaire, patching. Maintenir en condition opérationnelle les plateformes (Cloud et onPremises). Participer à la production et garantir la disponibilité des services. Revoir, améliorer et maintenir la documentation technique. Environnement technique Indispensable : GitLab CI/CD, RHEL, Windows, Terraform, Virtualisation VMware, SQL, Kubernetes, Python, Golang, Docker, Orchestration, LOKI, GRAFANA. Connaissances pratiques appréciées : Développement sur Kubernetes, Design fonctionnel, Cloud providers (IBM Cloud apprécié), méthodologie Agile, Java Spring. Optionnel : Java Spring. Langue : Anglais professionnel.

9 results

Contracts

Contractor Permanent

Location

Remote type

Hybrid Remote On-site

Rate minimum.

£150 £1300 and more

Salary minimum

£20k £250k

Experience

0-2 years experience 3 to 5 years experience 6 to 10 years experience +10 years experience

Date posted

Connecting Tech-Talent

Free-Work, THE platform for all IT professionals.

Free-workers
Resources
About
Recruiters area
2025 © Free-Work / AGSI SAS
Follow us