Jobs and contract opportunities Site Reliability Engineering (SRE) | Free-Work

Jobs

Forum

Forum index

Favourite topics

Topics I'm involved in

Contractor job
SRE / DevOps Engineer OpenShift (H/F) – Paris

Crafteam

Published on 27/05/2026

Argo CD

Cloud

Gitlab

1 year

600-650 €

Paris, France

Dans le cadre de notre développement, nous recrutons pour l’un de nos clients du secteur bancaire un(e) SRE / DevOps Engineer spécialisé(e) OpenShift . Vous interviendrez au sein d’une équipe Site Reliability Engineering (SRE) en charge de la fiabilité, de la performance et de la scalabilité des plateformes Cloud , avec un rôle clé dans la conception, l’automatisation et l’exploitation des environnements de production. Vos principales responsabilités : 🔧 Opérations & Fiabilité Garantir la stabilité, la résilience et la performance des environnements Cloud, notamment OpenShift Participer au déploiement, monitoring et troubleshooting des applications en production Définir et améliorer les indicateurs SRE : SLO, SLI, SLA Automatiser les opérations dans une logique Infrastructure as Code / GitOps ⚙️ Engineering & Automatisation Développer et maintenir des pipelines CI/CD (GitLab CI) Gérer les déploiements et l’infrastructure via Terraform, Helm Contribuer à l’évolution des architectures Cloud (Public, Private, Hybrid) ☁️ OpenShift & Kubernetes Administrer des clusters OpenShift en production (installation, upgrade, capacity planning, sécurité) Accompagner les équipes de développement dans l’utilisation des plateformes Gérer les problématiques liées à Kubernetes : réseau, stockage, logging, monitoring 🤝 Collaboration & Amélioration continue Travailler en interaction avec les équipes dev, sécurité, infra et produit Participer à la documentation et au partage des bonnes pratiques Contribuer à une culture SRE orientée automatisation et fiabilité

Fixed term

Permanent

Contractor

Job Vacancy
Engineer Azure / Ingénieur Fiabilité Cloud

R&S TELECOM

Published on 12/05/2026

Azure

Azure Kubernetes Service (AKS)

Cloud

6 months

Ile-de-France, France

Contexte de la mission Garantir la fiabilité, la performance, la sécurité et la maîtrise des coûts du socle Azure (AKS, Data Platform Databricks, ADF, App Services, VMs, réseau hybride). Définir et industrialiser les pratiques SRE (SLI/SLO/SLA, error budgets, observabilité, automatisation, post-mortems) et contribuer activement à la gouvernance FinOps et à la réduction des dérives de consommation. Objectifs et livrables Missions principales : Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation. Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting. FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation. Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC. Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives. Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute. Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil. Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA. Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture). Livrables attendus : Catalogue de SLI/SLO des services critiques et tableaux de bord associés. Modules Terraform documentés et pipelines CI/CD de déploiement. Runbooks d’exploitation et procédures d’incident. Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation). Post-mortems des incidents majeurs et suivi des actions correctives. Feuille de route d’amélioration continue de la plateforme Azure. Profil recherché : Bac +5 en informatique, systèmes, réseaux ou cloud computing. Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2 ans sur un rôle SRE / Platform / Cloud Ops. Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate. Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée. Anglais technique requis (échanges réguliers avec partenaires internationaux). Compétences demandéesCompétences Niveau de compétence Autonomie Expert Bon communiquant Expert Langues Niveau de langue Anglais Courant Catalogue de SLI/SLO des services critiques et tableaux de bord associés. Modules Terraform documentés et pipelines CI/CD de déploiement. Runbooks d’exploitation et procédures d’incident. Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation). Post-mortems des incidents majeurs et suivi des actions correctives. Feuille de route d’amélioration continue de la plateforme Azure.

Contractor

Contractor job
Responsable d'exploitation SysOps / Cloud AWS DevOps

INSYCO

Published on 22/06/2026

Agile Scrum

Ansible

AWS Cloudwatch

3 years

400-550 €

Paris, France

Bonjour, Nous recherchons pour notre client grand compte un Responsable d'exploitation SysOps / Cloud AWS DevOps Nous étudions - prioritairement - les candidatures qui nous sont adressées à freelance à insyco . fr avec les informations suivantes : Argumentaire écrit répondant de façon ciblée au besoin ci-dessous CV à jour en français Date de prochaine disponibilité Tarif journalier Merci d'indiquer la référence KTR/REX/5409 dans l'objet de votre message Notre client est un organisme de gestion collective. Au sein de sa direction des systèmes d'information, vous prenez la responsabilité de l'exploitation (production) d'une plateforme cloud et pilotez une équipe SysOps. Vous garantissez la disponibilité et la qualité de service des applications fournies aux métiers, organisez les activités de RUN et de BUILD, et accompagnez les évolutions majeures de l'infrastructure. Activités principales Animer et accompagner l'équipe SysOps (daily, 1:1, montée en compétence) Prioriser et organiser les activités de RUN et de BUILD Recueillir les besoins techniques des équipes produit en matière d'infrastructure et d'exploitation et préparer les cycles trimestriels Garantir la disponibilité et la qualité des services fournis aux métiers (SLO/SLA) Superviser incidents, alertes, météo applicative et batchs Communiquer avec les parties prenantes en cas d'incident majeur Standardiser les pipelines CI/CD sous GitLab et assurer la MCO de l'ensemble des outils et composants de la plateforme Accompagner les évolutions majeures : migrations cloud AWS, Kubernetes Renforcer l'observabilité : logs (OpenSearch), métriques (Prometheus, CloudWatch), dashboards (Grafana) Définir et maintenir les bonnes pratiques de déploiement, de sécurité et de monitoring

Contractor

Permanent

Job Vacancy
Technical Leader DevSecOps

Atlanse

Published on 13/05/2026

.NET

Ansible

Argo CD

3 years

55k-70k €

400-550 €

Ile-de-France, France

Vous accompagnez les équipes de développement dans le design et la mise en œuvre d'applications Cloud native, avec une forte dimension autour des pratiques DevSecOps, de l’automatisation et de l’industrialisation des environnements. Vous interviendrez à la fois sur la conception des solutions techniques, le développement des pipelines et outils internes, ainsi que sur l’accompagnement des équipes via le partage de bonnes pratiques et l’animation de la communauté DevSecOps / SRE. Votre rôle Accompagnement technique et architecture Cloud native · Accompagner les équipes de développement dans le design des solutions techniques (code, infrastructure, middleware, ...) · Promouvoir les bonnes pratiques de développement, d’industrialisation et de sécurité · Accompagner les équipes dans l’adoption des méthodologies agiles et des pratiques DevSecOps Industrialisation et automatisation DevSecOps · Développer et maintenir les pipelines DevSecOps · Industrialiser les processus de déploiement, d’intégration et d’automatisation · Concevoir et faire évoluer les outils internes liés à la production, au reporting et à l’automatisation Animation, documentation et partage de connaissances · Animer la communauté d'experts DevSecOps / SRE · Assurer la documentation des pratiques, outils et processus en place · Préparer et animer des formations techniques

Permanent

Job Vacancy
Site Reliability Engineer (DV Security Clearance)

CGI

Published on 21/06/2026

Manchester, England, United Kingdom

We are seeking an experienced and motivated Site Reliability Engineer (SRE) to join a high-performing team supporting multiple data product and platform groups. This role is focused on improving the reliability, scalability, observability, deployment, and operational support of critical data-driven platforms and services operating within complex production environments. The successful candidate will work closely with engineering, platform, and operational support teams to strengthen monitoring and alerting capabilities, improve logging and traceability, troubleshoot incidents, support deployments, and automate operational processes wherever possible. The environment includes Kubernetes, Helm, the ELK stack, and a broad range of modern Site Reliability Engineering and cloud platform practices. This is a hands-on technical role suited to someone who thrives in fast-paced operational environments, enjoys solving complex production issues, and is passionate about automation, platform reliability, and continuous improvement. The role requires strong collaboration with both client stakeholders and engineering teams to ensure operational excellence, platform resilience, and service availability across critical systems.

Permanent

Job Vacancy
Site Reliability Engineer

CGI

Published on 21/06/2026

London, England, United Kingdom

We are seeking an experienced and proactive Site Reliability Engineer (SRE) to join a team supporting multiple data product and platform groups. This role is focused on improving the reliability, scalability, observability, and operational performance of critical data-driven platforms and services across complex production environments. The successful candidate will work closely with engineering, platform, and support teams to strengthen monitoring and alerting capabilities, improve logging and traceability, troubleshoot production incidents, support deployments, and automate operational processes wherever possible. The environment includes Kubernetes, Helm, the ELK stack, and a strong focus on modern Site Reliability Engineering practices across cloud and platform services. This is a hands-on technical role suited to someone who thrives in fast-paced operational environments and is passionate about reliability engineering, automation, and continuous improvement. The role requires strong collaboration with both client stakeholders and engineering teams to ensure platform stability, operational excellence, and high service availability

Contractor

Permanent

Job Vacancy
Expert DevOps / SRE – Cloud & Kubernetes (H/F)

Lùkla

Published on 03/07/2026

Azure Kubernetes Service (AKS)

Terraform

2 years

Ile-de-France, France

Dans le cadre du renforcement de nos équipes Cloud & DevOps, nous recherchons un(e) Expert DevOps / SRE passionné(e) par l'automatisation, le Cloud et les architectures modernes. Vous interviendrez sur des environnements critiques au sein de grands comptes, avec pour mission d'accompagner la transformation DevOps, d'industrialiser les plateformes Cloud et de garantir la disponibilité, la performance et la sécurité des infrastructures. En tant que DevOps / SRE , vous jouerez un rôle clé dans la définition et la mise en œuvre de la stratégie DevOps. À ce titre, vous serez amené(e) à : Concevoir, déployer et faire évoluer les plateformes DevOps et Cloud. Définir les bonnes pratiques DevOps et accompagner leur adoption auprès des équipes de développement et d'exploitation. Concevoir des architectures Cloud sécurisées, résilientes et hautement disponibles. Industrialiser les déploiements grâce à l'Infrastructure as Code (IaC). Développer et maintenir des pipelines CI/CD robustes et automatisés. Automatiser les processus d'exploitation, de provisioning et de configuration. Garantir la fiabilité des plateformes en appliquant les principes Site Reliability Engineering (SRE). Définir et mettre en œuvre les indicateurs SLI, SLO et SLA. Participer à la gestion des incidents critiques, aux analyses post-mortem et à l'amélioration continue. Mettre en place les solutions de supervision, de monitoring et d'observabilité. Optimiser les performances, la sécurité et la scalabilité des infrastructures. Assurer une veille technologique permanente sur les solutions Cloud Native et DevOps. Encadrer et accompagner techniquement les équipes DevOps et les profils plus juniors.

Contractor

Permanent

Job Vacancy
Devops

CAT-AMANIA

Published on 28/05/2026

DevOps

6 months

40k-70k €

400-540 €

Paris, France

Contexte du poste Au sein de l’équipe Site Reliability Engineering (SRE) , vous serez responsable de la fiabilité, de la performance et de la scalabilité des plateformes Cloud de l’entreprise. Vous jouerez un rôle clé dans la conception, l’automatisation et l’exploitation des environnements de production, avec un focus particulier sur les plateformes OpenShift . Conditions de télétravail Pas de télétravail les 3 premiers mois de la mission 3 jours de présence sur site obligatoires ensuite Responsabilités principales Opérations & Fiabilité Assurer la stabilité , la résilience et la performance des environnements Cloud et notamment OpenShift. Participer au déploiement , au monitoring , au troubleshooting et à l’ optimisation des applications en production. Contribuer à la mise en place et à l’amélioration de SLOs, SLIs et SLAs . Automatiser les opérations de production dans une logique Infrastructure as Code et GitOps . Engineering & Automatisation Développer et maintenir les pipelines CI/CD utilisant GitLab CI . Gérer l’infrastructure via Terraform , Helm , et des pratiques modernes de déploiement. Participer au design et à l’évolution de l’architecture Cloud (Public, Private, Hybrid). OpenShift & Kubernetes Administrer et opérer des clusters OpenShift (installation, upgrades, capacity planning, gestion des opérateurs, sécurité). Améliorer la fiabilité de la plateforme et accompagner les équipes de développement dans la bonne utilisation d’OpenShift. Gérer les problématiques réseau, stockage, logging et monitoring dans un environnement Kubernetes/ OpenShift. Collaboration & Culture SRE Travailler étroitement avec les équipes de développement, sécurité, infrastructure et produit. Documenter et partager les bonnes pratiques, dans une démarche d’amélioration continue. Compétences requises Techniques (Must-Have) Maîtrise avancée de Red Hat OpenShift en environnement de production. Solide expérience avec Kubernetes . Excellente connaissance des pratiques DevOps et outils associés : GitLab CI/CD Terraform Helm Prometheus / Grafana Argo CD Expertise des environnements Cloud Bonne compréhension : des architectures microservices des API / REST des patterns de résilience (circuit breaker, autoscaling, etc.) Compétences additionnelles (Nice-to-Have) Expérience avec OpenShift en très forte production ou large échelle (HUGE plus). Connaissances en GitOps (ArgoCD, Flux). Expérience en sécurité Cloud (politiques RBAC, secrets management, network policies). Scripting : Python , Bash , Go (optionnel). Profil recherché 5+ ans d’expérience en DevOps / SRE. Expérience démontrée sur des environnements Cloud et Kubernetes. Solide expérience opérationnelle OpenShift (must-have).

3 / 3

Submit your CV

Manage your visibility

Salary, remote work... Define all the criteria that are important to you.
Get discovered

Recruiters come directly to look for their future hires in our CV library.
Join a community

Connect with like-minded tech and IT professionals on a daily basis through our forum.

Latest forum topics

See all latest posts

Jobs by country

England Scotland Wales Northern Ireland Ireland

40 results

Contracts

Contractor

Permanent

Location

Remote type

Hybrid

Remote

On-site

Rate minimum.

£150 £1300 and more

Salary minimum

£20k £250k

Experience

0-2 years experience

3 to 5 years experience

6 to 10 years experience

+10 years experience

Date posted

Less than 24 hours

Less than 7 days

Less than 14 days

Less than 30 days

Find your next tech and IT Job or contract Site Reliability Engineering (SRE)

Submit your CV

Latest forum topics

Contracts

Location

Remote type

Rate minimum.

Salary minimum

Experience

Date posted