Find your next tech and IT Job or contract Site Reliability Engineering (SRE)

Your search returns 40 results.
Contractor

Contractor job
SRE / DevOps Engineer OpenShift (H/F) – Paris

Crafteam
Published on
Argo CD
Cloud
Gitlab

1 year
600-650 €
Paris, France
Dans le cadre de notre développement, nous recrutons pour l’un de nos clients du secteur bancaire un(e) SRE / DevOps Engineer spécialisé(e) OpenShift . Vous interviendrez au sein d’une équipe Site Reliability Engineering (SRE) en charge de la fiabilité, de la performance et de la scalabilité des plateformes Cloud , avec un rôle clé dans la conception, l’automatisation et l’exploitation des environnements de production. Vos principales responsabilités : 🔧 Opérations & Fiabilité Garantir la stabilité, la résilience et la performance des environnements Cloud, notamment OpenShift Participer au déploiement, monitoring et troubleshooting des applications en production Définir et améliorer les indicateurs SRE : SLO, SLI, SLA Automatiser les opérations dans une logique Infrastructure as Code / GitOps ⚙️ Engineering & Automatisation Développer et maintenir des pipelines CI/CD (GitLab CI) Gérer les déploiements et l’infrastructure via Terraform, Helm Contribuer à l’évolution des architectures Cloud (Public, Private, Hybrid) ☁️ OpenShift & Kubernetes Administrer des clusters OpenShift en production (installation, upgrade, capacity planning, sécurité) Accompagner les équipes de développement dans l’utilisation des plateformes Gérer les problématiques liées à Kubernetes : réseau, stockage, logging, monitoring 🤝 Collaboration & Amélioration continue Travailler en interaction avec les équipes dev, sécurité, infra et produit Participer à la documentation et au partage des bonnes pratiques Contribuer à une culture SRE orientée automatisation et fiabilité
Fixed term
Permanent
Contractor

Job Vacancy
Engineer Azure / Ingénieur Fiabilité Cloud

R&S TELECOM
Published on
Azure
Azure Kubernetes Service (AKS)
Cloud

6 months
Ile-de-France, France
Contexte de la mission Garantir la fiabilité, la performance, la sécurité et la maîtrise des coûts du socle Azure (AKS, Data Platform Databricks, ADF, App Services, VMs, réseau hybride). Définir et industrialiser les pratiques SRE (SLI/SLO/SLA, error budgets, observabilité, automatisation, post-mortems) et contribuer activement à la gouvernance FinOps et à la réduction des dérives de consommation. Objectifs et livrables Missions principales : Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation. Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting. FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation. Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC. Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives. Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute. Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil. Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA. Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture). Livrables attendus : Catalogue de SLI/SLO des services critiques et tableaux de bord associés. Modules Terraform documentés et pipelines CI/CD de déploiement. Runbooks d’exploitation et procédures d’incident. Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation). Post-mortems des incidents majeurs et suivi des actions correctives. Feuille de route d’amélioration continue de la plateforme Azure. Profil recherché : Bac +5 en informatique, systèmes, réseaux ou cloud computing. Expérience > 4 ans en environnement Cloud Azure à l’échelle entreprise, dont au moins 2 ans sur un rôle SRE / Platform / Cloud Ops. Certifications appréciées : AZ-104, AZ-305, AZ-400, CKA, HashiCorp Terraform Associate. Expérience dans un contexte multi-partenaires (intégrateurs, éditeurs, infogérant) appréciée. Anglais technique requis (échanges réguliers avec partenaires internationaux). Compétences demandéesCompétences Niveau de compétence Autonomie Expert Bon communiquant Expert Langues Niveau de langue Anglais Courant Catalogue de SLI/SLO des services critiques et tableaux de bord associés. Modules Terraform documentés et pipelines CI/CD de déploiement. Runbooks d’exploitation et procédures d’incident. Rapports FinOps mensuels (suivi MACC, top dérives, plan d’optimisation). Post-mortems des incidents majeurs et suivi des actions correctives. Feuille de route d’amélioration continue de la plateforme Azure.
Contractor

Contractor job
Responsable d'exploitation SysOps / Cloud AWS DevOps

INSYCO
Published on
Agile Scrum
Ansible
AWS Cloudwatch

3 years
400-550 €
Paris, France
Bonjour, Nous recherchons pour notre client grand compte un Responsable d'exploitation SysOps / Cloud AWS DevOps Nous étudions - prioritairement - les candidatures qui nous sont adressées à freelance à insyco . fr avec les informations suivantes : Argumentaire écrit répondant de façon ciblée au besoin ci-dessous CV à jour en français Date de prochaine disponibilité Tarif journalier Merci d'indiquer la référence KTR/REX/5409 dans l'objet de votre message Notre client est un organisme de gestion collective. Au sein de sa direction des systèmes d'information, vous prenez la responsabilité de l'exploitation (production) d'une plateforme cloud et pilotez une équipe SysOps. Vous garantissez la disponibilité et la qualité de service des applications fournies aux métiers, organisez les activités de RUN et de BUILD, et accompagnez les évolutions majeures de l'infrastructure. Activités principales Animer et accompagner l'équipe SysOps (daily, 1:1, montée en compétence) Prioriser et organiser les activités de RUN et de BUILD Recueillir les besoins techniques des équipes produit en matière d'infrastructure et d'exploitation et préparer les cycles trimestriels Garantir la disponibilité et la qualité des services fournis aux métiers (SLO/SLA) Superviser incidents, alertes, météo applicative et batchs Communiquer avec les parties prenantes en cas d'incident majeur Standardiser les pipelines CI/CD sous GitLab et assurer la MCO de l'ensemble des outils et composants de la plateforme Accompagner les évolutions majeures : migrations cloud AWS, Kubernetes Renforcer l'observabilité : logs (OpenSearch), métriques (Prometheus, CloudWatch), dashboards (Grafana) Définir et maintenir les bonnes pratiques de déploiement, de sécurité et de monitoring
Contractor
Permanent

Job Vacancy
Technical Leader DevSecOps

Atlanse
Published on
.NET
Ansible
Argo CD

3 years
55k-70k €
400-550 €
Ile-de-France, France
Vous accompagnez les équipes de développement dans le design et la mise en œuvre d'applications Cloud native, avec une forte dimension autour des pratiques DevSecOps, de l’automatisation et de l’industrialisation des environnements. Vous interviendrez à la fois sur la conception des solutions techniques, le développement des pipelines et outils internes, ainsi que sur l’accompagnement des équipes via le partage de bonnes pratiques et l’animation de la communauté DevSecOps / SRE. Votre rôle Accompagnement technique et architecture Cloud native · Accompagner les équipes de développement dans le design des solutions techniques (code, infrastructure, middleware, ...) · Promouvoir les bonnes pratiques de développement, d’industrialisation et de sécurité · Accompagner les équipes dans l’adoption des méthodologies agiles et des pratiques DevSecOps Industrialisation et automatisation DevSecOps · Développer et maintenir les pipelines DevSecOps · Industrialiser les processus de déploiement, d’intégration et d’automatisation · Concevoir et faire évoluer les outils internes liés à la production, au reporting et à l’automatisation Animation, documentation et partage de connaissances · Animer la communauté d'experts DevSecOps / SRE · Assurer la documentation des pratiques, outils et processus en place · Préparer et animer des formations techniques
Permanent

Job Vacancy
Site Reliability Engineer (DV Security Clearance)

CGI
Published on

Manchester, England, United Kingdom
We are seeking an experienced and motivated Site Reliability Engineer (SRE) to join a high-performing team supporting multiple data product and platform groups. This role is focused on improving the reliability, scalability, observability, deployment, and operational support of critical data-driven platforms and services operating within complex production environments. The successful candidate will work closely with engineering, platform, and operational support teams to strengthen monitoring and alerting capabilities, improve logging and traceability, troubleshoot incidents, support deployments, and automate operational processes wherever possible. The environment includes Kubernetes, Helm, the ELK stack, and a broad range of modern Site Reliability Engineering and cloud platform practices. This is a hands-on technical role suited to someone who thrives in fast-paced operational environments, enjoys solving complex production issues, and is passionate about automation, platform reliability, and continuous improvement. The role requires strong collaboration with both client stakeholders and engineering teams to ensure operational excellence, platform resilience, and service availability across critical systems.
Permanent

Job Vacancy
Site Reliability Engineer

CGI
Published on

London, England, United Kingdom
We are seeking an experienced and proactive Site Reliability Engineer (SRE) to join a team supporting multiple data product and platform groups. This role is focused on improving the reliability, scalability, observability, and operational performance of critical data-driven platforms and services across complex production environments. The successful candidate will work closely with engineering, platform, and support teams to strengthen monitoring and alerting capabilities, improve logging and traceability, troubleshoot production incidents, support deployments, and automate operational processes wherever possible. The environment includes Kubernetes, Helm, the ELK stack, and a strong focus on modern Site Reliability Engineering practices across cloud and platform services. This is a hands-on technical role suited to someone who thrives in fast-paced operational environments and is passionate about reliability engineering, automation, and continuous improvement. The role requires strong collaboration with both client stakeholders and engineering teams to ensure platform stability, operational excellence, and high service availability
Contractor
Permanent

Job Vacancy
Expert DevOps / SRE – Cloud & Kubernetes (H/F)

Lùkla
Published on
Azure Kubernetes Service (AKS)
Terraform

2 years
Ile-de-France, France
Dans le cadre du renforcement de nos équipes Cloud & DevOps, nous recherchons un(e) Expert DevOps / SRE passionné(e) par l'automatisation, le Cloud et les architectures modernes. Vous interviendrez sur des environnements critiques au sein de grands comptes, avec pour mission d'accompagner la transformation DevOps, d'industrialiser les plateformes Cloud et de garantir la disponibilité, la performance et la sécurité des infrastructures. En tant que DevOps / SRE , vous jouerez un rôle clé dans la définition et la mise en œuvre de la stratégie DevOps. À ce titre, vous serez amené(e) à : Concevoir, déployer et faire évoluer les plateformes DevOps et Cloud. Définir les bonnes pratiques DevOps et accompagner leur adoption auprès des équipes de développement et d'exploitation. Concevoir des architectures Cloud sécurisées, résilientes et hautement disponibles. Industrialiser les déploiements grâce à l'Infrastructure as Code (IaC). Développer et maintenir des pipelines CI/CD robustes et automatisés. Automatiser les processus d'exploitation, de provisioning et de configuration. Garantir la fiabilité des plateformes en appliquant les principes Site Reliability Engineering (SRE). Définir et mettre en œuvre les indicateurs SLI, SLO et SLA. Participer à la gestion des incidents critiques, aux analyses post-mortem et à l'amélioration continue. Mettre en place les solutions de supervision, de monitoring et d'observabilité. Optimiser les performances, la sécurité et la scalabilité des infrastructures. Assurer une veille technologique permanente sur les solutions Cloud Native et DevOps. Encadrer et accompagner techniquement les équipes DevOps et les profils plus juniors.
Contractor
Permanent

Job Vacancy
Devops

CAT-AMANIA
Published on
DevOps

6 months
40k-70k €
400-540 €
Paris, France
Contexte du poste Au sein de l’équipe Site Reliability Engineering (SRE) , vous serez responsable de la fiabilité, de la performance et de la scalabilité des plateformes Cloud de l’entreprise. Vous jouerez un rôle clé dans la conception, l’automatisation et l’exploitation des environnements de production, avec un focus particulier sur les plateformes OpenShift . Conditions de télétravail Pas de télétravail les 3 premiers mois de la mission 3 jours de présence sur site obligatoires ensuite Responsabilités principales Opérations & Fiabilité Assurer la stabilité , la résilience et la performance des environnements Cloud et notamment OpenShift. Participer au déploiement , au monitoring , au troubleshooting et à l’ optimisation des applications en production. Contribuer à la mise en place et à l’amélioration de SLOs, SLIs et SLAs . Automatiser les opérations de production dans une logique Infrastructure as Code et GitOps . Engineering & Automatisation Développer et maintenir les pipelines CI/CD utilisant GitLab CI . Gérer l’infrastructure via Terraform , Helm , et des pratiques modernes de déploiement. Participer au design et à l’évolution de l’architecture Cloud (Public, Private, Hybrid). OpenShift & Kubernetes Administrer et opérer des clusters OpenShift (installation, upgrades, capacity planning, gestion des opérateurs, sécurité). Améliorer la fiabilité de la plateforme et accompagner les équipes de développement dans la bonne utilisation d’OpenShift. Gérer les problématiques réseau, stockage, logging et monitoring dans un environnement Kubernetes/ OpenShift. Collaboration & Culture SRE Travailler étroitement avec les équipes de développement, sécurité, infrastructure et produit. Documenter et partager les bonnes pratiques, dans une démarche d’amélioration continue. Compétences requises Techniques (Must-Have) Maîtrise avancée de Red Hat OpenShift en environnement de production. Solide expérience avec Kubernetes . Excellente connaissance des pratiques DevOps et outils associés : GitLab CI/CD Terraform Helm Prometheus / Grafana Argo CD Expertise des environnements Cloud Bonne compréhension : des architectures microservices des API / REST des patterns de résilience (circuit breaker, autoscaling, etc.) Compétences additionnelles (Nice-to-Have) Expérience avec OpenShift en très forte production ou large échelle (HUGE plus). Connaissances en GitOps (ArgoCD, Flux). Expérience en sécurité Cloud (politiques RBAC, secrets management, network policies). Scripting : Python , Bash , Go (optionnel). Profil recherché 5+ ans d’expérience en DevOps / SRE. Expérience démontrée sur des environnements Cloud et Kubernetes. Solide expérience opérationnelle OpenShift (must-have).
40 results

Contracts

Contractor Permanent

Location

Remote type

Hybrid Remote On-site

Rate minimum.

£150 £1300 and more

Salary minimum

£20k £250k

Experience

0-2 years experience 3 to 5 years experience 6 to 10 years experience +10 years experience

Date posted

Connecting Tech-Talent

Free-Work, THE platform for all IT professionals.

Free-workers
Resources
About
Recruiters area
2026 © Free-Work / AGSI SAS
Follow us