Find your next tech and IT Job or contract Site Reliability Engineering (SRE)
Your search returns 40 results.
Job Vacancy
Expert Observabilité et Cloud sur le mans
EterniTech
Published on
Ansible
DevOps
Dynatrace
6 months
Le Mans, Pays de la Loire
Je cherche pour un de mes client un Expert Observabilité et Cloud sur le mans Mission sur site client au Mans Présentiel 3j/sem attendu Contexte de la mission Dans le cadre de la modernisation du SI, la mission vise à : - Apporter une expertise pour accompagner les équipes ITOM en charge de l observabilité dans l intégration du standard OpenTelemetry, afin d unifier la collecte des données d observabilité (logs, métriques, traces) et de couvrir les environnements hybrides - Réaliser une phase d analyse et d adaptation de l'existant - Mettre en uvre les OpenTelemetry Collectors et l instrumentation applicative avec des responsables - Assurer l interfaçage et la mise en conformité des backends d observabilité (Dynatrace, ELK) avec le standard OpenTelemetry Localisation : site du Mans uniquement Détails de la prestationLa société devra fournir les prestations suivantes : - Contribuer à la conception et au déploiement d une architecture d observabilité moderne basée sur OpenTelemetry, garantissant une collecte unifiée, fiable et scalable dans des environnements cloud hybrides et distribués (Kubernetes, cloud public, on premise) - Définir et industrialiser les pipelines de télémétrie OpenTelemetry (instrumentation, collectors, routing, enrichment), en assurant la qualité, la cohérence et la gouvernance des données à l échelle du SI - Intégrer de manière optimisée les flux de télémétrie avec les plateformes existantes (Dynatrace, ELK, etc.), en maximisant la corrélation inter signaux et la visibilité end to end - Mettre en oeuvre une approche Observability as Code (Monaco, Terraform, CI/CD), intégrant les SLO/SLI et les pratiques de fiabilité - Accompagner les équipes ITOM / DevSecOps dans l adoption des standards OpenTelemetry (instrumentation, bonnes pratiques, analyse d incidents)Compétences clés : - Expertise OpenTelemetry (instrumentation, Collector, standardisation des données) - Maîtrise des logs, métriques et traces distribuées (collecte, corrélation, exploitation) - Expertise confirmée sur une plateforme d observabilité, en particulier Dynatrace et ELK - Expérience des environnements cloud hybrides et cloud native (Kubernetes, OpenShift, AWS/Azure) - Maîtrise des pratiques DevOps / SRE et des pipelines CI/CD - Compétences en Infrastructure as Code et Observability as Code (Ansible, Terraform, Monaco) - Compétences en développement et scripting (Python, Bash, Go) appliquées à l automatisation - Connaissance des environnements techniques et middleware (Linux, Windows, Apache, J2EE, Java)Softskills souhaitées pour évoluer dans un contexte agile, complexité forte du SI, Ansible,2-Expérimenté, DevOps Engineering,2-Expérimenté, Kubernetes,2-Expérimenté, Python,2-Expérimenté, Dynatrace,2-Expérimenté, Site Reliability Engineering (SRE),2-Expérimenté, Elasticsearch, Logstash, and Kibana (ELK),2-Expérimenté, Observability,2-Expérimenté
Contractor job
Domain Manager Monétique
MEETSHAKE
Published on
CI/CD
DevSecOps
Site Reliability Engineering (SRE)
12 months
Paris, France
Responsable de garantir la fiabilité des services, l’excellence opérationnelle et le respect des performances sur l’ensemble des environnements, en intégrant les pratiques SRE (Site Reliability Engineering) dans l’Agile Release Train et le cycle de livraison produit. Activités principales Définir, suivre et reporter les SLO (Service Level Objectives) , SLI (Service Level Indicators) et error budgets afin de garantir une fiabilité mesurable par domaine applicatif Mettre en place et améliorer en continu les systèmes de monitoring, observabilité et alerting Superviser la mise en production des releases, en s’assurant de la stabilité via une coordination transverse (Produit & Tech) Gérer les incidents , les analyses de causes racines (RCA) et les post-mortems pour améliorer en continu Travailler avec les équipes plateforme (Core Platform, Observability, FinOps) pour : Améliorer la résilience Optimiser les coûts Maintenir les performances Reporter l’état de la fiabilité, les risques et plans d’amélioration aux responsables (Agile Release Managers, leadership) Participer activement à l’Agile Release Train en représentant la voix de la production et de la fiabilité
Job Vacancy
DevOps / SRE Expert Java – Systèmes Critiques (H/F)
OMICRONE
Published on
CI/CD
DevOps
Java
1 year
40k-45k €
400-450 €
Ile-de-France, France
DevOps / SRE Expert Java – Systèmes Critiques (H/F)Contexte de la mission Dans le cadre d’un programme stratégique autour des compteurs communicants, nous recherchons un profil DevOps / SRE Expert Java pour intervenir sur une plateforme critique gérant les échanges liés à plus de 35 millions de compteurs clients. La plateforme, pensée autour d’une architecture événementielle asynchrone, assure : l’exécution des demandes de services, la collecte des données de mesure, ainsi que le pilotage à distance des équipements de comptage. Les équipes sont organisées en mode produit et interviennent sur l’ensemble du cycle de vie des applications : architecture, conception, développement, déploiement, exploitation et support production. Missions Garantir l’exploitabilité, la résilience et la stabilité des applications critiques Participer aux choix d’architecture et à la conception des solutions Industrialiser les processus de déploiement et de gestion des incidents Assurer le suivi de production et le maintien en conditions opérationnelles Mettre en œuvre les bonnes pratiques d’observabilité, monitoring et sécurité Anticiper les risques de performance et améliorer la fiabilité des systèmes au runtime Collaborer étroitement avec les équipes de développement et d’exploitation Participer aux astreintes et interventions hors horaires normaux (HHN) Profil recherché Minimum 8 ans d’expérience en développement Java Minimum 5 ans d’expérience en suivi de production sur des systèmes critiques à forts enjeux Solide culture de l’exploitation et de la production applicative Expérience sur des architectures distribuées et événementielles Connaissance des systèmes de comptage intelligent / smart metering fortement appréciée Expertise en observabilité, monitoring, performance et résilience applicative Forte capacité d’analyse et de gestion des incidents complexes Autonomie, rigueur et excellent relationnel Environnement technique Java Architectures événementielles asynchrones Systèmes critiques haute disponibilité CI/CD Observabilité / Monitoring / Logging DevOps / SRE Production & exploitation
Contractor job
Domain Manager SRE
MEETSHAKE
Published on
CI/CD
Cloud
DevSecOps
1 year
Paris, France
Pour le compte d'un acteur majeur de l'écosystème tech, nous recherchons un(e) Domain Manager de haut niveau. Au croisement de la Delivery Agile et de l'Excellence Opérationnelle, votre rôle sera d'ancrer la culture de la fiabilité au cœur du cycle de vie des produits à forte échelle. Vous agirez comme le garant de la qualité et le partenaire clé de la transformation continue de la plateforme. En tant que garant(e) de la stabilité, de la performance et de la disponibilité des services sur l'ensemble des environnements (production et hors-production), vos responsabilités principales s'articulent autour des axes suivants : Pilotage de la fiabilité & SRE : Définir, suivre et piloter les indicateurs clés (SLI/SLO) ainsi que les budgets d'erreur ( error budgets ) par domaine applicatif. Assurer la pertinence et l'évolution continue des frameworks de monitoring, d'alerting et d'observabilité. Garde-fou des releases (Gatekeeping) : Évaluer et valider la préparation opérationnelle de chaque mise en production en étroite coordination avec les équipes Produit et Tech. Vous disposez d’un droit de veto légitime sur les livraisons si la qualité mesurée ne répond pas aux exigences du service. Gestion des incidents & Amélioration : Orchestrer la réponse aux incidents majeurs du domaine, animer les revues post-mortem et formaliser les analyses de causes racines (RCA) afin de pérenniser la résilience du système. Synergie Transverse : Collaborer activement avec les équipes Core Platform , Observability et FinOps pour optimiser à la fois l'efficience des coûts et la robustesse des infrastructures. Gouvernance Agile : Incarner la voix de la fiabilité au sein de l'Agile Release Train (ART). Reporter de manière transparente l'état de la fiabilité et les risques identifiés auprès des Agile Release Managers et du leadership de domaine.
Contractor job
Scrum Master Cloud / SRE (F/H)
CELAD
Published on
Agile Scrum
Cloud
Site Reliability Engineering (SRE)
12 months
Paris, France
Envie d’un nouveau challenge... CELAD vous attend ! 🚀 Nous poursuivons notre développement et recherchons actuellement un.e Scrum Master Cloud / SRE pour intervenir chez l’un de nos clients grands comptes. 💻💼 Vous intégrerez une équipe en charge du provisionnement et du maintien en condition opérationnelle des environnements hors-production et production, dans un contexte à forte dimension Cloud, SRE et automatisation. Voici un aperçu détaillé de vos missions 🎯 : Coordonner une organisation composée de 30 à 35 collaborateurs répartis en plusieurs squads Mettre en place et animer les cérémonies agiles (Scrum, Scrumban…) Faciliter le travail quotidien des équipes et identifier les points de blocage Accompagner les équipes dans l’amélioration continue des processus et méthodes de travail Mettre en place des outils de pilotage, indicateurs et dashboards de suivi Assurer une vision réaliste et anticipée des activités à horizon 2 à 3 mois Collaborer étroitement avec les équipes SRE, les développeurs et les parties prenantes Favoriser l’automatisation et contribuer à la réduction du “toil” dans les pratiques de production Accompagner les équipes dans la priorisation et le suivi des user stories
Job Vacancy
Site Reliability Engineer (SRE) - DevOps
Lùkla
Published on
DevOps
Docker
Dynatrace
2 years
Paris, France
Nous recherchons un Site Reliability Engineer (SRE) - (H/F) sur Paris afin de participer à la sécurisation des activités RUN sur le périmètre Paiement et du Cash Management d'une grande banque européenne. En tant que SRE, vous interviendrez sur l'ensemble du cycle de vie des plateformes et serez garant de leur fiabilité, disponibilité et performance. Vous assurerez la gestion et le bon fonctionnement d'une dizaine d'applications critiques dans un environnement DevOps. À ce titre, vous assurerez la gestion du quotidien de la production, des évolutions techniques et fonctionnelles, des incidents, et le reporting dans le respect des SLA. Les missions sont les suivantes : Garantir la haute disponibilité, la performance et la stabilité des applications critiques (SLA/SLO) Définir et suivre les indicateurs de performance (SLI) et disponibilité de la Production (via Dynatrace). Identifier les goulots d'étranglement et proposer des optimisations (latence, scalabilité, etc.) Optimiser les performances des systèmes et des middleware. Automatiser les tâches récurrentes d'exploitation (run) via scripting (Python, Bash) Maintenir des pipelines CI/CD robustes et sécurisés Déployer des infrastructures via Terraform (IaC) Participer à la standardisation des environnements (templates, modules réutilisables) Concevoir, déployer et maintenir des architectures sur Cloud Platform Participer à la maintenance et l'évolution des outils des plates-formes dans un contexte Kubernetes/Docker Mettre en place et piloter les outils de monitoring et d'alerting Exploiter des outils comme Cloud Monitoring, Prometheus, Grafana Mettre en place des dashboards orientés métier et technique Gérer les incidents de production et contribuer à leur résolution (post-mortem, RCA) Définir et améliorer les processus d'exploitation (playbooks, etc.) Intégrer les bonnes pratiques de sécurité cloud (IAM, gestion des accès, etc.) Participer aux audits et à la mise en conformité des environnements Collaborer avec les équipes Dev, Ops et Architectes Contribuer à l'adoption des pratiques SRE / DevOps Documenter les architectures Émettre des avis de production pour les comités d'architecture.
Contractor job
Architecte Cloud SRE (H/F)
Crafteam
Published on
Cloud
Kubernetes
Openshift
1 year
600-700 €
Paris, France
L’Architecte Cloud SRE a pour mission de concevoir, structurer et faire évoluer une plateforme Cloud considérée comme un produit ( Platform as a Product ), composée de building blocks réutilisables, robustes et sécurisés. Il agit comme un architecte de plateforme en définissant des fondations techniques standardisées, industrialisées et self-service, permettant aux équipes de développement d’accéder à des services fiables, scalables et observables. Le poste s’inscrit dans des environnements IBM Cloud et Red Hat OpenShift , avec une collaboration étroite avec les équipes SRE, les équipes de développement produit et de sécurité. Responsabilités principales Architecture plateforme & building blocks Concevoir une plateforme cloud modulaire basée sur des building blocks réutilisables (compute, networking, observabilité, sécurité, CI/CD, etc.) Définir des patterns d’architecture standardisés pour accélérer les usages et garantir la cohérence technique Concevoir des solutions scalables, résilientes, performantes et sécurisées, alignées avec les besoins métier Platform as a Product Porter une vision produit de la plateforme organisée en offres de services cohérentes et évolutives Structurer la plateforme en composants clairement définis, versionnés et gouvernés Piloter la roadmap en intégrant les enjeux d’obsolescence, d’industrialisation, d’amélioration continue et de dette technique Concevoir une expérience self-service pour les équipes de développement S’appuyer sur l’automatisation (Infrastructure as Code, pipelines, templates) pour assurer reproductibilité, fiabilité et rapidité de déploiement Garantir la cohérence globale de la plateforme et son alignement avec les standards d’architecture Exigences transverses Intégrer les problématiques de : Résilience (failure scenarios, DRP, multi-zone) Performance (latence, throughput, charge) Sécurité (Zero Trust, conformité, secrets management) Assurer l’intégration avec les solutions d’observabilité Implémentation & opérations Assurer une transition fluide entre design, build et run Contribuer à l’amélioration continue des processus d’exploitation Participer à la gestion des incidents majeurs et aux analyses post-mortem (blameless) Automatisation & orchestration Maîtriser les concepts d’Infrastructure as Code Être autonome sur Terraform, Helm, Ansible afin de proposer des solutions exploitables par les équipes SRE Collaboration & communication Travailler en collaboration étroite avec les équipes SRE, développement et métiers Vulgariser les concepts techniques Assumer un rôle de référent technique et de mentor Documentation (Docs as Code) Produire une documentation technique versionnée (Asciidoc ou Markdown) Documenter architectures, building blocks, patterns d’usage, runbooks et bonnes pratiques Intégrer la documentation dans les pipelines CI Promouvoir une culture Documentation as Code
Contractor job
Lead SRE Senior
SQLI
Published on
Site Reliability Engineering (SRE)
6 months
400-700 €
Paris, France
Bonjour, Pour le compte de l'un de mes clients dans le secteur du luxe, je suis à la recherche d'un Lead Senior SRE. CONTEXTE & ENJEUX : L’application de clienteling est utilisée en boutique pour accompagner les conseillers de vente dans une expérience client premium. Elle repose sur un écosystème complexe. Le rôle de SRE est clé pour garantir : - La disponibilité de l’application en boutique - La performance en conditions réelles - La résilience des parcours critiques - Une expérience fluide, sans interruption, même en cas d’incident. MISSIONS PRINCIPALES : Fiabilité & disponibilité des systèmes - Garantir un haut niveau de disponibilité (SLA/SLO) des services - Identifier les points de fragilité et mettre en place des mécanismes de résilience - Réduire les incidents et améliorer le MTTR. - Assurer la continuité de service en boutique (enjeu business critique) Observabilité & monitoring : - Mettre en place et maintenir une observabilité complète : Logs, métriques, traces distribuées - Définir des alertes pertinentes orientées impact business - Construire des dashboards exploitables par les équipes tech et produit - Identifier les signaux faibles avant qu’ils ne deviennent des incidents - Gérer le backlog des évolutions techniques SRE pour l’amélioration de l’App Performance & scalabilité : - Analyser et optimiser les performances applicatives (latence, temps de réponse…) - Anticiper les montées en charge (pics saisonniers, événements retail…) - Mettre en place des tests de charge et de stress - Garantir une expérience fluide même en conditions dégradées Gouvernance & Communication : - Mettre en place et documenter les procédures / base de connaissance de gestion des demandes et incidents - Définir et structurer les procédures de communication - Piloter la communication de crise (ponts, coordination, top management) - Structurer et améliorer les flash reports (contenu, destinataires) - Assurer le reporting régulier sur la santé des plateformes COMPETENCES TECHNIQUES CLES : - Expertise des environnements mobiles (iOS, Swift / SwiftUI, React Native, Flutter) & maîtrise du cycle de vie applicatif (release, distribution via App Store / TestFlight) - Expérience des environnements device & retail, incluant la gestion de flottes via Mobile Device Management (MDM) et les contraintes de connectivité terrain - Solide compréhension des architectures distribuées et des intégrations (APIs, systèmes backend), avec capacité à diagnostiquer des incidents end-to-end (mobile ↔ backend) - Maîtrise des patterns de résilience mobile (offline-first, synchronisation, gestion des modes dégradés) - Mise en place d’une observabilité orientée utilisateur (crash, performance, parcours critiques) et analyse des incidents multi-sources - Expérience en CI/CD mobile et automatisation des déploiements, avec une approche orientée fiabilité et amélioration continue - Notions de sécurité & fiabilité (failover, circuit breaker…). COMPETENCES FONCTIONNELLES : - Compréhension des enjeux Retail Luxe : > Exigence de disponibilité en boutique > Impact direct sur le chiffre d’affaires > Expérience client premium sans friction - Capacité à identifier les parcours critiques : > Consultation client > Création / suivi de vente > Interactions omnicanales - Sensibilité à la qualité perçue utilisateur - Capacité à traduire des métriques techniques en impact business QUALITÉS ATTENDUES : - Approche systémique & transverse - Forte capacité d’analyse et de résolution de problèmes complexes - Sang-froid en situation d’incident - Culture du “measure, improve, automate” - Esprit pragmatique orienté impact - Capacité à collaborer avec des profils variés (tech & métier) - Sens des responsabilités (enjeux business critiques) - Volonté d’amélioration continue
Job Vacancy
DevOps / SRE Expert Java – Systèmes Critiques (H/F)
OMICRONE
Published on
CI/CD
DevOps
Java
1 year
40k-45k €
400-500 €
Ile-de-France, France
DevOps / SRE Expert Java – Systèmes Critiques (H/F)Contexte de la mission Dans le cadre d’un programme stratégique autour des compteurs communicants, nous recherchons un profil DevOps / SRE Expert Java pour intervenir sur une plateforme critique gérant les échanges liés à plus de 35 millions de compteurs clients. La plateforme, pensée autour d’une architecture événementielle asynchrone, assure : l’exécution des demandes de services, la collecte des données de mesure, ainsi que le pilotage à distance des équipements de comptage. Les équipes sont organisées en mode produit et interviennent sur l’ensemble du cycle de vie des applications : architecture, conception, développement, déploiement, exploitation et support production. Missions Garantir l’exploitabilité, la résilience et la stabilité des applications critiques Participer aux choix d’architecture et à la conception des solutions Industrialiser les processus de déploiement et de gestion des incidents Assurer le suivi de production et le maintien en conditions opérationnelles Mettre en œuvre les bonnes pratiques d’observabilité, monitoring et sécurité Anticiper les risques de performance et améliorer la fiabilité des systèmes au runtime Collaborer étroitement avec les équipes de développement et d’exploitation Participer aux astreintes et interventions hors horaires normaux (HHN) Profil recherché Minimum 8 ans d’expérience en développement Java Minimum 5 ans d’expérience en suivi de production sur des systèmes critiques à forts enjeux Solide culture de l’exploitation et de la production applicative Expérience sur des architectures distribuées et événementielles Connaissance des systèmes de comptage intelligent / smart metering fortement appréciée Expertise en observabilité, monitoring, performance et résilience applicative Forte capacité d’analyse et de gestion des incidents complexes Autonomie, rigueur et excellent relationnel Environnement technique Java Architectures événementielles asynchrones Systèmes critiques haute disponibilité CI/CD Observabilité / Monitoring / Logging DevOps / SRE Production & exploitation Informations complémentaires Démarrage : Juillet 2026 Durée : 6 mois renouvelables Astreinte / HHN : environ 25% du temps Environnement challengeant à forte criticité métier
Contractor job
Architecte Plateforme Cloud & SRE (F/H)
CELAD
Published on
Architecture
Kubernetes
Openshift
12 months
700-750 €
Paris, France
Envie d’un nouveau challenge... CELAD vous attend ! 🚀 Nous poursuivons notre développement et recherchons actuellement un.e Architecte Cloud - SRE pour intervenir chez l’un de nos clients grands comptes. 💻💼 Vous rejoindrez une équipe en charge de la conception et de l’évolution d’une plateforme Cloud pensée comme un véritable produit (“Platform as a Product”), dans un environnement à forte dimension Cloud Native, SRE et automatisation. Voici un aperçu détaillé de vos missions 🎯 : Concevoir une plateforme cloud modulaire basée sur des building blocks réutilisables (compute, networking, observabilité, sécurité, CI/CD…) Définir des patterns d’architecture standardisés afin d’accélérer les usages et garantir la cohérence technique Concevoir des solutions scalables, résilientes, sécurisées et performantes Porter une vision “Platform as a Product” structurée autour de services self-service industrialisés Piloter la roadmap plateforme en intégrant les enjeux d’obsolescence, dette technique et amélioration continue Garantir l’automatisation des déploiements via l’Infrastructure as Code et les pipelines CI/CD Collaborer étroitement avec les équipes SRE, développement et sécurité Participer à la gestion des incidents majeurs et aux analyses post-mortem Promouvoir les pratiques DevOps, SRE et Docs-as-Code Concevoir et maintenir une documentation technique versionnée et intégrée aux pipelines CI
Job Vacancy
Expert Cloud AWS h/f
Ela Technology
Published on
Automation
AWS Cloud
CI/CD
6 months
Lyon, Auvergne-Rhône-Alpes
🚀 Contexte Dans un environnement technique structuré et en pleine évolution, une DSI renforce son centre d’excellence dédié à l’exploitation des applications. L’objectif : améliorer la fiabilité, la performance et l’efficacité des environnements Cloud AWS. Vous interviendrez au sein d’équipes mêlant RUN, projets et architecture, avec un rôle clé dans la montée en maturité des pratiques Cloud. 🎯 Vos missions principales🧠 Expertise & accompagnement Résoudre des incidents complexes (niveau expert) Accompagner et mentorer les équipes Ops Participer activement à la montée en compétences internes ⚙️ Automatisation & industrialisation Mettre en place des pipelines CI/CD Déployer des infrastructures via Terraform Fiabiliser et accélérer les déploiements 📊 Observabilité & exploitation Construire une chaîne complète de monitoring (logs, métriques, alertes) Définir des indicateurs de performance Optimiser les pratiques de supervision 🔄 Amélioration continue (SRE) Améliorer la disponibilité des applications Réduire la dette technique Analyser les risques techniques et de sécurité 💰 FinOps & optimisation Suivre et piloter les coûts AWS Mettre en place des dashboards Identifier des leviers d’optimisation 📚 Documentation & bonnes pratiques Formaliser les processus et solutions Structurer la documentation Favoriser l’autonomie des équipes
Contractor job
Expert SI Cloud AWS (H/F)
Insitoo Freelances
Published on
AI
AWS Cloud
DevOps
2 years
650-700 €
Lyon, Auvergne-Rhône-Alpes
Contexte : Nous recherchons un Expert afin d’accompagner les équipes produits sur les enjeux de delivery, d’exploitation, de qualité logicielle et d’industrialisation des pratiques DevSecOps. La mission s’inscrit dans un environnement agile, cloud-native et fortement orienté excellence opérationnelle. Localisation Lyon Démarrage estimé : septembre 2026 2 jours de présentiel par semaine Les missions attendues par le Expert SI Cloud AWS (H/F) : Missions Vous interviendrez notamment sur : Accompagnement des équipes produits sur les pratiques de delivery Mise en place et amélioration des standards de développement Animation d’ateliers techniques et méthodologiques Suivi des métriques DORA et amélioration continue Industrialisation des pratiques CI/CD Contribution à la capitalisation des bonnes pratiques Run / Excellence opérationnelle Mise en place des bonnes pratiques d’exploitation Observabilité, monitoring et alerting Diagnostics et audits techniques Accompagnement SRE / DevSecOps Gestion de la qualité de service et amélioration du RUN Qualité logicielle Clean Code, DDD, TDD Stratégies de tests (JUnit, Cypress, Playwright) Réduction de la dette technique Revue de code et sécurisation des développements Environnement technique Cloud & DevOps AWS Terraform GitLab / GitLab CI Docker Jenkins CloudWatch Grafana Backend Java / Spring Boot NodeJS / TypeScript Python Frontend Angular TypeScript Outils Jira Confluence Sonar VS Code
Job Vacancy
DevOps Expert / SRE
Espritek
Published on
Ansible
Bash
Kubernetes
3 years
Montreuil, Ile-de-France
Contexte & périmètre Équipe production : nous assurons l’accompagnement des équipes de développement , ainsi que de support, de plus de 150 applications couvrant l’ensemble du cycle de vie (développement, tests, pré‑production, production). Environnement technique très diversifié : Kubernetes multi‑clusters (on‑premise et multi‑cloud) Infrastructure as Code : Terraform, Ansible, Helm, Pulumi Pipelines CI/CD intégrant les exigences DevSecOps (GitLab CI, Jenkins, GitHub, outils Nexus IQ, Fortify, Trivy, OWASP ZAP…) Observabilité à grande échelle : Prometheus, Grafana, ELK, Donatrice, OpenTelemetry Contraintes de conformité (PCI‑DSS, GDPR)
Contractor job
Devops Engineer - SRE (spécialité OpenShift & Cloud)
MEETSHAKE
Published on
CI/CD
Cloud
Gitlab
1 year
Paris, France
Au sein de l’équipe Site Reliability Engineering (SRE) , vous serez responsable de la fiabilité, de la performance et de la scalabilité des plateformes Cloud de l’entreprise. Vous jouerez un rôle clé dans la conception, l’automatisation et l’exploitation au quotidien des environnements de production, avec un focus majeur sur les plateformes Red Hat OpenShift . Responsabilités principales : Opérations & Fiabilité (RUN) : Assurer la stabilité, la résilience et la performance des environnements Cloud et notamment OpenShift. Participer au déploiement, au monitoring, au troubleshooting complexe et à l’optimisation des applications en production. Contribuer à la mise en place et au suivi des SLOs, SLIs et SLAs. Engineering & Automatisation (BUILD) : Développer et maintenir les pipelines CI/CD utilisant GitLab CI. Gérer et industrialiser l’infrastructure via Terraform, Helm et des pratiques modernes de déploiement. Participer au design et à l’évolution de l’architecture Cloud (Public, Privé, Hybride). OpenShift & Kubernetes : Administrer et opérer des clusters OpenShift (installation, upgrades, capacity planning, gestion des opérateurs, sécurité). Améliorer la fiabilité de la plateforme et accompagner les équipes de développement dans la bonne utilisation et l'adoption d'OpenShift. Gérer les problématiques réseau, stockage, logging et monitoring dans un environnement Kubernetes/OpenShift.
Contractor job
Architecte Solution - Bordeaux
Signe +
Published on
Angular
AWS Cloud
Business continuity plan (BCP)
6 months
450-500 €
Bordeaux, Nouvelle-Aquitaine
Définir un cadre d’accompagnement, en assurer le suivi et procéder aux ajustements nécessaires • Élaborer et animer des ateliers à caractère méthodologique et d’acculturation • Fournir l’expertise méthodologique et technologique attendue (Performance de développements, Excellence opérationnelle, Lean …) afin de contribuer à l’amélioration de la performance opérationnelle • Favoriser un environnement collaboratif propice à l’innovation et à la performance collective au sein de l’UPN • Contribuer à la capitalisation des savoir-faire d’accompagnement au sein de la Discipline Build & Run, des différents forums (Lead Développement, Pilotage de delivery, Ingénierie DevSecOps, Référent Expertise Front) et de la communauté du RUN Si de la DIVNUM • Concevoir un système de capitalisation des standards de travail issus des équipes produits accompagnées afin de faciliter le partage transverse des connaissances • Participer aux évolutions et initiatives visant à renforcer l’efficacité globale de l’UPN et du Programme Vision 2035 Permettre une intégration efficace de notre cellule d’expertise Build & Run dans les équipes de la fabrique et soutenir un mode de collaboration cohérent avec celles‑ci. Description des activités attendues : • Assurer l’accompagnement des périmètres attribués, incluant l’équipe de pilotage en tant que commanditaire ainsi que les équipes concernées et leurs parties prenantes en tant que bénéficiaires • Concevoir et animer des ateliers destinés à soutenir les équipes sur les enjeux de développements et d’exploitation (Coding Dojo / Kata, GameDay Run) • Co-construire et déployer des métriques alignées sur les objectifs stratégiques (métriques DORA) • Réaliser des audits sur les thématiques pilotées par la Discipline • Accompagner des diagnostics sur les problématiques rencontrées par les périmètres accompagnés Expertise Run et Observabilité Monitoring CloudWatch, Création de Synthetics, Grafana SRE Plan de production PCA/ PRA Stratégie de backup Expertise Build et qualité logicielle Pratiques de qualité logicielle : DDD, TDD, Clean Code, patterns, test pyramid - Qualité du code et dette technique Stratégies de test : JUnit, tests d’intégration, Cypress, Playwright, E2E - Industrialisation du delivery Amélioration continue (Accelerate, DevEx) Expertise CI/CD et Architecture Chaînes CI/CD, pratiques DevOps et DevSecOps (pipelines, IaC, déploiements automatisés, GitOps ...) - Industrialisation du delivery DORA Metrics - Architecture Cloud Cloud AWS : Lambda, SNS, SQS, CloudWatch, services managés Expertise technologique Backend : Java / Spring, NodeJS, Python Frontend : Angular, JS/TS Sécurité / Suivi des vulnérabilités Checkmarx SAST, Checkmarx SCA, Checkmarx KICS, AWS Inspector, AWS Security Hub IA / connaissance pratique Utilisation de l’intelligence artificielle pour accélérer la production de livrables et impulser une utilisation de l’IA au sein des équipes produits
Contractor job
Site Reliability Engineer Azure -Ingénieur Fiabilité Cloud
AVALIANCE
Published on
Azure Kubernetes Service (AKS)
FinOps
IAC
1 year
400-600 €
Ile-de-France, France
- Rattachement hiérarchique : Responsable Cloud & Datacenter – Équipe Cloud & Datacenter Missions principales : • Fiabilité & SRE : définition des SLI/SLO/error budgets, revues de fiabilité, gestion des incidents majeurs, post-mortems blameless, plans de remédiation. • Observabilité : contribution à la plateforme monitoring (Prometheus, Grafana, Loki, Mimir, Alloy), intégration de nouveaux périmètres Azure, dashboards et alerting. • FinOps & gouvernance Cloud : suivi de la consommation MACC, analyses Azure Resource Graph (KQL), right-sizing, chasse aux ressources orphelines, recommandations d’optimisation. • Infrastructure as Code : industrialisation via Terraform, modules réutilisables, pipelines GitOPS CI/CD, revues de code et bonnes pratiques IaC. • Plateforme Kubernetes (AKS) : exploitation, patching, scaling, sécurité (RBAC, Network Policies, Azure AD integration), support aux équipes applicatives. • Data Platform : accompagnement de la migration ADF v2 vers Databricks, fiabilisation des pipelines et suivi des coûts de compute. • Automatisation & tooling : scripts Python / PowerShell / Bash, runbooks, self-healing, réduction du toil. • Sécurité & conformité : application des standards groupe, gestion des secrets (Key Vault), RBAC, Defender for Cloud, PRA/PCA. • Documentation & partage : runbooks, architecture decision records (ADR), transfert de compétences vers l’équipe et les partenaires (Accenture).
Submit your CV
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Latest forum topics
Jobs by city
Jobs by country
40 results
Contracts
Location
Remote type
Rate minimum.
£150
£1300 and more
Salary minimum
£20k
£250k