Trouvez votre prochaine offre d’emploi ou de mission freelance Site Reliability Engineering (SRE)
Votre recherche renvoie 21 résultats.
Mission freelance
Ingénieur SRE DevOps orienté RUN,
BEEZEN
Publiée le
DevOps
Site Reliability Engineering (SRE)
12 mois
500-550 €
Montreuil, Île-de-France
Je recherche un Ingénieur SRE / DevOps orienté RUN , expert en observabilité (Dynatrace) et en automatisation (Ansible) , capable de garantir la stabilité de la production , d’améliorer les SLO , et d’être un référent technique au sein d’un équipage agile . (Site Reliability Engineering) afin de participer à la sécurisation des activités RUN sur le périmètre Finance et Actuariat de la DSI de mon client Bancaire Les missions sont : Au sein d'un équipage applicatif en charge des domaines Finance et Actuariat, le SRE est un acteur clef dans le maintient en condition opérationnelle et la stabilité des environnements techniques (Production/ hors Production). Les principales missions seront les suivantes : - Maintien du coverage avec la DSI sur un périmètre applicatif RUN. - Mise en place des indicateurs / SLA, SLO avec la DSI. - Mise en place, suivi et analyse des métriques de performance et disponibilité de la Production (via Dynatrace). - Etre le référent Dynatrace pour l'équipage APS. - Définition et mise en place via Ansible et scripting les actions d'automatisation sur le périmètre (arrêts relances, déploiement automatisé, sanity check,...) - Participation aux rituels de l’équipe. - Consultation lors de l’instruction des projets sur l'exploitabilité des solutions. - Émission des avis de production pour les comités d’architecture. - Veille pour le respect des bonnes pratiques Groupes dans le cadre des déploiements et livraisons. - Contribution au maintien en conditions opérationnelles des applications. - Déplacements occasionnels à Nanterre. - Accompagnement et conseil auprès de la DSI, participation à leurs cérémonies. - Participation à la vie de l'application en étant force de proposition dans la résolution d'incidents ou de problèmes. Language - PYTHON
Offre d'emploi
Site Reliability Engineer
VISIAN
Publiée le
Dynatrace
Site Reliability Engineering (SRE)
1 an
Île-de-France, France
Contexte Le bénéficiaire souhaite une prestation de Site Reliability Engineering (SRE) afin de participer à la sécurisation des activités RUN sur le périmètre Finance et Actuariat de la DSI d’un grand groupe d’assurance. Missions Au sein d'un équipage applicatif en charge des domaines Finance et Actuariat, le SRE est un acteur clé dans le maintien en condition opérationnelle et la stabilité des environnements techniques (Production / hors Production). Les principales missions seront les suivantes : Maintien du coverage avec la DSI sur un périmètre applicatif RUN. Mise en place des indicateurs / SLA, SLO avec la DSI. Mise en place, suivi et analyse des métriques de performance et disponibilité de la Production (via Dynatrace). Être le référent Dynatrace pour l'équipage APS. Définition et mise en place via Ansible et scripting des actions d'automatisation sur le périmètre (arrêts relances, déploiement automatisé, sanity check, ...).
Offre d'emploi
Engineering Manager Reliability & Operations – Plateforme Paiement (H/F)
CITECH
Publiée le
Site Reliability Engineering (SRE)
12 mois
60k-75k €
500-600 €
Évry, Île-de-France
CITECH recrute ! 👌 Dans le cadre de la transformation et de l’optimisation de sa plateforme de paiement globale , un acteur majeur du secteur hospitality / e-commerce renforce son organisation engineering. La tribe Payment , composée d’environ 30 collaborateurs , conçoit, fait évoluer et opère l’ensemble de la plateforme de paiement du groupe. Afin de soutenir une réorganisation stratégique visant à centraliser les activités de fiabilité, performance et support , nous recherchons un Engineering Manager Reliability & Operations pour piloter deux équipes clés : Platform Team (SRE) : fiabilité, performance et automatisation de la plateforme Excellence Team : performance business, administration et support L3 L’objectif : garantir l’excellence technique et business de la plateforme de paiement . Description du poste En tant qu’ Engineering Manager Reliability & Operations , vous interviendrez sur trois axes majeurs : Pilotage des équipes Platform & Excellence Manager et structurer les équipes SRE et Excellence Mettre en place les rituels engineering (health checks, synchronisation équipes, amélioration continue) Appliquer les principes Team Topologies (platform / stream aligned teams) Excellence opérationnelle & fiabilité de la plateforme Définir et piloter les SLO / SLA Déployer les pratiques SRE et DevOps Améliorer la résilience et l’observabilité Industrialiser les processus d’exploitation et de delivery Pilotage business et opérationnel Superviser le support L3 et la gestion des incidents Piloter les activités d’administration (onboarding partenaires, configuration des moyens de paiement) Suivre et améliorer les KPIs business et techniques : taux de conversion success rate MTTR disponibilité SLA contractuels Environnement technique Infrastructure On-premise : Linux RedHat, Tomcat, F5, Sybase Cloud : AWS Serverless Stack technique Java / Spring / Spring Boot VueJS Node / Maven DevOps & CI/CD GitLab Terraform Ansible Cloud & services AWS ECS Fargate Lambda SQS / SNS / EventBridge Aurora / DynamoDB S3 / CloudFront ALB / WAF Observabilité & outils Splunk (Logs & Observability) ServiceNow Jira Tableau (KPIs business) Apigee (API Gateway)
Mission freelance
Ingénieur DevOps SRE
BEEZEN
Publiée le
DevOps
Site Reliability Engineering (SRE)
12 mois
400-540 €
Montreuil, Île-de-France
Je recherhce un Ingénieur DevOps SRE Windows ayant plus de 6ans d' experience pour une prestation d’accompagnement ayant pour objectif d’automatiser, déployer, monitorer et maintenir les tâches d’exploitation Windows au sein d'une division de mon client bancaire Les missions sont : · Automatisation via scripts · Suivi de la fiabilité des infrastructures de production · Mise en place du déploiement automatisé (CI/CD) · Mise en place de tests d'intégration et de charge · Gestion des incidents Il est possible qu'une astreinte soit mise en œuvre dans le contexte de la mission Expert Production tools - MICROSOFT WINDOWS POWERSHELL Expert Système d'exploitation - IIS Expert Workstations - WINDOWS SERVER Maîtrise Web - MS .NET Maîtrise Web – API REST
Mission freelance
BDA postgreSQL H/F
Grafton
Publiée le
PostgreSQL
Site Reliability Engineering (SRE)
6 mois
400-600 €
Paris, France
Position ID : 11062569 Lieu : Paris 11 Démarrage : ASAP Durée : 6 mois Contexte du poste Dans le cadre du renforcement d’une équipe SRE, nous recherchons un Ingénieur SRE spécialisé PostgreSQL . Vous interviendrez sur l’automatisation, l’industrialisation et l’exploitation d’une plateforme PostgreSQL au sein d’un environnement cloud interne. Vous rejoindrez une équipe à taille humaine en charge d’un service PostgreSQL-as-a-Service, avec un périmètre technique étendu : bases de données, stockage, systèmes, réseau et infrastructures multi-datacenters. Missions principales Maintenir les conditions opérationnelles de la plateforme Assurer le run quotidien Garantir la possibilité de PITR à tout moment sur l’ensemble des bases dans les périodes de rétention définies Assurer la qualité de service : performance, disponibilité, accès, haute disponibilité, SLA Développer correctifs et nouvelles fonctionnalités sur les modules Puppet et Ansible Exécuter les changements en production Garantir la conformité aux exigences PCI-DSS Rédiger la documentation liée aux outils et processus Participer aux astreintes 24/7 (1 semaine par mois minimum) Réaliser des opérations hors horaires ouvrés (au moins une fois par semaine) Compétences obligatoires Anglais courant (écrit et oral) Bac+3/5 en informatique ou expérience équivalente Minimum 3 ans d’expérience en production sur PostgreSQL 13+ : clustering, tuning, streaming replication, backups/PITR Maîtrise du scripting (Bash ou Python) Conception d’indicateurs de service (SLI) pour une gestion proactive SRE Excellente capacité de debug, optimisation et automatisation Expérience en provisioning cloud via IaC (Terraform) Connaissance des pratiques DevOps et CI/CD Aisance en environnement Linux et infrastructures multi-DC Maîtrise des environnements CLI, Git, Puppet Rigueur, sens analytique, capacité à résoudre des problèmes complexes Orientation service et capacité à travailler sous pression Autonomie, transparence, esprit d’équipe Veille active sur les évolutions du domaine DBA
Mission freelance
Lead SRE / Coach SRE – Transformation IT Production - Paris
Net technologie
Publiée le
DevOps
Docker
Kubernetes
1 an
Paris, France
Dans le cadre d’un programme de transformation IT (qualité, efficacité, stabilité), nous recherchons un(e) Lead SRE / Coach SRE pour accompagner la modernisation des pratiques de Production IT à l’échelle internationale. Missions Coaching & montée en compétence des équipes SRE (workshops, formations, mentoring) Déploiement du modèle SRE et construction de la roadmap (KPI, livrables) Contribution au recrutement et structuration des équipes SRE Promotion des pratiques SRE, DevOps, Agile Production Création de référentiels et diffusion des bonnes pratiques Accompagnement du changement et transformation des équipes
Mission freelance
Administrateur Systèmes Windows (H/F) 59
Mindquest
Publiée le
microsoft
Site Reliability Engineering (SRE)
6 mois
350-410 €
Roubaix, Hauts-de-France
Dans le cadre de l'exploitation de nos infrastructures , nous recherchons un SRE Microsoft ayant les connaissances suivantes : MCO d'un ecosystème Microsoft dans un environnement type grand compte Au moins l’un des outils suivant : Terraform, Puppet, Ansible, Chef Etre fortement sensibilisé à ITIL (une certification serait un plus) Avoir des notions et savoir appliquer la méthodologie AGILE (Sprint, Kanban, Scum, Itération…) Objectifs et livrables Compétences techniques : Connaitre Active Directory, ses principes et savoir l'exploiter au quotidien Connaitre ADFS, ses principes et savoir l'exploiter au quotidien Connaitre RDS, ses principes et savoir l'exploiter au quotidien Expert en Administration de serveurs Windows et/ou Windows Core Gestion des Mises à jour (WSUS) Gestion de la sécurité des systèmes (Hardening serait un plus) Supervision/Monitoring de type Nagios De bonnes connaissances en Powershell sont nécessaires Savoir utiliser VMWare Avoir des connaissances sur l’utilisation d’un VDI (Horizon ou Citrix) Infrastructure fiable et scalable Au moins l’un des outils suivant : Terraform, Puppet, Ansible, Chef Connaissance dun outil de ticketing (ServiceNow serait un plus) Compétences autres : Investiguer sur les incidents complexes et assurer la coordination avec les autres équipes de support Etre fortement sensibilisé à ITIL (une certification serait un plus) Avoir des notions et savoir appliquer la méthodologie AGILE (Sprint, Kanban, Scum, Itération…) Proposer et implémenter les bonnes pratiques Rédaction de documentation technique en Anglais Avoir un excellent sens du service Savoir travailler en équipe et à distance Ouverture d'esprit Autonome et rigoureux
Mission freelance
SRE Linux / Automation (H/F) 59
Mindquest
Publiée le
Linux
Site Reliability Engineering (SRE)
6 mois
350-390 €
Roubaix, Hauts-de-France
Contexte de la mission La unit Corp Business Applications est en charge de développer et intégrer les outils IT internes (Finance, RH, manufacturing, collaborative tools…). Vous rejoignez l'équipe Industrie, en charge du système d’information de ce périmètre. Le titulaire du poste est garant de la robustesse, de l’évolution et de la cohérence des environnements Linux. Sa mission est de prendre en main des infrastructures existantes, d'en assurer la maintenance en condition opérationnelle (MCO) et de rationaliser leur gestion via une automatisation de pointe. Il agit comme le référent technique capable de décortiquer des architectures complexes pour les rendre intelligibles et administrables par l'ensemble de l'équipe. Objectifs et livrables : Audit technique approfondi : Analyse critique des configurations actuelles et identification des points de défaillance ou d'optimisation. Industrialisation des déploiements : Développement et mise à jour de manifestes Puppet et de playbooks Ansible/AWX pour supprimer les actions manuelles. Standardisation de l'existant : Alignement des serveurs "legacy" sur les standards de sécurité et de performance de l'entreprise. Transfert de connaissances : Animation de sessions techniques pour transmettre la logique de fonctionnement des projets aux autres collaborateurs. Maintien en Condition Opérationnelle (MCO) : Résolution d'incidents de niveau 2 et 3 sur les environnements de production.
Offre d'emploi
Expert OpenTelemetry
KLETA
Publiée le
ELK
Grafana
Kubernetes
3 ans
Paris, France
Dans le cadre d’un programme de transformation technologique, nous recherchons un Expert OpenTelemetry pour concevoir, structurer et industrialiser l’instrumentation des systèmes distribués et cloud native. Vous analyserez les dispositifs existants, identifierez les zones d’angle mort et proposerez une trajectoire cible basée sur une collecte unifiée de traces, métriques et logs. Vous guiderez la mise en place d’OpenTelemetry sur des environnements Kubernetes, microservices et plateformes cloud, en définissant des standards d’instrumentation, des conventions de nommage et des bonnes pratiques de corrélation des signaux. Vous serez responsable de l’intégration d’OpenTelemetry avec des backends d’observabilité (Prometheus, Grafana, Elastic, Dynatrace ou équivalents) et de l’optimisation des pipelines de télémétrie. Vous travaillerez main dans la main avec les équipes DevOps, SRE et applicatives pour intégrer l’observabilité dès la conception et dans les pipelines CI/CD. Vous aurez également un rôle clé dans l’animation d’ateliers techniques, la formalisation de patterns d’instrumentation et l’accompagnement des équipes dans l’adoption d’OpenTelemetry comme standard transverse.
Mission freelance
Engineering Manager Reliability & Operations – Tribe Payment
ODHCOM - FREELANCEREPUBLIK
Publiée le
DevOps
KPI
Management
12 mois
Évry-Courcouronnes, Île-de-France
Contexte : La tribe « Payment », composée d’environ 30 collaborateurs, a pour mission de mettre en œuvre, faire évoluer et maintenir l’ensemble de la plateforme de paiement du groupe. Pour opérer le BUILD et le RUN de ces assets technologiques la tribe Paiement s’appuie sur le Framework Team Topologies avec 5 teams. Toutes sont pilotées par un TL (Tech Lead) ou LA (Lead Analyst). Cette tribe est décomposé en 5 équipes : - Equipe Customer : il s’agit d’une stream aligned team axée sur la product value pour nos Customer / Clients. - Equipe Hotel: il s’agit d’une stream aligned team axée sur la product value pour nos hôteliers. - Equipe Vault & Tokenization: il s’agit d’une feature team technique, axée sur les solutions de tokenization. Elle est au service des feature teams Customer & Hotels. - Equipe Platform: il s’agit d’une team SRE, axée sur la surveillance, la performance technique et l’optimisation/automatisation des process de la plateforme de paiement. Elle est au service des équipes Customer, Hotels, Vault & Tokenization. Cette équipe a aussi vocation à intervenir sur le process de delivery en lui-même afin d’accélérer les rythmes de développement, augmenter la qualité et faire profiter à tous des évolutions technologiques présentent sur le marché (#veilleTechno, #cicd) - Equipe Excellence: il s’agit d’une team responsable de la surveillance/performance business, des taches d’administration et du support L3 (tickets incidents) de la plateforme de paiement. Elle est en lien direct avec l’équipe platform afin de mener les investigations techniques nécessaires. Notre besoin : Auparavant, les investigations techniques et fonctionnelles (incidents) étaient prises en charge de manière décentralisée au sein des équipes produit. Dans le cadre d’une réorganisation stratégique, nous recentrons désormais ces équipes sur leur cœur de métier et leurs objectifs fonctionnels, tout en consolidant l’expertise transverse et la gestion de la plateforme au sein d’une structure dédiée. Nos enjeux sont donc multiples : - Structurer et renforcer le pilotage des équipes Platform et Excellence autour d’un objectif : “Excellence technique & business de la plateforme de paiement” - Mettre en place une vision engineering (projet, pratiques, investissement) Nous sommes à la recherche d’une prestation d’Engineering Manager Reliability & Operations pour piloter les équipes « Platform » et “Excellence”. Vos missions et responsabilités : • Définir et piloter la stratégie technique, en garantissant le respect des normes de qualité, de sécurité et de performance. • Collaborer avec les autres managers, les membres de la tribe et les partenaires, en assurant une communication fluide et efficace. • Veiller à l'innovation et à la veille technologique, en proposant des solutions adaptées aux besoins et aux enjeux du marché. • Organiser et animer les instances de suivi avec les équipes • Identifier les chantiers techniques à mener et en communiquer l'état d’avancement, les risques et les KPI • S'assurer que les normes de qualité projet soient respectées et de la complétude de la documentation technique. • Encadrer de manière étroite les Tech Leads (travailler sur des postures, mise en place des meilleures pratiques pour fluidifier le delivery (développement, test et déploiement). • Mettre en place les métriques (en partenariat avec les scrum masters et coach agile) de suivi de performance des équipes et de la qualité
Offre d'emploi
Platform Engineer – Observabilité
Ela Technology
Publiée le
Git
Kubernetes
Python
1 an
50k-57k €
520-550 €
Montpellier, Occitanie
Rejoignez l’équipe Observabilité et contribuez à la construction, l’évolution et la fiabilité des plateformes du Groupe. En tant que Platform Engineer , vous jouerez un rôle clé dans l’automatisation, la standardisation et la sécurisation de l’environnement technique, dans une logique Platform-as-a-Product au service des équipes internes (dev, ops, data…). Missions principales 1. Automatisation & Industrialisation Maintenir et faire évoluer les infrastructures virtualisées et conteneurisées (VMs, Kubernetes). Mettre en place des workflows GitOps robustes (ArgoCD, GitLab CI, Ansible). Gérer tout le cycle de vie des environnements (dev → prod). 2. Support & Accompagnement des équipes Onboarding des équipes techniques et accompagnement à l’usage des outils. Support plateforme : diagnostic, amélioration continue, documentation. Contribution aux golden paths (déploiement, logs, monitoring). 3. Conception de modules réutilisables Création de blueprints, templates et modules. Gestion du portail interne de la plateforme. 4. Sécurité & Conformité Intégration des exigences sécurité (CyberAct, politiques internes). Automatisation des contrôles (images, secrets, règles Kubernetes, audits). Contribution au contrôle d’accès. 5. Fiabilité de la plateforme Travaux sur la résilience, HA, automatisation des redémarrages, rollback. Intervention sur incidents, post-mortems, réduction du MTTR. Suivi des SLOs et indicateurs de performance. 6. Collaboration transverse Travail conjoint avec le Product Owner sur les évolutions. Participation aux choix d’architecture et d’outillage. Documentation claire et structurée. Activités clés Pilotage de la livraison des plateformes d’observabilité. Conception, développement et intégration de solutions d’observabilité. PoC et démonstrations. Optimisation des requêtes, tuning de clusters, modélisation de données. Résolution de problématiques data complexes. Travail étroit avec les équipes d’exploitation. Mentorat / coaching interne.
Offre d'emploi
Ingénieur SRE / DevOps PostgreSQL (H/F)
AVA2I
Publiée le
Ansible
Bash
DevOps
3 ans
Île-de-France, France
Dans le cadre du développement de ses plateformes de paiement, notre client recherche un Ingénieur SRE / DevOps spécialisé PostgreSQL pour renforcer une équipe en charge de la fiabilité, de la performance et de l’automatisation des bases de données sur un cloud interne. Vous interviendrez sur des environnements critiques à forte volumétrie, avec des enjeux élevés de disponibilité et de sécurité. 🚀 Vos missions 🔧 RUN / Production Assurer le maintien en conditions opérationnelles des bases PostgreSQL Gérer les incidents en production (analyse, diagnostic, résolution) Garantir la disponibilité, la performance et la stabilité des systèmes Participer à l’amélioration continue de la fiabilité 💾 Administration PostgreSQL Administrer des bases PostgreSQL en production (version 13+) Mettre en place et maintenir : réplication clustering sauvegardes et restauration (PITR) Optimiser les performances (requêtes, tuning moteur) ⚙️ Automatisation & DevOps Développer et maintenir des scripts (Python / Bash) Contribuer aux outils d’automatisation (Ansible, Puppet) Participer à l’industrialisation de la plateforme Utiliser des outils d’Infrastructure as Code (Terraform) 🖥️ Infrastructure & Systèmes Intervenir sur les couches système (Linux), stockage et réseau Travailler sur des environnements distribués (multi-datacenters) 📊 Qualité de service & monitoring Définir et suivre les indicateurs de performance (SLA, SLI) Mettre en place des outils de supervision et d’alerting Assurer la conformité aux standards de sécurité (PCI-DSS) 🛠️ Environnement technique Base de données : PostgreSQL (13+) Systèmes : Linux Langages : Python, Bash DevOps / IaC : Terraform, Ansible, Puppet CI/CD : Git, pipelines CI/CD Monitoring : Grafana, ELK / Loki
Offre d'emploi
SRE Data et IA
VISIAN
Publiée le
DevOps
Site Reliability Engineering (SRE)
1 an
40k-45k €
400-650 €
Île-de-France, France
Descriptif du poste Le bénéficiaire souhaite une prestation d'accompagnement afin de garantir la disponibilité, la performance et la résilience des services en production. Le/La SRE anticipe les risques, accompagne les équipes Dev/Prod et développe l'automatisation nécessaire pour assurer un fonctionnement optimal des plateformes, avec une spécificité sur la gestion des applications Data et IA. Responsabilités principales Suivi de la fiabilité, l'intégrité et la qualité de la plateforme en production Définition et suivi des SLO/SLI ; rétablissement du service en cas d'incident Participation aux projets dès le cadrage et anticipation des impacts sur la production Automatisation des opérations et réduction du travail manuel Mise en place d'un monitoring, de l'alerting et des dashboards pertinents Pilotage de l'obsolescence et contribution à la sécurité opérationnelle Contribution à la communauté SRE : bonnes pratiques, partage d'expérience Compétences clés Techniques : Connaissances des solutions Data & AI (ex : Airflow, Spark, Starburst, Domino AI …) Linux (RHEL), Docker, Kubernetes / OpenShift Automatisation & IaC : Git, Jenkins (CI/CD), Ansible, Terraform Scripting : Python, Shell, YAML Observabilité & Monitoring : ELK, SysDig, Dynatrace, Grafana Supervision / Scheduling : Control-M Cloud : IBM Cloud
Offre d'emploi
Platform Engineer Elastic Expérimenté
Deodis
Publiée le
DevOps
Elasticsearch
Site Reliability Engineering (SRE)
36 mois
40k-45k €
480-530 €
Montpellier, Occitanie
Mission à Montpellier, 3 jours sur site, 2 jours de télétravail / semaine En tant que Platform Engineer, au cœur du dispositif d’ingénierie de plateforme, aura un rôle clé dans la construction, l’évolution et la sécurité et l’opérabilité de notre stack technique. Dans une logique Platform-As-A-Product pour mettre à disposition des équipes internes (devs, ops, data, etc…) un environnement cohérent, standardisé et automatisé, en production. Nous exploitons la solution d’Elastic au travers de 4 plateformes Elastic Cloud Enterprise avec 600 machines virtuelles dont 400 déploiements de la Stack Elastic. Nous exploitons la solution Grafana au travers de 4 plateformes avec 6 000 utilisateurs dont 2 000 utilisateurs mensuels sur l’environnement de production. Voici les principales responsabilités : 1. Automatiser & Industrialiser l’infrastructure Maintenir et faire évoluer l’infrastructure virtualisée et conteneurisée (VMs, Kubernetes). Implémenter des workflow GitOps robustes avec ArgoCD, Gitlab CI et Ansible. Gérer le cycle de vie des environnements techniques (dev, test, recette, prod), depuis le provsionning jusqu’à la décommissions. Support les équipes via la plateforme Accompagner les équipes tech dans l’onboarding, l’usage des outils, le déploiement des applications. Assurer un support niveau plateforme, incluant le diagnostic, l’amélioration continue et la documentation claire. Participer à la co-construction des « golden paths» pour les cas d’usage récurrents (déploiement, logs, monitoring, intégration). Concevoir des abstractions réutilisables Créer des blueprints, templates et modules pour accélérer les déploiements et éviter les duplications. Maintenir un portail interne de la plateforme, pour exposer ces composants, documentations, et automatisations. 4. Assurer la sécurité et la conformité Intégrer les exigences de CyberAct et autres réglementation de sécurité dans les pipelines et l’infrastructure. Automatiser les contrôles de conformité (analyse d’images, gestion des secrets, règles de sécurité Kubernetes, audit trail) Participer à la mise en œuvre des politiques de contrôle d’accès et à leur revue régulière. 5. Fiabiliser la plateforme Travailler sur la résilience, l’automatisation des redémarrages, la capacité à rollback, et la haute disponibilité. Contribuer au traitement des incidents, aux post-mortems et à la réduction du MTTR. Participer à la définition et au suivi d’indicateurs de performance SLOs, taux de succès des déploiements, couverture, IaC, etc.)
Mission freelance
Ingénieur exploitation / production VMware automatisé (H/F) 59
Mindquest
Publiée le
Site Reliability Engineering (SRE)
Veeam Backup & Replication
VMware
6 mois
400-450 €
Roubaix, Hauts-de-France
Contexte de la mission : Nous recherchons un SRE Private Cloud H/F pour notre département IT, technology & Product qui conçoit et développe les produits, les services, les infrastructures qui construisent ensemble l’avenir. Toujours en quête d’innovation, ces passionnés s’attachent à résoudre des problèmes technologiques complexes. Poste au sein de l’équipe Run Private Cloud, en charge du maintien et de l'évolution des infrastructures liées au produit Public VCF as a Service, ainsi que la stabilité du service rendu au client. Objectifs et livrables : Maintenir la stabilité opérationnelle des infrastructures. Assurer une résolution rapide en cas d'incident. Répondre aux escalades et travailler à une résolution des cas Agrémenter et maintenir une base de connaissances techniques Travailler sur l'analyse de root cause et s'assurer de leur résolution Travailler à l'automatisation des fixes
Offre d'emploi
DevOps SRE AZURE (CDI )
KOUKA
Publiée le
Azure
Kubernetes
Site Reliability Engineering (SRE)
40k-64k €
Île-de-France, France
• Maîtrise de la mise en œuvre de pipelines Azure DevOps (YAML, templates). • Expérience avec Kubernetes (AKS) et gestion des déploiements via Helm charts. • Pratique de Datadog (APM, Logs, RUM, dashboards, alerting, runbooks). • Connaissance de SonarQube et de son intégration dans la CI/CD. • Bonnes notions de Windows Servers et environnements hybrides. • Compréhension des principes SRE (SLI/SLO, error budgets, observabilité, postmortems). • Connaissances en développement C#, PHP ou JavaScript appréciées. • Familiarité avec Octopus Deploy est un atout. • Anglais courant indispensable.
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
21 résultats
Contrats
Lieu
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois