L’offre recherchée a été supprimée ou est expirée.
Voici des offres qui pourraient correspondre.
Trouvez votre prochaine mission ou futur job IT.
Votre recherche renvoie 90 résultats.
Offre d'emploi
Ingénieur SRE (H/F)
Publiée le
IAC
Kubernetes
45k-52k €
Nantes, Pays de la Loire
Télétravail partiel
Nous recherchons pour l'un de nos clients, un acteur majeur dans le secteur du digital, un ingénieur Site Reliability Engineer (SRE) (H/F) afin de renforcer l'équipe d'exploitation et garantir la fiabilité et la performance des infrastructures cloud. Dans ce cadre, nous recherchons un Ingénieur SRE capable de garantir la fiabilité, l’évolutivité et l’automatisation de ces socles tout en promouvant une approche Infrastructure as Code et une forte culture d’observabilité. Vos missions : * Installer, administrer et maintenir en conditions opérationnelles les socles techniques (Kubernetes, Kafka, API Management…) * Mettre en place et promouvoir une approche Infrastructure as Code (Terraform, Ansible, Helm, etc.) * Développer l’automatisation des déploiements, de la supervision et de la gestion des environnements * Renforcer les pratiques d’observabilité (logs, métriques, traces) pour améliorer la performance et la résilience * Documenter les socles, accompagner les équipes internes dans leur adoption et bonnes pratiques * Participer à l’amélioration continue et à la veille technologique
Offre d'emploi
DevOps Azure / SAP Cloud / Prod & Applicatif
Publiée le
Azure DevOps
36 mois
40k-55k €
400-550 €
Paris, France
Déployer et administrer les infrastructures SAP Cloud sur Azure (IaaS / PaaS). Automatiser les processus de build, test et déploiement via des pipelines (Azure DevOps, Jenkins, GitLab CI/CD…). Conteneuriser les applications (Docker) et gérer les orchestrateurs (Kubernetes / AKS). Maintenir et améliorer les environnements Java et Groovy utilisés pour les scripts d’intégration et d’automatisation. Assurer la supervision, le monitoring et la sécurité des environnements Cloud. Collaborer avec les équipes de développement SAP, Java et les architectes Cloud. Participer à la mise en œuvre des bonnes pratiques DevOps (IaC, CI/CD, Observabilité). Rédiger la documentation technique et contribuer à la standardisation des processus. Bac +5 en informatique (école d’ingénieur ou université). Expérience confirmée (5 ans minimum) sur un poste DevOps Cloud, idéalement dans un environnement SAP Cloud ou Java. Bonne maîtrise de l’écosystème Azure et des concepts DevOps (CI/CD, IaC, Observabilité, Sécurité). Connaissance des architectures hybrides SAP Cloud / On-Premise appréciée. Sens de la collaboration, rigueur et autonomie. 3 jours sur site par semaine Connaissance / Expérience sur des problématiques E-COMMERCE
Offre d'emploi
Tech Lead SRE / Site Reliability Engineer (H/F)
Publiée le
Ansible
AWS Cloud
Docker
12 mois
50k-65k €
480-550 €
France
Télétravail partiel
Vous rejoignez la Platform Team au sein de la Tribe Paiement de la Digital Factory en tant que Tech Lead SRE . Votre rôle : piloter la vision technique SRE, garantir la fiabilité des plateformes de paiement, et assurer la performance, la résilience et la scalabilité des environnements cloud. Vous serez le référent technique, le mentor de l’équipe SRE, et un acteur clé dans la définition des standards d’ingénierie, DevOps et SRE. Leadership & Vision technique Superviser l’ensemble des activités SRE de la Platform Team. Porter la vision d’architecture résiliente, scalable et moderne (cloud, conteneurs, automatisation). Définir les standards SRE , bonnes pratiques DevOps et orientations techniques : CI/CD, observabilité, sécurité, gestion des incidents. Encadrer et développer l’équipe SRE (mentorat, pair programming, formation). Architecture & Fiabilité Concevoir et faire évoluer l’architecture cible de la plateforme Paiement avec les architectes et Tech Leads. Définir et maintenir les blueprints d’architecture : réseau, sécurité, déploiement, observabilité. Participer aux choix technologiques et à l’urbanisation cloud (AWS). Exploitation & Automatisation Garantir le maintien en condition opérationnelle (MCO) de l’ensemble des applications Paiement. Optimiser les performances, la sécurité, la stabilité et la scalabilité des environnements. Construire et améliorer les pipelines CI/CD (GitLab CI) : tests, scans sécurité, qualité, déploiements progressifs. Automatiser les opérations répétitives (scripts, jobs, workflows). Support technique & gestion des incidents Analyser, corriger et suivre les tickets (ServiceNow, Jira) de niveau 3. Réaliser les opérations de maintenance, rattrapages d’incidents et opérations bulk. Participer aux handovers des nouvelles fonctionnalités en production. Produire des rapports techniques sur la performance et les incidents. Observabilité & Monitoring Mettre en place, maintenir et améliorer les dispositifs d’observabilité (Splunk Observability). Réagir rapidement en cas de panne, diagnostiquer les causes et proposer des solutions pérennes. Suivre l'état de santé des applications, lever les alertes et réaliser les premières analyses. FinOps & optimisation des ressources Suivre les coûts AWS, détecter les dérives et proposer des optimisations. Contribuer à une démarche FinOps structurée pour un usage maîtrisé du cloud.
Mission freelance
Ingénieur DevOps AWS
Publiée le
Cloud
DevOps
Gitlab
1 an
500-550 €
Paris, France
Télétravail partiel
Intégré(e) à une équipe plateforme Cloud , vous interviendrez sur la conception, l’exploitation et l’industrialisation des infrastructures AWS et des environnements Kubernetes, dans un contexte critique. Vos principales responsabilités : Concevoir et maintenir l’ infrastructure AWS via Terraform Exploiter et faire évoluer des clusters Kubernetes (EKS) Mettre en place et optimiser les pipelines CI/CD Déployer les solutions d’ observabilité (logs, métriques, alertes) Renforcer la sécurité des environnements Cloud Apporter un support technique aux équipes applicatives 🛠️ Fiabilité & Automatisation Définition et maintien des standards d’infrastructure Automatisation des déploiements et des opérations Contribution à la documentation et aux bonnes pratiques Participation à l’amélioration continue de la disponibilité et résilience Intervention sur les incidents et phases de stabilisation
Mission freelance
Consultant ITOM ServiceNow
Publiée le
ServiceNow
3 mois
100-550 €
Paris, France
Télétravail partiel
Nous recherchons un Consultant ITOM ServiceNow pour rejoindre l'équipe d'un client en région parisienne. Vous interviendrez sur des projets stratégiques autour de l'automatisation, de l’observabilité et de l’optimisation des opérations IT au sein d’organisations de premier plan. Participer à la définition et à la mise en œuvre de la stratégie IT Operations Management (ITOM) sur la plateforme ServiceNow. Configurer et développer les modules Discovery, Service Mapping, Event Management, Orchestration .
Mission freelance
Devops AWS / GCP
Publiée le
AWS Cloud
Google Cloud Platform (GCP)
12 mois
370-600 €
Île-de-France, France
Télétravail partiel
Nous recherchons un OPS Cloud Public / DevOps confirmé pour intervenir sur le cycle de vie applicatif, l’exploitation Cloud (AWS/GCP), la CI/CD, l’observabilité et la gestion des incidents/changes. Missions principales : Création & gestion de ressources natives Kubernetes / Cloud Accompagnement des équipes applicatives à l’usage des outils DevOps Bon accostage Dev → Cloud public via CI/CD (GitLab, Artifactory, Vault…) Définition des flux de logs, automatisation des tests & prérequis d’exploitation Mise en place de tests de sécurité (images, vulnérabilités, intrusion) Construction de l’observabilité, supervision & alerting (GCP/AWS) Provisionnement & déploiement IaC (Terraform, KCC) Gestion des changements : Prise en charge des requêtes ServiceNow jusqu’à clôture Analyse d’impact, préparation & autorisation des changements Contribution aux devis projets & respect des normes de production Coordination mise en production, validation DTA, supervision, consignes Incidents & problèmes : Gestion complète des incidents & communication client Coordination restauration service / SLA Production post-mortem + suivi plan d’actions Analyse des causes racines & actions pérennes Configuration & reporting : Gestion CMDB (CI) Reporting opérationnel & contribution aux comités Mise à jour documentation, DEX, DTA, référentiels
Offre d'emploi
Cloud DevOps - AWS
Publiée le
Ansible
Argo CD
AWS Cloud
36 mois
Île-de-France, France
Télétravail partiel
Contexte : Nous recherchons un Cloud DevOps-AWS passionné par l'automatisation et l'industrialisation des infrastructures et des déploiements applicatifs. Vous interviendrez dans un environnement cloud AWS et serez un acteur clé de l'optimisation des processus CI/CD et de la gestion des infrastructures as code (IaC). Missions Principales : Concevoir, mettre en place et maintenir des pipelines CI/CD optimisés pour l'automatisation des déploiements ; Développer et gérer des infrastructures cloud AWS via des outils d'IaC (Terraform, CloudFormation, CDK) ; Mettre en œuvre des solutions de conteneurisation (Docker, Kubernetes, ECS, EKS) ; Assurer la supervision, la gestion des logs et l’observabilité (CloudWatch, Prometheus, Grafana, ELK) ; Automatiser les opérations de déploiement, de monitoring et de scaling ; Sécuriser les infrastructures cloud et les pipelines DevOps en appliquant les bonnes pratiques (IAM, Secrets Manager, Security Hub, etc.) ; Optimiser la gestion des coûts et la scalabilité des infrastructures cloud ; Accompagner les équipes de développement dans l’intégration des bonnes pratiques DevOps ; Participer à l'amélioration continue des processus d’industrialisation.
Offre d'emploi
Agile Release Manager
Publiée le
DevOps
Méthode Agile
Site Reliability Engineering (SRE)
6 mois
40k-70k €
400-530 €
Paris, France
Télétravail partiel
Nous recherchons un(e) Agile Release Manager expérimenté. Vous serez responsable de la livraison des releases produits sur deux de nos domaines clés de la Monétique (Acquiring, Issuing, Dispute). Votre rôle sera central : vous assurerez l'alignement stratégique et opérationnel entre les équipes Produit, Tech et SRE à travers une gouvernance structurée de type Agile Release Train (ART). Vos missions principales : En tant que gardien du cycle de vie des releases, vos responsabilités se décomposent ainsi : 1. Pilotage et Planification (PI Planning & Roadmap) : Diriger et synchroniser les sessions de Program Increment (PI) Planning, en garantissant un alignement clair sur les engagements de livraison et les jalons. Assurer le respect des engagements définis dans la roadmap produit ainsi que des exigences non fonctionnelles de la plateforme. 2. Gestion des Risques et Dépendances : Gérer les plans de release, les dépendances et les risques en étroite collaboration avec les Engineering Managers et les SRE Managers. Anticiper et résoudre les conflits de livraison grâce à une synchronisation inter-domaines (Produit, Software Engineering, SRE, Sécurité, DevSecOps). 3. Suivi de la Performance et Reporting : Monitorer les KPIs, les tendances de vélocité et les indicateurs de risques pour assurer un suivi cohérent des progrès. Communiquer de manière transparente le statut des releases, les risques majeurs et les décisions clés aux parties prenantes et au management. 4. Amélioration Continue et Excellence Opérationnelle Garantir la cohérence des processus et l'intégration des pratiques de fiabilité (SRE, Architecture, QA) au sein des squads. Promouvoir l'automatisation et la standardisation des processus de release (DevSecOps) pour fluidifier le delivery. Piloter l'amélioration continue des pratiques de livraison en alignement avec notre modèle de gouvernance agile. 5. Contribution au pilotage de la relation avec les éditeurs de progiciels et les partenaires externes : Participe à la gestion des escalades opérationnelles (périmètre, qualité, planning). Assure le pilotage de la contractualisation (définition, engagements contractuels…) en collaboration avec les équipes juridiques et financières. Assure le suivi opérationnel des fournisseurs et partenaires. Responsable de la gestion budgétaire du partenaire, incluant le traitement des demandes de modification (Change Requests) en lien avec les équipes Produit. Contribue à la gouvernance avec le tiers (comités projet, comités de pilotage, etc.). Votre profil : Compétences Techniques & Méthodologiques : Agile & SAFe : Solide compréhension du Agile Program Management et des frameworks ART (SAFe). Gouvernance : Expérience avérée dans la gouvernance de releases de bout en bout et la coordination transverse (Product, SRE, Architecture, Sécurité). SRE & DevOps : Connaissance des principes SRE (observabilité, fiabilité) et familiarité avec les chaînes CI/CD, les outils d'automatisation et l'orchestration de releases. Compétences Fonctionnelles : Excellente capacité de planification et de gestion des dépendances dans des flux de livraison complexes. Expérience de gestion de Agile Release Trains multi-squads, assurant synchronisation et transparence. Soft Skills : Facilitation : Capacité à aligner des parties prenantes. Communication : Excellentes compétences pour rendre visible l'avancement et gérer les attentes. Leadership : Capacité à fédérer les équipes autour d'objectifs communs de fiabilité et de performance.
Mission freelance
Tech Lead / Senior DevOps SRE (Site Reliability Engineer)
Publiée le
CI/CD
DevOps
Incident Management
2 ans
600-700 €
Évry, Île-de-France
Télétravail partiel
Dans le cadre de l’amélioration continue de sa plateforme de paiement, notre client – acteur majeur du secteur de l’hôtellerie – renforce son équipe SRE au sein de la Digital Factory. Nous recherchons un Tech Lead/ Senior SRE capable de porter la vision technique de la Platform Team et d’assurer la disponibilité, la résilience et la performance d’environnements cloud essentiels pour le fonctionnement des services de paiement. En tant que Tech Lead / Senior SRE, votre mission : Participer à l’ensemble des activités SRE tout en soutenant et en portant la vision technique de l’équipe. Concevoir et mettre en œuvre des architectures résilientes, sécurisées et évolutives (cloud, containers, automatisation). Définir les standards SRE , les bonnes pratiques DevOps et la stratégie technique : CI/CD, observabilité, sécurité, gestion des incidents. Assurer la coordination technique avec les autres équipes Platform ainsi qu’avec le fournisseur cloud. Garantir la qualité et la stabilité des environnements internes et hors production (MCO) pour l’ensemble des applications de la tribe Paiement . Collaborer avec les équipes internes pour résoudre les problématiques de configuration, de déploiement et de débogage des applications. Surveiller l’observabilité des applications, traiter les alertes et réaliser les premières analyses en cas d’incident. Optimiser les performances et la scalabilité des applications déployées dans le cloud. Veiller à la maîtrise et à l’optimisation des coûts d’infrastructure. Assurer l’évolution et la maintenance des processus de monitoring et d’observabilité des infrastructures et applications cloud.
Offre d'emploi
Ingénieur de production/DevOps - NANTES (H/F)
Publiée le
Ansible
Cloud
Dynatrace
3 ans
40k-51k €
400-540 €
Nantes, Pays de la Loire
Télétravail partiel
Pour notre client dans le secteur bancaire , vous intégrez une équipe de production en charge du MCO et de l’industrialisation d’environnements critiques, dans un contexte hybride mêlant Cloud privé (OpenStack) et systèmes legacy. Vous contribuez activement à la construction des environnements, à l’automatisation, et au développement de la chaîne DevOps (CI/CD, GitOps). Compétences techniques indispensables : Build / Run Prise en charge du Build & Run Construction et configuration d’environnements sur OpenStack Gestion des demandes de flux (réseau, firewall, proxy) Mise en production via pipelines CI DevOps Maîtrise de GitLab CI/CD Environnements Kubernetes GitOps via Argo CD Automatisation Ansible ( playbooks ) Connaissance des architectures Cloud & microservices Run / Exploitation Traitement d’incidents N2/N3 Suivi, analyse et résolution Supervision & Observabilité : Zabbix Dynatrace Analyse performance et optimisation Cloud Forte expérience en Cloud privé Contexte legacy + modernisation Cloud Missions principales : Build Construction d’environnements OpenStack Industrialisation CI/CD (GitLab) Automatisation via Ansible Contribution aux projets GitOps (Argo CD) Run Gestion incidents N2/N3 Suivi MCO, supervision, diagnostic Amélioration continue & fiabilisation des pipelines Projets Modernisation des environnements legacy vers le Cloud Participation aux cérémonies Agile (daily, rétro, planning)
Mission freelance
Cloud Engineer (AWS – Media & IoT)
Publiée le
AWS Cloud
1 mois
100-550 €
Paris, France
Télétravail 100%
Dans un contexte de scale et de renforcement de la roadmap , tu rejoins l’équipe Platform pour concevoir et faire évoluer une Media API stratégique. L’objectif : unifier l’accès aux caméras, flux vidéo/images et transformations média , dans un environnement IoT + serverless , sécurisé et scalable. Media API & Serverless Concevoir et développer une Media API pour interagir avec des caméras (IoT / Edge). Implémenter une architecture API Gateway on top of AWS Step Functions . Créer des endpoints manquants qui ne sont pas couverts par les APIs existantes. Unifier l’accès : caméras images flux vidéo transformations média (processing, déclenchements, workflows) Architecture & Platform Participer aux choix d’architecture cloud (patterns serverless, event-driven). Garantir scalabilité, sécurité et résilience des services. Travailler main dans la main avec les équipes Cloud, Data/ML, Produit et IoT . Sécurité & fiabilité Implémenter une approche Security by design : IAM / permissions secrets management politiques réseau Contribuer à la mise en place de : monitoring & observabilité runbooks gestion des incidents Automatisation Infrastructure as Code (Terraform ou CDK). CI/CD unifié et industrialisé. Participation à l’amélioration continue de la platform.
Mission freelance
Ingénieur Dev’Op’s Domaine applicatif H/F
Publiée le
Apache
Apache Tomcat
Azure
6 mois
Guyancourt, Île-de-France
Télétravail partiel
Notre client Grand Compte situé à Guyancourt, recherche un Ingénieur Dev’Op’s Domaine applicatif. Le démarrage est prévu le 15/12/2025. Contexte : Dans un contexte de transformation digitale des applicatifs front-office à destination des chantiers. Au sein de la direction des Opérations Monde. Sur un domaine applicatif exigeant : Maintien en conditions opérationnelles et projet. Des infra très hétérogènes : On’Prem, Azure, Saas. De nombreux axes d’améliorations à identifier et à travailler. Le tout au sein d’une équipe très soudée. Les missions principales : Accompagner les projets du domaine Production >> Projets de déploiement de nouveaux applicatifs Cloud AZURE Préparer/ Optimiser l’exploitabilité des produits Garantir la qualité, la valeur et la performance des services applicatifs du périmètre Accompagner les domaines dans la gestion de leur portefeuille applicatif. Activités principales : Participation à la construction et au design du produit : • Être force de proposition pour faire évoluer / optimiser le produit en mettant en avant l'intérêt pour l'utilisateur. • Contribuer aux DAT et aux SAT • Anticiper et définir les conditions d’exploitabilité (sécurité/Interopérabilité/data) du produit dès la phase projet Garantir l’exploitabilité du produit : • Identifier et coordonner les bons interlocuteurs pour traiter les incidents et les changes, s’assurer qu’ils ont le bon niveau de compétences et accès aux outils nécessaires. • Définir les étapes et anticiper les risques des déploiements • Définir ou challenger les plans de tests : contribuer aux cahiers de tests, réaliser certains tests • Préparer, dupliquer et déployer les environnements • Piloter la rédaction et valider l’ensemble des procédures d’exploitation Suivi de la performance des services : • Superviser la bonne santé des applications « globales » avec les équipes régionales de supervision. • Garantir les engagements de service sur l’ensemble des services appli pour les incidents, les demandes de changements et demandes de services. • Piloter la réalisation des analyses à froid des incidents (amélioration continue). Développer l’industrialisation à chaque étape de la vie du produit : • Identifier les axes d’améliorations sur le périmètre : automatisation, transferts d’activités etc... • Automatiser / sécuriser les déploiements • Implémenter les règles de détection d’incidents (observabilité).
Mission freelance
Tech Lead SRE (Platform team) F/H
Publiée le
AWS Cloud
Gitlab
Site Reliability Engineering (SRE)
12 mois
500-600 €
Évry, Île-de-France
Télétravail partiel
Vous intégrerez lʼéquipe “Platform Team” de la tribe Paiement de la Digital Factory en tant que Tech Lead SRE – Site Reliability Engineer (H/F). Vous superviserez l'ensemble des activités SRE et porterez la vision technique de l'équipe : Participerez à la conception et mise en œuvre de lʼarchitecture résiliente et évolutive des plateformes (cloud, containers, automatisation Définition des standards SRE, des bonnes pratiques DevOps, et de la stratégie technique (CI/CD, observabilité, sécurité, gestion des incidents) Encadrement et développement de lʼéquipe SRE (mentorat, pair programming, formation) Gestion des relations techniques avec les autres équipes Platform et fournisseur cloud Solide maîtrise des outils dʼinfrastructure (Kubernetes, Docker, Terraform, monitoring avancé) et des langages (Python, Go, Java) Expérience confirmée en leadership technique, capacité à prendre des décisions structurantes, à arbitrer et à communiquer dans des environnements complexes Vous interviendrez sur tous les aspects de maintien en condition opérationnel des applications constituant la tribe Paiement, en veillant à l'optimisation et la stabilisation des environnements de production et hors production. Vous collaborerez avec les autres équipes de la tribe ou externe à celle-ci pour résoudre les problèmes liés la configuration, au déploiement ou au déboggage des applications. Vous devrez suivre l'observabilité des applications constituant la tribe en levant les alertes et en effectuant les premières analyses en cas de pannes détectées. Optimiser les performances des applications déployées dans le cloud et garantir leur scalabilité en fonction des besoins. Assurer l'optimisation des infrastructures en termes de coûts et d'utilisation. Veiller à l'évolution et la maintenance des processus de surveillance (observabilité) et du monitoring des infrastructures et applications déployées dans le cloud Responsabilités Responsable des actions de sécurité et conformité de la plateforme Paiement (en collaboration avec lʼarchitecte et les Tech Lead) En collaboration avec l'architecte et les Tech Lead, concevoir et faire évoluer l'architecture cible de la plateforme Paiement en garantissant résilience, performance et scalabilité Participer activement à la définition des patterns d'architecture reproductibles (blueprints : networking, sécurité, déploiement, observabilité) Participer activement aux choix technologiques structurants et aux orientations d'urbanisation cloud et plateforme Construire et améliorer les pipelines CI/CD (GitLab CI) incluant tests automatisés, scans sécurité, qualité et déploiements progressifs Réduire le travail manuel en automatisant les opérations répétitives (scripts, jobs, workflows) Accompagner les équipes de développement dans l'adoption de ces modèles Analyser, corriger et suivre les tickets (Service Now / Jira) de support niveau 3 émanant des différents supports de niveau 2 et de tout l'écosystème (plateforme de paiement et partenaires externes de paiement). Effectuer les traitements de maintenance en condition opérationnelle incluant les rattrapages en cas d'incidents, les opérations de bulk. Maintenir à jour la documentation des infrastructures et de toutes les procédures de maintien en condition opérationnelle de l'équipe. Participer au handover lors de livraison en production de nouvelles features. Livrer des rapports techniques « on demand » concernant les performances/incidents de la plateforme. Participer et être force de proposition dans toutes les réunions de suivis avec les différentes équipes de supports. Analyser et être capable de traduire lʼanalyse vers les équipes de développement en cas de correction à mettre en place suite à un ticket dʼincident ou d'optimisation. Mettre en place, maintenir et suivre au jour le jour les systèmes de surveillance pour assurer la disponibilité et la performance des applications (Splunk Observability). Réagir rapidement en cas de défaillance ou de panne, analyser les causes et proposer des solutions pérennes. Suivre les coûts de la plateforme AWS et détecter au plus tôt les dérives puis proposer des solutions pour rester dans les budgets (approche FinOps structurée).
Mission freelance
Devops delivery IA(H/F)
Publiée le
DevOps
3 mois
100-480 €
Paris, France
Télétravail partiel
TJM Max 480 euros non Négociable 2 Jours de TT non négociable Au sein de la DSI de SFR, la Direction Modernisation du SI, DATA et IA est en charge des projets et plateformes DATA&IA, avec un ADN de transformation des usages et des processus. Sur l'intelligence artificielle, plusieurs étapes ont été franchies en 2025 passant par la mise en place d'un processus d'identification des cas d'usages IA ainsi l'expérimentation consolidée sur une plateforme commune sur Google Cloud Plateform, avec à la clé quelques produits IA mis en production et déployés pour tous. Notre objectif pour 2026 est d'élargir la liste des produits IA et chercher une intégration simplifiée dans les processus Métiers. Augmenter notre capacité de production exige une disponibilité d'un processus et outillage DevOps exigeant et solide. Pour la bonne exécution de cet objectif, SFR est à la recherche d'une prestation avec un profil DevOps expérimenté pour piloter la structration de la chaîne de développement, de tests et d'observabilité. DEFINITION DE LA PRESTATION 'Dans le cadre de cette mission, la prestation adressera 4 volets majeurs en étroite relation avec l'équipe de développement et les chefs de projet : 1/ DevOps : - Réaliser un inventaire de la chaîne DevOps, la documenter et proposer une cible répondant aux enjeux d'automatisation et la maîtrise de la qualité, tout en respectant le cadre Valentine Cloud - Contribuer à la mise en oeuvre de la cible - Animer les travaux au global pour atteindre cette cible 2/ Monitoring & Troubleshooting : - Proposer une architecture et un outillage pour la mise en oeuvre d'une observabilité - Mettre en oeuvre cette architecture & piloter les contributions de l'équipe de développement - Accompagner l'onboarding des développeurs, testeurs et chefs de projet 3/ Pilotage de l'activité : - Contribuer à la mise en oeuvre des dispositifs de pilotage de l'activité Pour l'ensemble de ces activités, une gouvernance ainsi qu'un reporting régulier et clair doivent être mis en place. Indispensable DevOps, GitLab, Elastic, Python, NodeJS Profil ayant travaillé sur des projets IA sur Google Cloud
Mission freelance
Problem Manager Senior
Publiée le
24 mois
350-700 €
Paris, France
Télétravail partiel
PROPULSE IT recherche un Problem Manger avec au moins 10 ans d'expérience. Au sein d'une structure qui prend en charge : - La gestion des incidents des applications SI et du socle d'infrastructures - La gestion des problèmes : recherche de causes racines (RCA), prévention des incidents récurrents, amélioration continue, consolidation des erreurs connues - La gestion des niveaux de service (SLA/SLO), reporting QoS et plans d'amélioration - L'administration du socle technique et des briques d'infrastructure - Les chaînes de nuit, l'ordonnancement, les datacenters et la conformité logicielle - L'intégration des projets SI et la mise en production La montée en charge des SI, la croissance des incidents techniques complexes et l'augmentation des problématiques récurrentes nécessitent un renfort dédié au rôle de Gestionnaire de Problèmes, afin de : - Réduire durablement la récurrence des incidents - Améliorer la qualité de service - Structurer les analyses techniques transverses - Accélérer la production et le suivi des plans de progrès La prestation recherchée vise à disposer d'un Problem Manager expérimenté, autonome et capable de piloter des analyses complexes impliquant de nombreux contributeurs. Mission : RECHERCHE DE CAUSE RACINE (RCA) - Piloter les analyses post-incident des incidents majeurs et récurrents - Organiser les ateliers RCA (post-mortem, 5 pourquoi, Ishikawa…) - Identifier les causes racines, contributives et aggravantes - Élaborer et qualifier les solutions définitives ou correctifs techniques - Produire les erreurs connues et solutions de contournement PLANS DE PROGRÈS - Construire, piloter et suivre les plans d'actions issus des RCA - Coordonner les contributeurs techniques et métiers - Assurer le respect des engagements (délai, qualité, validation métier) - Proposer des améliorations d'exploitabilité, de supervision et d'architecture FIABILISATION & PRÉVENTION DES INCIDENTS - Analyser les tendances d'incidents récurrents - Proposer des améliorations préventives (observabilité, capacity planning, patterns d'exploitabilité) - Contribuer à l'amélioration des consignes d'exploitation et de supervision REPORTING & QUALITÉ DE SERVICE - Mettre à jour la base de connaissances (erreurs connues, contournements) - Produire le reporting mensuel orienté « Problèmes » - Contribuer au reporting QoS global (faits marquants, tendances, progrès) - Accompagner les SDM dans leurs revues clients PROCESSUS & MÉTHODES - Garantir la conformité au processus ITIL de gestion de problèmes - Améliorer les pratiques internes (standardisation, outillage, automatisation) - Promouvoir la culture RCA au sein des équipes
Mission freelance
Senior devops - expertise Observabilité
Publiée le
Datadog
Google Cloud Platform (GCP)
Kubernetes
3 mois
400-590 €
Lille, Hauts-de-France
Télétravail partiel
Contexte de la mission Présentation de la demande Nous recherchons au sein du pôle Observability dans notre équipe Engineering Productivity, un ingénieur expérimenté et autonome pour prendre la responsabilité d’un ou plusieurs projets et gestion de process autour de l'observabilité et notamment les notions de metrics, traces et alerting. Le terrain de jeu est propice à la prise d’initiative : une plateforme internationale, au coeur de l'ensemble des initiatives digitales L'offre est est possible en remote avec 2 jours / mois sur Lille (si localisation hors métropole Lilloise avec possibilité d'espace de coworking dans certaines de villes de France) Le projet Au cœur des équipes Cloud Platform Engineering (CPE), l'équipe Engineering Productivity et spécifiquement l'équipe Observability a pour objectif de construire et maintenir les process et l'accompagnement autour des notions et pratiques d'Observability (metrics, trace, logs management, dashboard, alerting) au sein de l'ensembles des solutions digitales Pour répondre à ces besoins, l'équipe développe et maintient des solutions utilisées mondialement par nos solutions e-commerces et magasins dans plus de 70 pays. Pour cela nous avons besoin de renforcer notre équipe avec un profil ingénieur expert / senior, qui sera un acteur clef pour la réussite de ces challenges. Clause de Confidentialité Toutes informations transmises par l’une des parties à l’autre partie comme informations transmises pour la réalisation des prestations ont un caractère confidentiel. Dès la réalisation d'une prestation, chaque partie s'engage à conserver comme confidentielles toutes les informations obtenues de l’autre partie. Chaque partie garantit le respect des engagements de cet article par tout son personnel et/ou les autres intervenants aux prestations. Objectifs et livrables En tant que consultant APM, tu contribueras au maintien opérationnel des solutions Datadog et Splunk via : Maintien et tests de nos stacks Terraform Développement en Python/Go d'API ou de composants OpenTelemetry Accompagnement technique et configuration avec les utilisateurs Déploiement sur certains périmètres Prise en charge d’une partie du RUN Formation et le suivi de nos utilisateurs Industrialisation et mise en conformité avec nos gouvernances SI Automatisation du provisionnement Définition des règles et bonnes pratiques Audit de conformité (application des bonnes pratiques) Création de Control Towers vérifiant la qualité du service rendu Mise à jour de la base documentaire Tu formalises régulièrement tes avancées auprès du responsable de ces solutions. Enfin, évoluant dans un contexte international, tu as un niveau d’anglais courant. Tu évolueras dans un contexte Agile au sein d'une équipe pluridisciplinaire autour d'un leitmotiv : "You Build it, You run it, You Enjoy it"... Environnement Technique Solutions: Datadog, OpenTelemetry, Splunk, Solarwinds, Pagerduty Tu maitrises au moins un language de développement de type Python ou Go Tu as une affinité particulière pour l'observabilité et tu comprends et maîtrise l'intérêt des logs, métriques, traces. Tu es à l'aise dans un environnement Kubernetes et dans l'utilisation d'un Cloud Provider (GCP ou AWS) Compétences demandées Compétences Niveau de compétence DATADOG Confirmé Programmation Python Confirmé Google Cloud Confirmé KUBERNETES Confirmé SPLUNK Élémentaire Observability Expert AWS Confirmé GOLANG Confirmé IBM Terraform Confirmé Langues Niveau de langue Anglais Courant
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
- Comment j'ai décroché une mission en bypassant l'ESN - et l'outil que j'ai créé
- Création de site Wordpress : BIC ou BNC ?
- Quel logiciel de compta en ligne avez vous choisi et pourquoi ? Avec quel compte pro en ligne ?
- Passage sasu à eurl: transition mutuelle/prévoyance
- Meilleure banque pour compte pro
- Est ce que Indy est suffisant ?
90 résultats
Contrats
Lieu
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois