Trouvez votre prochaine offre d’emploi ou de mission freelance Prometheus

Votre recherche renvoie 53 résultats.
Freelance

Mission freelance
Expert Infrastructure IT Senior (Supervision des infrastructures IT)

ARTESIA IT
Publiée le
Centreon
Grafana
Prometheus

1 an
Île-de-France, France
Contexte de la mission Dans le cadre du renforcement de la supervision de ses infrastructures critiques, un groupe audiovisuel souhaite s’appuyer sur l’expertise d’un Expert Infrastructure IT Senior spécialisé en supervision afin d’optimiser la visibilité, la fiabilité et la performance de ses systèmes de supply chain média et de diffusion. Objectifs de la prestation La mission vise à concevoir, déployer et maintenir une plateforme de supervision performante permettant de surveiller en temps réel l’ensemble des infrastructures IT et broadcast, tout en garantissant une haute disponibilité des services de diffusion. Périmètre des interventions 1. Mise en place et administration des outils de supervision Déploiement, configuration et administration des plateformes de supervision (Prometheus, Grafana, Centreon) Intégration des différentes sources de métriques et de logs Optimisation de la collecte, du stockage et de la visualisation des données de monitoring 2. Supervision des infrastructures critiques Mise en place de la supervision des environnements virtualisés (VMware) Surveillance des infrastructures de stockage (NetApp, Isilon) Supervision des équipements réseaux (Cisco, Palo Alto) Garantie de la disponibilité et des performances des infrastructures IT critiques 3. Monitoring des flux de diffusion et infrastructures broadcast Mise en place de sondes de monitoring pour les flux IP de diffusion (ST 2110) Supervision des systèmes liés à la supply chain média et aux environnements broadcast Analyse proactive des incidents impactant la diffusion 4. Visualisation et alerting Conception et développement de dashboards temps réel sous Grafana Mise en place de mécanismes d’alerting avancés et de corrélation d’événements Définition d’indicateurs clés de performance (KPI) pour le suivi des infrastructures 5. Automatisation et développement Développement et intégration de sondes personnalisées pour la supervision Automatisation des tâches de monitoring et des processus de diagnostic Documentation des procédures et bonnes pratiques de supervision
Freelance
CDI

Offre d'emploi
Consultant Observabilité

KLETA
Publiée le
Dynatrace
ELK
Grafana

3 ans
Paris, France
Dans le cadre d’un programme de transformation technologique, nous recherchons un Consultant Observabilité pour définir et industrialiser une stratégie d’observabilité cohérente sur des environnements complexes et critiques. Vous analyserez les dispositifs existants, identifierez les lacunes de visibilité et proposerez une trajectoire cible alignée avec les trois piliers de l’observabilité (logs, métriques, traces). Vous guiderez la mise en place de solutions modernes basées sur OpenTelemetry, Prometheus, Grafana, ELK ou équivalents, en veillant à leur intégration dans les pipelines CI/CD et les pratiques DevOps. Vous serez responsable de la définition des SLO, SLA et SLI, de la structuration de dashboards exploitables et de la mise en place d’alerting pertinent et actionnable. Vous travaillerez étroitement avec les équipes Cloud, DevOps et SRE pour améliorer la fiabilité, la détectabilité et la résilience des systèmes. Vous aurez également un rôle clé dans l’animation d’ateliers, la formalisation de standards et l’accompagnement des équipes dans l’adoption des meilleures pratiques d’observabilité.
CDI

Offre d'emploi
Ingénieur SRE Virtualisation Réseau H/F

ASTERIA
Publiée le
Cloud
Fortinet
Load Balancing

50k-70k €
Monaco
ASTERIA recherche, pour l’un de ses Clients basés sur Monaco, un Ingénieur SRE Virtualisation Réseau (Opérateur Cloud) H/F. VOTRE MISSION : Au sein d’un Cloud Provider Souverain de la Principauté de Monaco, l’Ingénieur SRE spécialisation Réseau H/F sera garant de la fiabilité, de la disponibilité et de la performance des plateformes de virtualisation constituant le socle des services Cloud IaaS. Le poste se situe à l’interface entre exploitation d’infrastructures critiques et ingénierie de fiabilité, avec un fort niveau d’automatisation et une exigence élevée en matière de qualité de service et de sécurité. Directement Intégré dans la direction des opérations dans une équipe d’ingénieurs Cloud spécialisés (réseau, stockage, sauvegarde, sécurité), vous interviendrez dans des infrastructures mutualisées, multi-clients, à forts enjeux contractuels (SLA). Missions principales : Assurer la gestion opérationnelle des infrastructures et des plateformes d’un opérateur cloud Apporter une expertise de haut niveau sur les infrastructures et les plateformes d’un cloud opérateur Assurer la supervision, la maintenance corrective Diagnostiquer et résoudre les incidents complexes Documenter les configurations et procédures d’exploitation Participer à la mise en œuvre et l’évolution des infrastructures et plateformes de l’opérateur Cloud Assurer un rôle de support technique de niveau 3 (N3) et participer au dispositif d’astreinte Assurer le transfert de compétences auprès des équipes Cloud Support
Freelance

Mission freelance
Ingénieur de Production cloud

MLMCONSEIL
Publiée le
Ansible
DevOps
Grafana

1 an
100-490 €
Rouen, Normandie
Pour le besoin de notre client, nous sommes à la recherche d'un un profil ingénieur de production CLOUD expérimenté Profil demandé : SysOps, intégrateur CLOUD ou DevOps Construction des environnements (Terraform) sur un cluster OpenStack Déploiement automatisé des outils (Ansible) Mise en place de pipelines CI/CD (Jenkins, GitLab, Sonar, Nexus) Supervision et suivi des systèmes d'exploitation (Prometheus, Grafana, Loki) Échanges réguliers avec les développeurs des applications ... ... ... ... ... ... ...
Freelance

Mission freelance
Devops Engineer

Groupe Aptenia
Publiée le
Ansible
Docker
Gitlab

12 mois
400-600 €
Namur, Belgique
Localisation & modalités 📍 Namur 🏠 Mode hybride : minimum 2 jours sur site par semaine 📅 Démarrage : ASAP Contexte de la mission Dans le cadre d’un programme de transformation IT, notre client renforce ses équipes DevOps afin d’industrialiser ses plateformes applicatives et améliorer la performance de ses environnements. Vous interviendrez au cœur d’un écosystème technique moderne, en collaboration avec des équipes de développement, d’architecture et d’exploitation. Missions principales 🔧 DevOps & CI/CD Mise en place et maintien des outils de la factory DevOps Conception, optimisation et maintenance des pipelines CI/CD Gestion des environnements de développement et d’intégration Monitoring & exploitation Déploiement et maintenance de solutions de monitoring et de dashboards Définition et suivi des indicateurs de performance des applications Accompagnement des équipes sur les bonnes pratiques de logging Support aux équipes dans la résolution d’incidents Gestion des plateformes techniques Mise en place et maintien des composants middleware et outils techniques Contribution à la stabilité et à la performance des environnements Automatisation Automatisation des tâches d’exploitation et de déploiement Mise en place de mécanismes de : déploiement automatisé rollback sauvegarde / restauration redémarrage automatique des services Coordination Interface avec les équipes techniques internes Participation à l’amélioration continue des processus DevOps
Freelance

Mission freelance
Chef de Projet Digital / Product Owner – Platform Engineering

Axysse
Publiée le
Grafana
Prometheus
Terraform

1 an
400-550 €
Île-de-France, France
Dans le cadre d’un programme stratégique autour de l’ expérience développeur et de l’industrialisation des plateformes techniques , nous recherchons un Chef de Projet Digital / Product Owner expérimenté pour piloter des initiatives structurantes autour d’un Internal Developer Portal et de l’orchestration de la delivery infrastructure . Le rôle s’inscrit au cœur d’un environnement DevOps / Cloud Native , avec un fort enjeu d’amélioration de la Developer Experience (DX) et d’optimisation des pratiques de delivery. 📍 Localisation : Paris (mode hybride – télétravail possible) 📅 Démarrage : ASAP 🎯 Vos responsabilitésPilotage du portail développeur (Internal Developer Portal – Backstage) Définir la vision produit et la roadmap du portail développeur. Construire et prioriser le backlog produit (epics, user stories, critères d’acceptation). Piloter les rituels Agile : sprint planning, daily, review, rétrospective. Coordonner les contributions des équipes techniques impliquées. Favoriser l’ adoption du portail : onboarding des équipes, communication interne et accompagnement. Suivre les KPIs d’adoption et de qualité de la Developer Experience . fiche_de_poste_cdp_po_platform … Orchestration des projets d’infrastructure Piloter un portefeuille de projets techniques autour de la delivery infrastructure. Coordonner les initiatives liées à : CI/CD Infrastructure as Code Kubernetes Observabilité Sécurité plateforme Identifier les dépendances inter-projets et gérer les risques. Produire des reportings clairs et structurés pour les parties prenantes. Animation et amélioration continue Animer les rituels de gouvernance et de delivery Agile . Contribuer à l’évolution des processus DevOps et Platform Engineering . Participer à la diffusion d’une culture plateforme et developer-centric au sein de l’organisation. Méthodologie Maîtrise des frameworks Agile (Scrum, Kanban, SAFe) . Capacité à rédiger des user stories structurées et animer des ateliers de discovery. Expérience en priorisation produit (RICE, MoSCoW, Kano) . Soft skills Leadership transversal et capacité à fédérer des équipes techniques. Excellentes capacités de communication. Autonomie, rigueur et orientation résultats. Curiosité pour l’écosystème Cloud Native / CNCF . 💡 Pourquoi rejoindre cette mission ? Un rôle stratégique au cœur de la transformation Platform Engineering. Un environnement technologique Cloud Native moderne . Un impact direct sur la Developer Experience et la productivité des équipes d’ingénierie . Des projets visibles et structurants à l’échelle de l’organisation.
CDI
Freelance

Offre d'emploi
Architecte Infrastructure & Cloud Hybride

Atlanse
Publiée le
Architecture
Cloud
Grafana

1 an
60k-65k €
500-600 €
La Défense, Île-de-France
Rattaché.e au Responsable du Pôle Infrastructure Cloud, vous jouerez un rôle clé dans la conception, la gouvernance et l’évolution des architectures on-premise et Cloud dans un contexte d’industrialisation et d’optimisation des infrastructures. Votre rôleArchitecture et gouvernance des infrastructures • Définir et concevoir les architectures cibles on-premise, Cloud et hybrides • Garantir la cohérence, la sécurité, la résilience et la performance des plateformes • Définir les standards d’architecture, d’exploitation et de sécurité • Contribuer à la construction des landing zones et des architectures Cloud Azure • Définir les patterns d’architecture (rehosting, replatforming, hybridation) • Participer à l’élaboration de la roadmap d’évolution des infrastructures à moyen terme Exploitation et maintien en conditions opérationnelles • Assurer l’administration avancée des environnements on-premise et Cloud • Participer au maintien en conditions opérationnelles (MCO) et de sécurité (MCS) • Suivre les performances, le capacity planning et l’optimisation des ressources • Gérer les incidents complexes et transverses de niveau expert (N3) • Participer aux cellules de crise et aux analyses post-incident (RCA) • Documenter les architectures, procédures et modes opératoires Transversalité et sécurité (SecOps) • Collaborer étroitement avec les équipes Sécurité, SecOps, Réseau et IAM • Contribuer aux stratégies de patch management multi-environnements (Windows, Linux, AIX, VMware, Cloud) • Participer aux analyses de risques, audits techniques et plans de remédiation • Intégrer les exigences de sécurité dans les architectures (Zero Trust, RBAC, chiffrement, journalisation) • Coordonner avec les équipes SOC et PAM Projets de transformation et migrations Cloud • Accompagner les projets structurants de la DSI • Participer aux phases de cadrage, d’assessment et de design • Challenger et valider les choix techniques • Piloter ou accompagner les migrations d’infrastructures et de workloads • Garantir la cohérence globale entre environnements on-premise et Cloud Résilience, sauvegarde et observabilité • Définir les stratégies de sauvegarde et de restauration • Participer à la mise en œuvre et aux tests des PRA / PCA • Mettre en place une observabilité de bout en bout (monitoring, alerting, logs) • Intégrer la supervision Cloud (Azure Monitor, Log Analytics, CloudWatch…) • Connecter les environnements Cloud aux outils existants (Prometheus, Grafana)
Freelance

Mission freelance
Développeur Python Grafana Prometheus

Cherry Pick
Publiée le
Grafana
Prometheus
Python

12 mois
480-530 €
Paris, France
Voici une fiche de poste structurée pour un profil Développeur Python / Observabilité (Grafana & Prometheus) . Ce type de profil est souvent à la croisée du développement Backend et de l'ingénierie SRE (Site Reliability Engineering). 📋 Fiche de Poste : Développeur Python & Observabilité Présentation de la mission En tant que Développeur Python spécialisé en observabilité, votre rôle sera de concevoir des solutions logicielles performantes tout en garantissant une visibilité totale sur l'état de santé et les performances de nos infrastructures. Vous ferez le pont entre le code applicatif et le monitoring opérationnel. 1. Missions Principales Développement Backend : Concevoir, développer et maintenir des API et des microservices robustes en Python (FastAPI, Flask ou Django). Instrumentation : Intégrer des bibliothèques client Prometheus dans les applications pour exposer des métriques métier et techniques personnalisées. Visualisation : Créer des dashboards Grafana avancés, intuitifs et pertinents pour les équipes techniques et produit. Automatisation : Développer des scripts d'automatisation pour le déploiement des agents de monitoring et la gestion des alertes ( AlertManager ). Optimisation : Analyser les goulots d'étranglement de performance et proposer des correctifs basés sur les données collectées.
Freelance

Mission freelance
Administrateur systèmes Linux H/F

HAYS France
Publiée le
Administration linux
DevOps
Google Cloud Platform (GCP)

6 mois
340-550 €
Nantes, Pays de la Loire
Notre client recherche un Administrateur Systèmes & Réseaux passionné par les infrastructures, réseaux, cloud et DevOps. Missions : administrer et sécuriser systèmes Linux/Windows ; gérer réseau interne (switches, routeurs, VPN, firewall, VLAN) ; implémenter DevOps (CI/CD GitLab/Jenkins, IaC Terraform/Ansible/Puppet, conteneurisation Docker/Kubernetes) ; déployer cloud (AWS/Azure/GCP) ; superviser (Prometheus/Grafana/Zabbix/ELK) ; diagnostiquer incidents ; évoluer architecture ; assurer sécurité/RGPD/ISO ; documenter. Poste technique varié.
Freelance
CDI

Offre d'emploi
Administrateur.trice OpenShift

Atlanse
Publiée le
Ansible
Cloud
Docker

3 ans
55k-65k €
400-500 €
Île-de-France, France
Vous interviendrez au sein de l’équipe Infrastructure CaaS (Container as a Service) et serez en charge des plateformes OpenShift supportant les applications critiques. Missions Administration des plateformes OpenShift · Déployer, configurer et maintenir les clusters OpenShift · Garantir la disponibilité, la performance et la résilience des plateformes · Superviser les environnements (logs, métriques, alertes) et gérer les incidents · Assurer le support aux équipes utilisatrices Automatisation et industrialisation · Automatiser les déploiements et configurations via Ansible / scripts · Industrialiser les opérations récurrentes (provisioning, scaling, mises à jour) · Contribuer à l’amélioration des chaînes CI/CD en lien avec les équipes DevOps Sécurité et gouvernance · Mettre en œuvre les bonnes pratiques de sécurité OpenShift (RBAC, gestion des accès, politiques réseau) · Gérer les vulnérabilités et appliquer les correctifs · Veiller à la conformité avec les standards internes et réglementaires · Participer à la définition et à l’application des règles de gouvernance des clusters Amélioration continue et collaboration · Assurer le lien avec les équipes opérationnelles et les partenaires métiers sur les sujets liés aux conteneurs · Proposer des optimisations (performance, coûts, architecture) · Réaliser une veille technologique sur les écosystèmes Kubernetes / OpenShift / Cloud
Freelance

Mission freelance
Administrateur de Bases de Données

Phaidon London- Glocomms
Publiée le
Ansible
AWS Cloud
Dynatrace

3 mois
Paris, France
Administrateur de Bases de Données – Cloud & Automatisation Client : Prestataire mondial de technologies et de services Lieu : Nanterre Contrat : 3 mois À propos de l’entreprise Notre client est une organisation internationale de premier plan spécialisée dans les opérations technologiques sécurisées à grande échelle et les solutions numériques pour les environnements de travail. Avec une forte culture d’excellence technique et de fiabilité opérationnelle, l’entreprise soutient des millions d’utilisateurs dans plusieurs régions grâce à des infrastructures robustes, des initiatives de transformation cloud et des systèmes critiques. Elle est reconnue pour son haut niveau d’exigence, son modèle de delivery structuré et sa capacité à gérer des environnements technologiques complexes à l’échelle mondiale. Présentation du rôle L’équipe mondiale d’ingénierie des bases de données recherche un Administrateur de Bases de Données Senior pour accompagner des projets de transformation cloud, des initiatives d’automatisation et l’amélioration continue de la fiabilité des plateformes Oracle et SQL. Ce rôle couvre des activités d’ingénierie, de migration, de support d’incidents et d’optimisation de plateformes, au sein d’une équipe technique collaborative. Le poste exige une solide expertise Oracle, une expérience en migration vers le cloud (AWS), des compétences en automatisation, ainsi que la capacité à soutenir des services critiques de bases de données en zone EMEA. La mission inclut l’ingénierie, la supervision, la résolution d’incidents, la réplication, la sauvegarde, la reprise après sinistre et l’amélioration des frameworks d’automatisation. Une participation aux astreintes sera requise. Responsabilités principales Contribuer aux efforts d’ingénierie au sein d’une équipe DBA globale, en soutien aux initiatives de transition cloud et d’optimisation d’infrastructure. Diriger les activités de migration cloud, d’automatisation, d’ingénierie de réplication et de frameworks d’auto‑réparation. Consolider et améliorer les métriques, dashboards et solutions de supervision. Assurer le support des serveurs Oracle et SQL en EMEA : incidents, changements, migrations et plans de continuité (DRP). Mettre en œuvre et maintenir les solutions de sauvegarde, clonage et restauration (DATAPUMP, RMAN). Travailler sur les technologies de réplication, notamment GoldenGate et DataGuard. Collaborer avec des équipes transverses dans le cadre de projets d’ingénierie internationaux. Participer aux rotations d’astreinte. Compétences & Qualifications requises Minimum 5 ans d’expérience en administration Oracle. Connaissance d’autres technologies telles que SQL Server, MongoDB, PostgreSQL, Hadoop (atout). Solide exposition à AWS et aux migrations cloud. Expérience sur les clusters Oracle RAC. Maîtrise des solutions de sauvegarde, clonage et migration via DATAPUMP et RMAN. Expertise en reprise après sinistre via DataGuard. Solide expérience Linux (Red Hat). Connaissance d’outils de supervision : OEM, Sitescope, Prometheus, Dynatrace. Compétences en automatisation et scripting (Python, Java, PowerShell, Terraform). Expérience CI/CD ou d’orchestration d’automatisation (Ansible, AWX ou équivalent). Maîtrise de l’anglais (lu/parlé/écrit).
Freelance

Mission freelance
Devops SRE

Ness Technologies
Publiée le
Argo CD
GitLab CI
Grafana

6 mois
Île-de-France, France
Contexte du poste Au sein de l’équipe Site Reliability Engineering (SRE) , vous intervenez sur des plateformes Cloud critiques avec un rôle central dans la fiabilité, la performance et la scalabilité des environnements de production. Le poste est fortement orienté RUN, automatisation et excellence opérationnelle , avec un focus majeur sur OpenShift en production . Vous participez activement à la conception, à l’exploitation et à l’amélioration continue des plateformes Cloud (public, privé ou hybride), dans une logique SRE et DevOps avancée. Missions principalesOpérations & Fiabilité Garantir la stabilité, la résilience et les performances des environnements Cloud et OpenShift. Participer au déploiement, au monitoring, au troubleshooting et à l’optimisation des applications en production. Définir, mettre en œuvre et améliorer les SLO, SLI et SLA . Automatiser les opérations de production dans une approche Infrastructure as Code et GitOps . Engineering & Automatisation Concevoir, développer et maintenir des pipelines CI/CD (GitLab CI). Gérer l’infrastructure via Terraform et Helm . Contribuer au design et à l’évolution des architectures Cloud (Public / Private / Hybrid). OpenShift & Kubernetes Administrer et exploiter des clusters OpenShift : installation, mises à jour, capacity planning gestion des opérateurs sécurité et durcissement des plateformes Améliorer la fiabilité de la plateforme OpenShift et accompagner les équipes de développement dans son usage. Gérer les sujets réseau, stockage, logging et monitoring en environnement Kubernetes / OpenShift. Collaboration & Culture SRE Travailler en étroite collaboration avec les équipes Développement, Sécurité, Infrastructure et Produit . Documenter, partager les bonnes pratiques et contribuer à une démarche d’amélioration continue . Compétences requisesCompétences techniques – Must Have Maîtrise avancée d’OpenShift en environnement de production . Solide expérience sur Kubernetes . Très bonne connaissance des pratiques DevOps / SRE et des outils associés : GitLab CI/CD Terraform Helm Prometheus / Grafana Argo CD Bonne expertise des environnements Cloud . Excellente compréhension : des architectures microservices des API REST des patterns de résilience (autoscaling, circuit breaker, etc.). Compétences complémentaires – Nice to Have Expérience OpenShift à grande échelle / très forte production . Pratiques GitOps avancées (Argo CD, Flux). Connaissances en sécurité Cloud : RBAC gestion des secrets network policies Scripting : Python, Bash, Go (optionnel).
Freelance
CDI

Offre d'emploi
Administrateur Systèmes Windows/Linux

Groupe Aptenia
Publiée le
Administration linux
Administration Windows
Azure Active Directory

1 an
Île-de-France, France
Installer, configurer et exploiter des serveurs Windows et Linux physiques et virtuels (VMWare) Administrer les services Windows : AD, DHCP, DNS, RDS, GPO, WSUS Gérer le patch management Windows/Linux et son automatisation multi-environnements Assurer la cybersécurité : gestion EDR (CrowdStrike), PAM (Wallix), MFA et droits d'accès Superviser les performances et assurer l'observabilité via Grafana, Azure Monitor, CloudWatch Exploiter et suivre les sauvegardes (CommVault, LTO Quantum) Administrer le tenant Microsoft O365 et Azure AD Connect Diagnostiquer et résoudre les incidents systèmes en lien avec les constructeurs/éditeurs Contribuer aux migrations et à l'industrialisation des déploiements Cloud (IaaS/PaaS) Rédiger et maintenir la documentation technique et les procédures d'exploitation Assurer le support technique aux équipes métiers et production de la DSI Effectuer une veille technologique sur les infrastructures systèmes et Cloud
Freelance

Mission freelance
Expert Kafka - Elastic H/F

AGH CONSULTING
Publiée le
Ansible
Apache Kafka
CI/CD

6 mois
300-480 €
Niort, Nouvelle-Aquitaine
Dans le cadre du développement et de l'industrialisation d'une plateforme de streaming de données, nous recherchons pour notre client, un(e) Expert Kafka capable d'accompagner les équipes techniques dans la mise en place, l'automatisation et l'optimisation de la plateforme. Le consultant interviendra au sein d'une squad en collaboration étroite avec les équipes internes afin d'améliorer les pratiques d'exploitation, d'industrialisation et de supervision de l'environnement. A ce titre, vos principales missions seront les suivantes : -Accompagner les équipes dans le choix et l'utilisation des solutions techniques -Participer à l'industrialisation et l'automatisation de la plateforme Kafka -Contribuer aux études techniques et développements -Définir et faire appliquer les normes, méthodes et outils -Assurer une veille technologique et informer sur les évolutions Livrables attendus -Production de dossiers d'expertise -Mise à jour des dossiers d'architecture -Mise à jour des éléments de suivi dans JIRA -Production de livrables techniques et référentiels d'expertise
CDI

Offre d'emploi
Consultant DataOps / Administrateur Hadoop

Craftman data
Publiée le
Ansible
CI/CD
Docker

La Défense, Île-de-France
Dans le cadre de ses projets Big Data internes, notre client recherche un Consultant DataOps & Administrateur Hadoop confirmé , intégré à l’équipe BDP (Big Data Platform) . Le consultant interviendra sur le déploiement, l’industrialisation, l’exploitation et le maintien en condition opérationnelle de clusters Big Data personnalisés, basés sur la TOSIT Data Platform (TDP) , au service des projets data et métiers. 🎯 Rôle et responsabilités 1. Déploiement & industrialisation des clusters Big Data Déploiement automatisé de clusters via pipelines Jenkins Installation et configuration des composants Hadoop via Ansible Adaptation des architectures selon les besoins projets (sécurité, performance, capacité) Contribution aux pratiques CI/CD et Infrastructure as Code Déploiement et administration du TDP Manager Mise en place de Hue pour les environnements Datalab 2 . Administration avancée de la stack Hadoop / TDP Le consultant est responsable de l’installation, la configuration et l’exploitation de : Sécurité & identités : OpenLDAP Kerberos Ranger (politiques de sécurité) Stockage & calcul distribué : HDFS (baie Huawei) Hadoop (YARN, services core) Traitement & accès aux données : Spark Hive Services transverses : ZooKeeper PostgreSQL Responsabilités associées : Gestion des dépendances inter-services Cohérence des versions Optimisation des performances et de la stabilité Résolution des incidents complexes 3. Provisionnement & automatisation des environnements Provisionnement de VM sous VMware Préparation des prérequis systèmes (OS, réseau, stockage) Automatisation via Ansible et scripts Bash Gestion des environnements DEV / RECETTE / PROD 4. Observabilité, supervision & anticipation Mise en œuvre et maintien de la stack d’observabilité : Prometheus Alertmanager Loki / Promtail Grafana Définition des indicateurs de supervision Analyse proactive des alertes Diagnostic et résolution d’incidents 5. Maintien en Condition Opérationnelle (MCO) Administration quotidienne des clusters Hadoop Support aux équipes projets et utilisateurs Datalab Gestion des incidents, demandes d’évolution et correctifs Montées de version Suivi de capacité (CPU, RAM, stockage) Rédaction et mise à jour de la documentation technique 🤝 Interaction & posture attendue Participation active aux rituels d’équipe Coordination avec : Équipes infrastructure Équipes projets data / métiers Référents sécurité Capacité à accompagner et conseiller les équipes dans l’usage de la plateforme Forte capacité de communication transverse 🧠 Compétences clés attendues Techniques Expertise Hadoop / Big Data on-prem Solide expérience DataOps / DevOps Maîtrise de : Jenkins, GitLab CI/CD, SonarQube Ansible, Bash VMware, Docker Stack d’observabilité (Prometheus, Grafana, Loki) Méthodologiques & soft skills : Rigueur et sens de la qualité Forte sensibilité aux enjeux de sécurité Capacité d’anticipation (supervision, performance, capacité) Autonomie et esprit d’équipe Aisance dans des environnements complexes et critiques ⚠️ Points de vigilance Forte interdépendance des composants Hadoop Exigences élevées en matière de sécurité (Kerberos, Ranger) Enjeux de performance et de disponibilité Nécessité d’une coordination transverse permanente
Freelance

Mission freelance
Expert Observabilité Datadog

Comet
Publiée le
AWS Cloud
Datadog
Grafana

12 mois
400-550 €
Île-de-France, France
Compétences techniques : Datadog - Expert - Impératif Cloud AWS - Confirmé - Important Prometheus/Grafana - Confirmé - Important Vos principales missions : Optimisation et structuration de l’écosystème Datadog Analyser l’implémentation actuelle de Datadog (Logs, APM, Monitors, RUM, Product Analytics) afin d’identifier des axes d’amélioration Harmoniser et consolider les standards existants (naming convention, tagging strategy, gestion des environnements, structure des dashboards et monitors) Améliorer la cohérence et la qualité de l’instrumentation entre les différentes équipes Optimiser l’usage de la plateforme (volumétrie logs, sampling APM, gestion des coûts, rétention)Fiche de poste Expert Observabilité Datadog Définir et partager des bonnes pratiques d’observabilité applicative, infrastructure et produit Contribuer à la stratégie globale de monitoring en complément de Prometheus / Grafana utilisés pour les métriques techniques Supervision, observabilité et fiabilité (SRE) Concevoir, mettre en œuvre et maintenir des dashboards Datadog adaptés aux enjeux Infrastructure, Applicatifs et Produit Structurer et améliorer les monitors et l’alerting (pertinence, réduction du bruit, meilleure corrélation incidents) Formaliser des indicateurs de performance et de fiabilité (SLI / SLO) en collaboration avec les équipes techniques et service management Améliorer la détection proactive des incidents Assurer la complémentarité et la cohérence entre métriques Prometheus/Grafana et observabilité Datadog Accompagnement des équipes et adoption Une forte dimension transverse et pédagogique est attendue : Accompagner les équipes de développement dans l’instrumentation APM, Logs et RUM Collaborer avec les équipes Ops et Service Management pour améliorer l’exploitation des données de monitoring Travailler avec les équipes Produit sur la valorisation des données RUM et Product Analytics Produire et maintenir une documentation claire sur les standards et recommandations définis Match : Formation & expérience : Expérience significative sur Datadog (Logs, APM, Monitors ; RUM et Product Analytics appréciés) Une expérience en environnement Cloud AWS et Infrastructure as Code (Terraform) est un plus Compétences techniques : Datadog : Logs, APM, RUM, Product Analytics, Dashboards, Monitors, SLO Observabilité : compréhension des concepts SLI/SLO, tracing distribué, corrélation logs/métriques/traces Monitoring : Prometheus, Grafana Bonne compréhension des architectures web et performance front (Web Vitals) Compétences transverses : Rigueur, réactivité et esprit analytique Capacité à améliorer l’existant de manière pragmatique Pédagogie et capacité à collaborer avec des équipes pluridisciplinaires (dev, ops, qa, produit, support)
53 résultats

Contrats

Freelance CDI CDD Alternance Stage

Lieu

Télétravail

Télétravail partiel Télétravail 100% Présentiel

Taux Journalier Moyen min.

150 € 1300 € et +

Salaire brut annuel min.

20k € 250k €

Durée

0 mois 48 mois

Expérience

≤ 2 ans d’expérience 3 à 5 ans d’expérience 6 à 10 ans d’expérience > 10 ans d’expérience

Publication

Au service des talents IT

Free-Work est une plateforme qui s'adresse à tous les professionnels des métiers de l'informatique.

Ses contenus et son jobboard IT sont mis à disposition 100% gratuitement pour les indépendants et les salariés du secteur.

Free-workers
Ressources
A propos
Espace recruteurs
2026 © Free-Work / AGSI SAS
Suivez-nous