Trouvez votre prochaine offre d’emploi ou de mission freelance Site Reliability Engineering (SRE)
Votre recherche renvoie 35 résultats.
Offre d'emploi
Consultant Dynatrace
KLETA
Publiée le
Dynatrace
Site Reliability Engineering (SRE)
3 ans
Paris, France
Dans le cadre d’un programme de modernisation de la supervision, nous recherchons un Consultant Observabilité expert Dynatrace pour concevoir et optimiser des dispositifs de monitoring avancés sur des environnements complexes. Vous analyserez l’existant, définirez une stratégie d’instrumentation et piloterez le déploiement de Dynatrace sur l’ensemble du périmètre (infrastructure, applications, microservices, Kubernetes, cloud). Vous serez responsable de la configuration des OneAgents, de l’optimisation des alertes basées sur l’IA de Dynatrace et de la mise en place de dashboards pertinents pour les équipes techniques et métiers. Vous travaillerez sur la corrélation automatique des métriques, traces et logs afin d’améliorer la détectabilité et la résolution des incidents. Vous accompagnerez les équipes DevOps et SRE dans l’intégration de Dynatrace dans les pipelines CI/CD et les pratiques d’exploitation. Vous participerez également à l’analyse des incidents, à l’amélioration continue des règles de monitoring et à la formation des équipes sur l’usage avancé de Dynatrace.
Offre d'emploi
SRE Data et IA
VISIAN
Publiée le
DevOps
Site Reliability Engineering (SRE)
1 an
40k-45k €
400-650 €
Île-de-France, France
Descriptif du poste Le bénéficiaire souhaite une prestation d'accompagnement afin de garantir la disponibilité, la performance et la résilience des services en production. Le/La SRE anticipe les risques, accompagne les équipes Dev/Prod et développe l'automatisation nécessaire pour assurer un fonctionnement optimal des plateformes, avec une spécificité sur la gestion des applications Data et IA. Responsabilités principales Suivi de la fiabilité, l'intégrité et la qualité de la plateforme en production Définition et suivi des SLO/SLI ; rétablissement du service en cas d'incident Participation aux projets dès le cadrage et anticipation des impacts sur la production Automatisation des opérations et réduction du travail manuel Mise en place d'un monitoring, de l'alerting et des dashboards pertinents Pilotage de l'obsolescence et contribution à la sécurité opérationnelle Contribution à la communauté SRE : bonnes pratiques, partage d'expérience Compétences clés Techniques : Connaissances des solutions Data & AI (ex : Airflow, Spark, Starburst, Domino AI …) Linux (RHEL), Docker, Kubernetes / OpenShift Automatisation & IaC : Git, Jenkins (CI/CD), Ansible, Terraform Scripting : Python, Shell, YAML Observabilité & Monitoring : ELK, SysDig, Dynatrace, Grafana Supervision / Scheduling : Control-M Cloud : IBM Cloud
Offre d'emploi
Consultant Dynatrace
KLETA
Publiée le
Dynatrace
Site Reliability Engineering (SRE)
3 ans
Paris, France
Dans le cadre d’un programme de modernisation de la supervision, nous recherchons un Consultant Observabilité expert Dynatrace pour concevoir et optimiser des dispositifs de monitoring avancés sur des environnements complexes. Vous analyserez l’existant, définirez une stratégie d’instrumentation et piloterez le déploiement de Dynatrace sur l’ensemble du périmètre (infrastructure, applications, microservices, Kubernetes, cloud). Vous serez responsable de la configuration des OneAgents, de l’optimisation des alertes basées sur l’IA de Dynatrace et de la mise en place de dashboards pertinents pour les équipes techniques et métiers. Vous travaillerez sur la corrélation automatique des métriques, traces et logs afin d’améliorer la détectabilité et la résolution des incidents. Vous accompagnerez les équipes DevOps et SRE dans l’intégration de Dynatrace dans les pipelines CI/CD et les pratiques d’exploitation. Vous participerez également à l’analyse des incidents, à l’amélioration continue des règles de monitoring et à la formation des équipes sur l’usage avancé de Dynatrace.
Offre d'emploi
Ingénieur DevOps SRE / Java
AIS
Publiée le
DevOps
Java
Site Reliability Engineering (SRE)
1 mois
40k-48k €
240-480 €
Nantes, Pays de la Loire
Intégrée aux équipes d'un de nos clients grands compte, vos missions seront les suivantes : - Mettre à disposition et faire évoluer les outils et les pratiques associées dans un contexte DevSecOps - Administrer / superviser les solutions hébergés sur Openshift et nos Clouds Azure/Scaleway - Accompagner les équipes sur les dimensions performance, robustesse, sécurité et fiabilité tout au long du cycle de vie des produits SI - Contribuer à la mise à disposition des environnements - Automatiser et industrialiser dans une logique « DevOps » pour servir le déploiement continu - Contribuer à, et garantir, l'exploitabilité et l'observabilité des produits - Préconiser les éléments liés au Capacity planning - Evaluer les risques et impacts techniques lors d'une mise en production - Etre garant de la complétude du dossier d'exploitabilité - Contribuer à l'amélioration continue du produit Environnement technique : - Déploiement : Kubernetes / Openshift, Helm, Azure, Terraform - Observabilité : Dynatrace, Grafana, Prometheus, Kibana - CI/CD : Github, Jenkins, Ansible - Testing-Performance : Jmeter, Postman, Gatling - Développement : Java - Bonnes pratiques Devops et/ou SRE
Mission freelance
Expert automatisation CI/CD - Devops
KERNET
Publiée le
CI/CD
DevOps
Site Reliability Engineering (SRE)
24 mois
600-650 €
Boulogne-Billancourt, Île-de-France
Contexte Au sein des équipes Infrastructure/Production d’un grand groupe, vous contribuez à l’industrialisation des opérations et à la standardisation des pratiques SysOps/DevOps. Votre objectif : réduire le run, sécuriser les environnements et accélérer les mises en production via l’automatisation, l’Infrastructure as Code et une plateforme conteneurisée à l’échelle. Mission principale ✔️ Définir et déployer des automatisations d’exploitation : provisioning, configuration, patching, remédiation et contrôles. ✔️ Concevoir des modules d’Infrastructure as Code (Terraform) et d’automatisation (Ansible) avec une logique réutilisable et versionnée (Git). ✔️ Industrialiser les déploiements applicatifs et plateformes : Docker, Kubernetes et OpenShift (templates, opérateurs, Helm/manifestes). ✔️ Contribuer à la qualité et à la robustesse des chaînes CI/CD (GitOps, contrôles, standards, documentation) en lien avec les équipes dev et run. ✔️ Automatiser les opérations autour des OS Linux (Debian, Red Hat) et des bases de données (MariaDB, MySQL, Oracle) : sauvegarde, supervision, durcissement, mises à jour. ✔️ Accompagner les équipes produits sur des environnements e-commerce et CMS (Hybris, EZ Publish) : packaging, déploiement, exploitation, continuité de service. ✔️ Produire la documentation d’exploitation et les procédures, assurer le transfert de compétences et participer au support de niveau avancé.
Mission freelance
Scrum Master Technique – CoE Observabilité / Dynatrace
UTALENT
Publiée le
Agile Scrum
Dynatrace
Site Reliability Engineering (SRE)
12 mois
Marseille, Provence-Alpes-Côte d'Azur
Au sein du Center of Excellence, le Scrum Master Technique accompagne une équipe d’experts en charge du déploiement, de l’industrialisation et de l’adoption des pratiques d’observabilité au sein du SI. Il/elle intervient à la fois comme facilitateur Agile, coach d’équipe et partenaire des équipes techniques (Ops, SRE, Dev, Architecture) pour structurer les chantiers autour de Dynatrace et des outils d’observabilité (metrics, logs, traces, alerting, SLO). Son rôle est d’optimiser la delivery de valeur du CoE, de fluidifier les interactions avec les équipes consommatrices, et de contribuer à la structuration des standards et bonnes pratiques observabilité à l’échelle de l’entreprise. Il/elle s’appuie sur Jira et Confluence pour organiser le travail, assurer la visibilité des chantiers et capitaliser sur la documentation et les retours d’expérience.
Offre d'emploi
Mission freelance - DevOps SRE – Production & Monitoring Azure / Dynatrace - PARIS
KUBE Partners S.L. / Pixie Services
Publiée le
Azure DevOps
DevOps
Site Reliability Engineering (SRE)
3 ans
Paris, France
Bonjour à tous ! pour renforcer l'équipe de l'un de nos clients, je recherche un(e) : DevOps SRE Production Monitoring Azure Dynatrace Le client recherche un DevOps orienté SRE avec une forte expérience en production et en Run. Il travaillera avec l’équipe projet pour mettre en place le monitoring et assurer le suivi. Missions : Mise en place et suivi du monitoring sur un environnement Azure avec Dynatrace. Gestion des alertes et du suivi liés au monitoring. Compétences : Expérience DevOps/SRE en production. Maîtrise de GitHub, Azure et Dynatrace. Solide expérience en monitoring. Informations complémentaires : Localisation : Paris (2 à 3 jours de télétravail par semaine) Durée : Long terme (3 ans) - démarrage sous 1 mois MAX Statut : Freelance ou portage Profil recherché : DevOps/SRE autonome, orienté production, avec une forte expertise en monitoring sur Azure et Dynatrace. Si vous êtes intéressé(e) et que votre profil correspond, merci d’envoyer votre CV à jour. Je reviendrai vers vous rapidement pour échanger. Merci
Offre d'emploi
CDI - SRE AWS (H/F)
BLOOMAYS
Publiée le
AWS Cloud
CI/CD
Site Reliability Engineering (SRE)
60k-85k €
Paris, France
Environnement Cloud & Production Critique Contexte : Au sein d’une organisation internationale disposant d’un écosystème digital à forte exposition, vous rejoignez l’équipe Infrastructure. Votre rôle est central dans la garantie de la fiabilité, de la performance et de la disponibilité des services numériques en production. Vous travaillez en étroite collaboration avec les équipes de développement afin de concevoir, déployer et maintenir des systèmes répondant à des standards élevés de qualité, sécurité et résilience. Missions principales : 1. Pilotage de l’infrastructure au sein des feature teams Intégré à une ou plusieurs équipes produit, vous êtes responsable du backlog infrastructure associé. À ce titre, vous : Gérez les sujets d’infrastructure dans les backlogs produits Collaborez avec les Product Owners et Tech Leads pour définir la stratégie technique locale Participez aux rituels agiles des équipes Consolidez et pilotez la capacité de traitement des sujets infra Priorisez les demandes de Build en fonction des enjeux business et techniques 2. Build & Infrastructure as Code Concevoir et déployer l’infrastructure nécessaire aux applications (serveurs, bases de données, réseau, etc.) Garantir la qualité, la stabilité et la sécurité des environnements déployés Mettre en œuvre et maintenir l’Infrastructure as Code Valider les Merge Requests liées à l’infrastructure Adapter la répartition des sujets en fonction de la maturité technique des équipes Encourager le partage de connaissances (pair programming, mentoring) 3. Observabilité & Performance Concevoir et maintenir les systèmes de monitoring et d’alerting Contribuer aux tests de performance Améliorer la fiabilité, la disponibilité et la scalabilité des services Planifier et optimiser la capacité des infrastructures 4. Incident Management & Production Gérer les incidents en environnement de production critique Participer aux analyses post-mortem et à l’amélioration continue Mettre en place des plans de reprise d’activité (Disaster Recovery) Garantir la conformité aux standards de sécurité 5. Automatisation & Optimisation Automatiser les tâches répétitives Optimiser les coûts cloud et l’utilisation des ressources Maintenir une documentation claire et à jour Accompagner et former les développeurs sur les bonnes pratiques SRE Environnement technique Cloud & Containers AWS, Kubernetes, Docker Infrastructure as Code & Automation Terraform, Helm, Kustomize, Ansible CI/CD & GitOps GitLab CI, Jenkins, ArgoCD Observabilité Prometheus, Grafana, Loki, Tempo Data & Messaging PostgreSQL, MySQL, MongoDB Kafka / systèmes de messaging Sécurité Vault, gestion d’identité (OIDC / SSO)
Offre premium
Mission freelance
DevOps Engineer / SRE (Expert OpenShift)
MEETSHAKE
Publiée le
DevOps
Gitlab
Grafana
6 mois
Paris, France
Au sein de l'équipe SRE, votre mission dépasse la simple maintenance : vous êtes l'architecte de la résilience. Vous intervenez sur des environnements Cloud hybrides à forte échelle avec un focus majeur sur l'écosystème Red Hat OpenShift . Fiabilisation : Définition et suivi des indicateurs critiques (SLI/SLO) et gestion des Error Budgets pour garantir une disponibilité optimale. Automatisation Totale : Industrialisation de l’infrastructure via Terraform et pilotage des déploiements en mode GitOps avec ArgoCD. Expertise Kubernetes : Administration avancée des clusters, gestion du cycle de vie des opérateurs, optimisation du SDN et du stockage persistant. Continuous Delivery : Évolution et sécurisation des pipelines GitLab CI pour fluidifier le passage en production des microservices.
Mission freelance
Expert Supervision & Observabilité / Chapter Lead
LINKWAY
Publiée le
Automatisation
CI/CD
DevOps
8 mois
Paris, France
Vous occupez un rôle stratégique et transverse visant à transformer la culture de la fiabilité au sein de l'organisation. Votre objectif est de passer d'une surveillance réactive à une observabilité proactive . Vos 3 piliers d'intervention Expertise Technique (ELK / Zabbix) : Définir les standards de monitoring, configurer les outils et exploiter les données (logs, métriques, traces) pour garantir la stabilité du SI. Pilotage de la Performance : Optimiser la réponse aux incidents (réduction du MTTR) et instaurer des indicateurs de fiabilité rigoureux ( SLO/SLA ). Leadership : En tant que "Chapter Lead", vous coachez les squads agiles, diffusez la culture SRE/DevOps et accompagnez les équipes dans l'appropriation des outils de supervision.
Offre d'emploi
Ingénieur DevOps SRE Azure
AIS
Publiée le
Azure
DevOps
Site Reliability Engineering (SRE)
1 mois
45k-48k €
240-480 €
Niort, Nouvelle-Aquitaine
🎯 MISSIONS : Intégré(e) aux équipes d'un de nos clients grands comptes vos missions seront les suivantes : - Identifier, dès la phase d'idéation, avec les concepteurs et les développeurs, les éléments permettant l'exploitabilité, la performance et la supervision sur tout le cycle de vie des produits - Accompagner la squad sur les dimensions performance, robustesse, sécurité et fiabilité tout au long du cycle de vie des produits SI - Contribuer à la mise à disposition des environnements - Automatiser et industrialiser dans une logique « DevOps » pour servir le déploiement continu - Contribuer à, et garantir, l'exploitabilité et l'observabilité des produits - Contribuer à l'amélioration continue du produit - Préconiser les éléments liés au Capacity planning - Etre garant de la complétude du dossier d'exploitabilité Connaissances technique : - Des bonnes pratiques Devops et/ou SRE - Observabilité : Grafana, Prometheus, Alertmanager, Dynatrace, Kibana, ... - Hébergement application : Azure, Kubernetes... - CI/CD : Pulumi, Helm, Github, Ansible, Jenkins... - Testing - Performance : Jmeter, Postman, Gatling..
Mission freelance
Piloter Site Reliability Engineer (SRE) Transverse
HAYS France
Publiée le
Datadog
Google Cloud Platform (GCP)
Scripting
3 ans
100-460 £GB
Lille, Hauts-de-France
Site Reliability Engineer (SRE) Transverse - Plateforme CCDP Au sein de la Customer & Commerce Digital Platform (CCDP), vous interviendrez en tant que Site Reliability Engineer (SRE) Transverse. Votre rôle est clé : apporter une expertise technique pointue, soutenir les équipes Produit et garantir l'excellence opérationnelle de la plateforme. Nous recherchons un profil axé sur l'Ingénierie de la Fiabilité et l'Automatisation pour scaler nos services. Vos Responsabilités Clés Ingénierie de la Fiabilité (SRE) : Piloter l'amélioration continue de la stabilité, performance et résilience de la plateforme. Accompagner les équipes Produit dans la définition et le suivi des SLOs/SLIs (Service Level Objectives/Indicators). Gérer et analyser les incidents de production (incident response et post-mortems sans reproche). Automatisation & Réduction du Toil : Identifier, développer et déployer des outils d'automatisation (scripts, IaC) pour réduire le "Toil" des équipes de niveau 1 et 2, augmentant ainsi l'efficacité opérationnelle. Renforcer les pratiques d'Observabilité (métriques, logs, tracing) pour un diagnostic proactif. Expertise et Conseil : Apporter votre savoir-faire pour garantir la continuité de service et assister quotidiennement les équipes dans l'adoption des meilleures pratiques SRE (Infrastructure, Sécurité, Gestion des changements). Compétences Recherchées Solide expérience en tant que SRE ou DevOps/Software Engineer avec une forte culture fiabilité. Maîtrise de l'automatisation (Python/Go, Bash) et de l'Infrastructure as Code (Terraform). Connaissance approfondie de l'écosystème Kubernetes et Cloud.
Mission freelance
Ingénieur DevOps SRE
BEEZEN
Publiée le
Ansible
Argo CD
DevOps
12 mois
500-550 €
Montreuil, Île-de-France
Je recherche un Ingénieur DevOps SRE pour une prestation d’accompagnement dans le cadre d'ingénierie DevOps / SRE spécialisé dans les toolchains (ArgoCD, Jenkins, Helm, Gitlab CI, Ansible...) et support de production Les missions sont : • Appropriation du contexte de mon client bancaire • Conception, industrialisation et fiabilisation les pipelines CD sur les technologies IaaS, CaaS • Apport d'un soutien technique en tant que référent sur la toolchain CD (partie APS) • Accompagnement : o sur le terrain des nouveaux arrivants/APS dans l’adoption des bonnes pratiques o des bonnes pratiques et support aux utilisateurs en réalisant le debug des pipelines de déploiement, o des bonnes pratiques IKs / Roks • Prise en charge le support production N2/N3 : analyse, diagnostic et résolution d’incidents complexes. • Contribution à la réduction du bruit opérationnel et des incidents récurrents via l’automatisation et l’amélioration continue. • Participation aux post-mortems, analyses d’incidents et plans d’actions correctifs Compétences : • Maitrise des technologies CD : Jenkins, Helm, Gitlab CI, Ansible, ArgoCD • Maîtrise du scripting • Partage des connaissances • Aisance à l'oral pour réalisation des présentations techniques • Rédaction de support de présentation • Niveau Anglais Technique écrit et oral exigé
Offre d'emploi
Expert Dynatrace H/F
INFOTEL CONSEIL
Publiée le
Dynatrace
Site Reliability Engineering (SRE)
6 mois
40k-45k €
400-550 €
Niort, Nouvelle-Aquitaine
Activités principales Déployer et paramétrer Dynatrace pour superviser la santé des applications et des infrastructures. Accompagner les clients internes dans le diagnostic de panne et l’analyse de performance. Automatiser les opérations récurrentes autour de Dynatrace. Produire et proposer des dashboards Dynatrace adaptés aux besoins. Assurer le support en lien avec l'éditeur et gérer les incidents/problèmes. Contribuer à la montée en compétence de l’équipe et proposer de nouveaux usages. Livrables attendus Dossiers d’expertise Scripts d’automatisation Dashboards Dynatrace Accompagnement métier / ateliers de diagnostic
Mission freelance
Support Engineer
CAT-AMANIA
Publiée le
Apache Kafka
Java
Kubernetes
1 an
100-360 €
Lille, Hauts-de-France
Participer au traitement des tickets support de niveau 2 / Animer et accompagner le support de niveau 1 / Prioriser et suivre le support de niveau 3 avec les équipes de développeurs Assurer la conduite du changement en participant aux livraisons en production de nos releases Designer et exploiter nos solutions de monitoring/alerting (Datadog & Grafana) pour permettre d’anticiper les bugs avant qu’ils ne diminuent le niveau de service rendu à nos utilisateurs Garantir le niveau de service de l’application en animant la démarche SRE au sein des équipes Gérer les incidents de production Identifier les problèmes récurrents via la recherche de root cause, définir les plans d’actions avec les équipes produits et les applications partenaires Être force de proposition afin d'améliorer la qualité opérationnelle, les performances et la disponibilité des solutions Mettre en place ou contribuer au développement des outils de demain qui accompagnent la transformation du métier (automatisation, industrialisation, …) Documenter les process du Run afin de rendre autonomes les équipes produits et déploiement dans leurs réponses à nos utilisateurs
Offre d'emploi
Developpement SRE Platform
LEVUP
Publiée le
Développement
Site Reliability Engineering (SRE)
3 mois
Île-de-France, France
- Participe à l'analyse détaillée des besoins fonctionnels et techniques - Code la solution (logiciel, application, système...) - Réalise la documentation associée - Implémente la solution avec les technologies retenues - Qualifie les systèmes d'un point de vue technique et fonctionnel , - Valide les spécifications fonctionnelles détaillées - Pilote les prestataires impliqués dans le développement de la solution Développements conformes aux besoins exprimés Documentation technique Composants testés, qualifiés et validés
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
35 résultats
Contrats
Lieu
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois