Le poste INGÉNIEUR DATA – DATABRICKS & AWS - DEMARRAGE LUNDI
Partager cette offre
MISSION GLOBALE :
Rattaché à la direction Data/Analytics, vous concevez, industrialisez et opérez des pipelines à l’échelle sur Databricks intégrés à l’écosystème AWS pour accélérer les cas d’usage data du secteur de l’énergie.
Vous mettez en œuvre des traitements batch et streaming avec Spark, Delta Lake et Delta Live Tables, structurez des zones Bronze/Silver/Gold et garantissez qualité, sécurité et gouvernance via Unity Catalog, IAM et Lake Formation.
Vous orchestrez l’ingestion depuis S3, bases et API/IoT, optimisez coûts et performances (FinOps) et mettez en place CI/CD, tests et observabilité. En étroite collaboration avec les Data Scientists/Analysts, vous industrialisez des modèles et fonctionnalités MLOps avec MLflow pour des usages tels que prévision consommation/production, optimisation réseau, maintenance prédictive IoT et reporting quasi-temps réel.
Vous contribuez aux standards d’ingénierie, à la documentation, au mentoring et à la fiabilité opérationnelle de la plateforme.
TÂCHES ET RESPONSABILITÉS PRINCIPALES :
• Concevoir, développer et opérer des pipelines sur Databricks (batch et streaming)
• Modéliser les données Delta Lake et structurer les zones Bronze/Silver/Gold
• Intégrer l’écosystème AWS : S3, Glue, EMR, Lambda, Step Functions, Lake Formation
• Assurer qualité, sécurité et gouvernance avec Unity Catalog et IAM
• Mettre en place CI/CD, tests et observabilité : optimiser coûts et performances
• Orchestrer les workflows (Databricks Workflows, Airflow, Step Functions/ADF)
• Industrialiser MLOps avec MLflow en lien avec les Data Scientists
• Optimiser les jobs Spark (partitionnement, Z-Ordering, AQE, caching)
• Gérer environnements, secrets, artefacts et conformité sécurité
• Collaborer avec métiers et data teams pour cadrer et livrer les use cases énergie
LIVRABLES CLÉS :
• Pipelines Databricks prêts production : traitements batch/streaming robustes et monitorés
• Modèle de données Delta Lake : zones Bronze/Silver/Gold documentées et versionnées
• Intégrations AWS opérationnelles : S3, Glue Catalog, EMR/Lambda, Lake Formation/IAM
• Cadre CI/CD et tests : pipelines de déploiement, validations data et qualité automatisées
• Observabilité et FinOps : métriques, alerting, SLO et optimisation des coûts
• Chaînes d’orchestration fiables : Databricks Workflows/Airflow/Step Functions prêtes
• Capacités MLOps avec MLflow : traçabilité, registry modèles et déploiements contrôlés
• Documentation et standards : runbooks, guides d’architecture et bonnes pratiques
Profil recherché
FORMATION ET EXPÉRIENCE REQUISES :
• 5 ans minimum d’expérience sur des problématiques de data engineering, avec une pratique confirmée de Databricks et AWS
• Bac+5 en ingénierie/informatique/data ou équivalent.
• Certifications Databricks et/ou AWS (ex : Databricks DE, AWS Data/DevOps) appréciées.
• Maîtrise de Delta Lake, Structured Streaming, Unity Catalog et services data AWS.
• Connaissance du secteur de l’énergie (marchés, cas d’usage, prévision, IoT) appréciée
Compétences techniques :
◦ Databricks: Spark, Delta Lake, Delta Live Tables, MLflow, Unity Catalog, Structured Streaming
◦ AWS : S3, Glue (ETL & Catalog), EMR, Lambda, Step Functions, IAM, Lake Formation, CloudWatch
◦ Langages : Python (PySpark), SQL, Scala apprécié
◦ Orchestration : Databricks Workflows, Airflow et/ou Step Functions/ADF
◦ CI/CD : GitHub, GitLab, tests (pytest, Great Expectations) ◦ Observabilité : CloudWatch, Log Analytics/CloudWatch Metrics, dashboards ◦ Sécurité : IAM, secrets management, encryption at rest/in transit
Compétences fonctionnelles et comportementales:
◦ Communication claire avec parties prenantes techniques et métiers
◦ Esprit d’équipe, collaboration et sens du service
◦ Autonomie, rigueur et orientation valeur/produit
◦ Gestion des priorités, résolution de problèmes
◦ Culture sécurité et conformité, sens de la qualité
◦ Pratiques Agile/Scrum et amélioration continue
Environnement de travail
CONDITIONS DE TRAVAIL :
• Lieu de prestation : Paris, France
• Date de début : 23/03/2026
• Durée de la mission : Jusqu’au 31/12/2026, renouvelable
• Télétravail : 2 jours de télétravail/semaine
• Secteur : Énergie
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
INGÉNIEUR DATA – DATABRICKS & AWS - DEMARRAGE LUNDI
LINKWAY
