Le poste Lead data engineer Databricks
Partager cette offre
Dans le cadre d’un programme de replatforming B2C, une organisation internationale construit une Data Platform centralisée à l’échelle mondiale, aujourd’hui fragmentée. L’objectif est de mettre en place une plateforme cloud-native, data-centric et scalable, au service des équipes data de plusieurs géographies, notamment la France, la Belgique et l’Australie.
Le Core Model du programme repose sur un modèle de données unifié couvrant notamment les données clients, contrats et facturation. Le Lead Data Engineer intervient comme référent technique de la data platform, avec une responsabilité complète sur l’architecture, le delivery et la qualité des données.
Stack technique
• Data Platform : Databricks (lakehouse), Amazon S3, Amazon Managed Apache Flink
• Gouvernance des données : Unity Catalogue, Collibra
• Visualisation : Power BI
• Cloud : AWS
• Streaming : Confluent Kafka
• Langages : Python, SQL
• IA & coding : GitHub Copilot, Claude Code, outils LLM
• Collaboration : Jira, Confluence, SonarQube
Missions principales
Stratégie & Architecture Data
• Définir l’architecture de la data platform greenfield (lakehouse, zones bronze/silver/gold, data contracts)
• Co-construire le Core Data Model commun aux différentes géographies tout en intégrant les spécificités locales
• Mettre en place la gouvernance des données, la qualité et l’observabilité
• Répondre aux besoins analytiques et fonctionnels des équipes métier via une approche de type catalogue as a service
Leadership & Delivery
• Être le référent technique data du programme
• Choisir les partenaires et structurer une feature team de 5 à 6 personnes
• Assurer la responsabilité end-to-end des pipelines, de l’ingestion à la restitution
• Gérer le monitoring, la performance et l’optimisation FinOps des workloads data
• Mettre en place les pratiques DataOps : automatisation des tests, CI/CD data, infrastructure as code
IA & Vélocité
• Exploiter GitHub Copilot, Claude Code ou équivalents pour accélérer le développement des pipelines et modèles
• Intégrer des cas d’usage IA/ML dans la data platform, incluant data science, feature store et jeux de données prêts pour les LLM
• Automatiser la génération de code, les tests de qualité des données et la documentation
• Conserver la maîtrise technique tout en augmentant la vélocité grâce à l’IA
Profil recherché
Profil recherché
Compétences indispensables
• Expertise avancée Databricks, incluant Delta Lake, Unity Catalogue, Spark et workflows
• Solide expérience AWS en environnement data, incluant S3, Glue, Kinesis ou Flink, IAM et sécurité cloud
• Mindset IA natif avec usage actif de GitHub Copilot ou équivalent comme outil principal de développement
• Maîtrise experte de Python, notamment PySpark, pandas et APIs
• Expérience de conception d’une data platform from scratch
• Culture DataOps : tests automatisés, CI/CD data, observabilité des pipelines
• Approche lean et responsabilité end-to-end
• Leadership et capacité à embarquer et structurer une équipe data
Compétences appréciées
• Expérience Unity Catalogue et gouvernance des données à l’échelle
• Connaissance de Confluent Kafka et du streaming
• Familiarité avec Collibra ou équivalent
• Expérience en data modelling dans un contexte B2C
• Déploiements IA/ML en production, incluant MLflow, feature engineering et pipelines LLM
• Expérience de contextes multi-pays ou de data platform cross-entités
Environnement de travail
Conditions
• Type de contrat : Freelance (indépendant)
• Démarrage : ASAP
• Durée prévisionnelle : 3 ans minimum
• Localisation : Colombes
• Télétravail : environ 3 jours par semaine, flexible selon l’autonomie
• TJM : à préciser selon profil
Postulez à cette offre !
Trouvez votre prochaine mission parmi +9 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Lead data engineer Databricks
LeHibou
