Le poste Lead Data Engineer
Partager cette offre
En tant que Lead Technique Data, vous collaborez étroitement avec des data engineers, data scientists et des équipes transverses (DevOps, IoT, logiciel).
Votre mission principale consiste à concevoir, maintenir et optimiser une plateforme de données au cœur des projets d’IA.
Normaliser et structurer les données : homogénéisation des formats, conception d’ontologies, mise en place de bonnes pratiques garantissant qualité et cohérence.
Améliorer continuellement la plateforme : sécurité, scalabilité, optimisation des coûts, supervision et traçabilité.
Mettre en œuvre la gestion de versions des données afin d’assurer une traçabilité complète, indispensable dans un contexte de dispositifs médicaux.
Concevoir et maintenir des pipelines ETL automatisés pour l’ingestion, le nettoyage et la transformation de données de santé.
Garantir le respect des exigences RGPD : anonymisation, pseudonymisation et documentation complète des processus.
Collaborer avec les équipes métiers pour intégrer de nouvelles sources de données et faire évoluer les pipelines.
Créer et gérer des datasets versionnés permettant des expérimentations reproductibles.
Assurer des transferts de données volumineuses rapides, sécurisés et fiables.
Adapter la plateforme aux besoins des data scientists : formats, structuration, enrichissement des métadonnées et support technique.
Maintenir et améliorer les pipelines CI/CD pour des déploiements robustes et sécurisés.
Déployer des outils de supervision (tableaux de bord, alertes) pour assurer la stabilité des pipelines.
Industrialiser les déploiements des infrastructures data.
Apporter un leadership technique : cohérence architecturale, accompagnement des profils plus juniors, revues de code et diffusion des bonnes pratiques.
L’équipe Data intervient de manière end-to-end : recueil des besoins, architecture, développement, QA, sécurité, déploiement et opérations, avec une réelle liberté technologique.
Compétences et expérienceCompétences techniquesProgrammation : Python (avancé), Git / GitLab CI.
Cloud & Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
Orchestration & Infra : Airflow, Terraform.
Bases de données : MongoDB et solutions de stockage à grande échelle.
Standards web : API REST, protocoles HTTP/HTTPS.
Rigueur scientifique et forte capacité d’analyse.
Aptitude à faire le lien entre data science, ingénierie logicielle et opérations.
Capacité à produire une documentation technique claire et conforme aux exigences réglementaires.
Minimum 7 ans d’expérience en ingénierie data, dont 2 ans ou plus sur un rôle senior ou de responsabilité technique.
Bonne compréhension des enjeux de cybersécurité et de conformité réglementaire, en particulier pour les données de santé.
Maîtrise de l’anglais technique dans un environnement international.
MLOps : orchestration, déploiement et supervision de pipelines ML.
Connaissance des processus de certification CE / FDA pour logiciels ou algorithmes.
Expérience avec des données de santé : signaux électrophysiologiques (EEG, ECG, EMG) ou données cliniques.
Infrastructure : Linux, conteneurisation (Docker, registres d’images).
Lieu de la mission: Paris
TT: 3 jours
Profil recherché
Minimum 7 ans d’expérience en ingénierie data, dont 2 ans ou plus sur un rôle senior ou de responsabilité technique.
Programmation : Python (avancé), Git / GitLab CI.
Cloud & Big Data : AWS (API Gateway, Cognito, Lambda, S3, SageMaker, Glue, Athena, ECS), Delta Lake, Databricks.
Orchestration & Infra : Airflow, Terraform.
Bases de données : MongoDB et solutions de stockage à grande échelle.
Standards web : API REST, protocoles HTTP/HTTPS.
Postulez à cette offre !
Trouvez votre prochain job parmi +8 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Lead Data Engineer
ANDEMA