Job position Data engineer ETL Airflow
Share this job
Data/ML Engineer – Secteur bancaire (IDF) – DISPO ASAP – MISSION LONGUE
Contexte : Accélération IA – chantier Knowledge Management pour constituer une base de connaissance à partir de documents non structurés (PDF, Word, HTML). Un pipeline initial existe et doit être industrialisé pour une exécution fiable, scalable et maintenable.
Objectif : Développer les pipelines d’ingestion, transformation et alimentation de la base, en assurant versioning et traçabilité.
Activités :
Modéliser l’architecture technique (ingestion → stockage)
Développer des flux ETL modulaires (OCR, transformation, enrichissement)
Standardiser le format pivot et les conventions de métadonnées
Assurer l’historisation, le versioning et la traçabilité des documents
Implémenter un orchestrateur (Airflow/Dagster/Prefect) si nécessaire
Suivre la robustesse sur des volumes variés
Collaborer avec les équipes KM et Data Science
Documenter l’ensemble des flux de traitement
Candidate profile
Data/ML Engineer – Secteur bancaire (IDF) – DISPO ASAP – MISSION LONGUE
Contexte : Accélération IA – chantier Knowledge Management pour constituer une base de connaissance à partir de documents non structurés (PDF, Word, HTML). Un pipeline initial existe et doit être industrialisé pour une exécution fiable, scalable et maintenable.
Objectif : Développer les pipelines d’ingestion, transformation et alimentation de la base, en assurant versioning et traçabilité.
Activités :
Modéliser l’architecture technique (ingestion → stockage)
Développer des flux ETL modulaires (OCR, transformation, enrichissement)
Standardiser le format pivot et les conventions de métadonnées
Assurer l’historisation, le versioning et la traçabilité des documents
Implémenter un orchestrateur (Airflow/Dagster/Prefect) si nécessaire
Suivre la robustesse sur des volumes variés
Collaborer avec les équipes KM et Data Science
Documenter l’ensemble des flux de traitement
Working environment
Data/ML Engineer – Secteur bancaire (IDF) – DISPO ASAP – MISSION LONGUE
Contexte : Accélération IA – chantier Knowledge Management pour constituer une base de connaissance à partir de documents non structurés (PDF, Word, HTML). Un pipeline initial existe et doit être industrialisé pour une exécution fiable, scalable et maintenable.
Objectif : Développer les pipelines d’ingestion, transformation et alimentation de la base, en assurant versioning et traçabilité.
Activités :
Modéliser l’architecture technique (ingestion → stockage)
Développer des flux ETL modulaires (OCR, transformation, enrichissement)
Standardiser le format pivot et les conventions de métadonnées
Assurer l’historisation, le versioning et la traçabilité des documents
Implémenter un orchestrateur (Airflow/Dagster/Prefect) si nécessaire
Suivre la robustesse sur des volumes variés
Collaborer avec les équipes KM et Data Science
Documenter l’ensemble des flux de traitement
Apply to this job!
Find your next career move from +10,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Data engineer ETL Airflow
IT-EXPLORER