Le poste Data Ingénieur
Partager cette offre
Le ou la Data Ingénieur·e IA conçoit, met en place et opère les pipelines de données qui alimentent les cas d’usage d’intelligence artificielle (machine learning, LLM, analytics avancée). Le poste vise à garantir la disponibilité, la qualité, la traçabilité et la performance des données de bout en bout, depuis les sources (SI, APIs, fichiers, logs) jusqu’aux environnements d’entraînement et de production. En lien étroit avec les équipes Data Science, Produit, DevOps et Sécurité, la personne contribue à industrialiser les flux et à fiabiliser l’écosystème data.
Livrables
Pipelines de données documentés et automatisés, avec contrôles de qualité (validation, déduplication, gestion des valeurs manquantes) et mécanismes de reprise sur incident. Jeux de données prêts pour l’IA (datasets d’entraînement/validation, tables de features, embeddings si nécessaire) et interfaces d’accès stables pour les équipes consommatrices. Tableaux de bord de supervision (fraîcheur, volumes, erreurs, coûts), documentation opérationnelle (runbooks) et contribution aux standards (naming, conventions, modèles) de la plateforme.
Profil recherché
Compétences
Solides bases en modélisation et architecture data (schémas, normalisation, data lake/warehouse, formats colonnes), ainsi qu’en intégration (ETL/ELT, streaming, orchestration). Maîtrise de SQL et d’un langage de programmation (Python le plus souvent), bonnes pratiques de développement (tests, CI/CD, revue de code) et compréhension des contraintes MLOps (feature store, versioning, reproductibilité, monitoring). Connaissance des environnements cloud et conteneurisation (IAM, stockage, réseau, Docker, Kubernetes) et sensibilité aux sujets de sécurité, conformité et gouvernance (RGPD, gestion des accès, catalogage, qualité).
Environnement de travail
AWS KUBERNETES RANCHER OPENSHIFT IA
Solides bases en modélisation et architecture data (schémas, normalisation, data lake/warehouse, formats colonnes), ainsi qu’en intégration (ETL/ELT, streaming, orchestration). Maîtrise de SQL et d’un langage de programmation (Python le plus souvent), bonnes pratiques de développement (tests, CI/CD, revue de code) et compréhension des contraintes MLOps (feature store, versioning, reproductibilité, monitoring). Connaissance des environnements cloud et conteneurisation (IAM, stockage, réseau, Docker, Kubernetes) et sensibilité aux sujets de sécurité, conformité et gouvernance (RGPD, gestion des accès, catalogage, qualité).
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Data Ingénieur
Les Filles et les Garçons de la Tech
