Le poste Data Engineer / GenAI Engineer (Senior)
Partager cette offre
Contexte de la mission
Dans le cadre d’un programme stratégique d’IA augmentée, la mission vise à concevoir et déployer un dispositif de benchmark permettant d’évaluer les technologies et solutions d’IA générative du marché.
L’objectif est de sécuriser les choix technologiques, réduire les risques et structurer une roadmap produits et technologies IA.
Objectifs globaux
Mettre en place une architecture data complète dédiée aux benchmarks IA générative
Automatiser l’ingestion, la préparation, le versioning et l’évaluation des données
Garantir performance, scalabilité, traçabilité et reproductibilité des benchmarks
Missions principalesArchitecture & Data Engineering
Concevoir et implémenter des pipelines automatisés d’ingestion, nettoyage et versioning des datasets
Développer des pipelines de génération d’embeddings et de collecte des résultats des modèles IA
Mettre en place et administrer des bases de données :
Vectorielles
SQL / NoSQL
Stockage objet (volumes importants)
Définir une architecture data robuste répondant aux exigences de performance et de scalabilité
DevOps & Industrialisation
Conteneurisation des environnements (Docker)
Mise en place d’Infrastructure as Code (IaC)
Automatisation CI/CD et déploiements reproductibles
Qualité, documentation & gouvernance
Rédiger le dictionnaire de données
Produire la documentation technique complète
Définir les procédures de validation et de contrôle qualité des données
Assurer la traçabilité et la conformité des traitements
Livrables attendus
Architecture data détaillée (schémas, flux, intégrations)
Infrastructure data opérationnelle (DB vectorielles, SQL/NoSQL, stockage objet)
Environnements reproductibles (IaC, Docker, configurations)
Code source documenté et versionné des pipelines
Dictionnaire de données et documentation technique
Procédures de validation et critères d’acceptation qualité
Méthodologie
Travail en mode Agile
Participation aux rituels agiles et points d’avancement réguliers
Reporting mensuel : livrables réalisés, à venir, points bloquants
Compétences techniques requisesImpératives
Python avancé (API, scripts, pipelines data)
Bases de données : PostgreSQL, MongoDB, bases vectorielles
Cloud : Google Cloud Platform (GCP)
DevOps : Docker, Kubernetes, CI/CD (GitLab CI)
Architecture Data & Big Data
IA générative : LLM, RAG, embeddings, prompts
Appréciées
IaC (Terraform ou équivalent)
Tests unitaires, intégration et fonctionnels
Software Craftsmanship (code review, pair programming)
Connaissances fonctionnelles
Concepts IA : LLM, agents, assistants, hallucinations, prompts
Usage critique et éthique de l’IA
RGPD et enjeux éthiques liés à l’IA
Langues
Anglais technique courant – impératif (oral & écrit)
Profil recherché
Data Engineer / GenAI Engineer Senior, expert en pipelines data et IA générative, capable de concevoir des benchmarks LLM, architectures data scalables, bases vectorielles et environnements Cloud/DevOps, avec une forte culture qualité, sécurité et conformité (RGPD).
Postulez à cette offre !
Trouvez votre prochaine mission parmi +8 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Data Engineer / GenAI Engineer (Senior)
RIDCHA DATA
