Job position Data Engineer / GenAI Engineer (Senior)
Share this job
Contexte de la mission
Dans le cadre d’un programme stratégique d’IA augmentée, la mission vise à concevoir et déployer un dispositif de benchmark permettant d’évaluer les technologies et solutions d’IA générative du marché.
L’objectif est de sécuriser les choix technologiques, réduire les risques et structurer une roadmap produits et technologies IA.
Objectifs globaux
Mettre en place une architecture data complète dédiée aux benchmarks IA générative
Automatiser l’ingestion, la préparation, le versioning et l’évaluation des données
Garantir performance, scalabilité, traçabilité et reproductibilité des benchmarks
Missions principalesArchitecture & Data Engineering
Concevoir et implémenter des pipelines automatisés d’ingestion, nettoyage et versioning des datasets
Développer des pipelines de génération d’embeddings et de collecte des résultats des modèles IA
Mettre en place et administrer des bases de données :
Vectorielles
SQL / NoSQL
Stockage objet (volumes importants)
Définir une architecture data robuste répondant aux exigences de performance et de scalabilité
DevOps & Industrialisation
Conteneurisation des environnements (Docker)
Mise en place d’Infrastructure as Code (IaC)
Automatisation CI/CD et déploiements reproductibles
Qualité, documentation & gouvernance
Rédiger le dictionnaire de données
Produire la documentation technique complète
Définir les procédures de validation et de contrôle qualité des données
Assurer la traçabilité et la conformité des traitements
Livrables attendus
Architecture data détaillée (schémas, flux, intégrations)
Infrastructure data opérationnelle (DB vectorielles, SQL/NoSQL, stockage objet)
Environnements reproductibles (IaC, Docker, configurations)
Code source documenté et versionné des pipelines
Dictionnaire de données et documentation technique
Procédures de validation et critères d’acceptation qualité
Méthodologie
Travail en mode Agile
Participation aux rituels agiles et points d’avancement réguliers
Reporting mensuel : livrables réalisés, à venir, points bloquants
Compétences techniques requisesImpératives
Python avancé (API, scripts, pipelines data)
Bases de données : PostgreSQL, MongoDB, bases vectorielles
Cloud : Google Cloud Platform (GCP)
DevOps : Docker, Kubernetes, CI/CD (GitLab CI)
Architecture Data & Big Data
IA générative : LLM, RAG, embeddings, prompts
Appréciées
IaC (Terraform ou équivalent)
Tests unitaires, intégration et fonctionnels
Software Craftsmanship (code review, pair programming)
Connaissances fonctionnelles
Concepts IA : LLM, agents, assistants, hallucinations, prompts
Usage critique et éthique de l’IA
RGPD et enjeux éthiques liés à l’IA
Langues
Anglais technique courant – impératif (oral & écrit)
Candidate profile
Data Engineer / GenAI Engineer Senior, expert en pipelines data et IA générative, capable de concevoir des benchmarks LLM, architectures data scalables, bases vectorielles et environnements Cloud/DevOps, avec une forte culture qualité, sécurité et conformité (RGPD).
Apply to this job!
Find your next career move from +1,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Data Engineer / GenAI Engineer (Senior)
RIDCHA DATA
