Job position Architecte Data (AWS / Databricks / GénIA)
Share this job
Dans le cadre du développement de ses activités autour de la Data Platform et de l’Intelligence Artificielle Générative, Hextaem recherche un(e) Architecte Data pour intervenir sur la conception, l’industrialisation et la modernisation d’une plateforme Big Data Cloud bâtie sur AWS, Databricks et des services IA avancés.
L’objectif est de définir et de mettre en œuvre une architecture scalable, sécurisée et orientée IA, capable de supporter les cas d’usage analytiques, data science et génAI (RAG, copilotes, modèles internes).
Missions principales1. Conception et architecture de la plateforme Data
Définir l’architecture cible sur AWS (S3, Glue, Athena, Lambda, Redshift, etc.).
Concevoir les pipelines de données dans Databricks (ingestion, transformation, orchestration).
Définir les standards de data quality, gouvernance et sécurité (IAM, encryption, lineage).
Structurer les environnements (bronze / silver / gold) selon les meilleures pratiques Lakehouse.
2. Gouvernance et performance
Mettre en place des patterns de développement et d’industrialisation (CI/CD Data).
Superviser la performance des jobs et optimiser les coûts de la plateforme.
Assurer la traçabilité et la conformité des données (RGPD, ISO, sécurité).
3. Génération d’intelligence et IA générative
Participer à la conception d’architectures hybrides Data + IA Générative (RAG, embeddings, vector stores).
Intégrer des modèles LLM (OpenAI, Anthropic, Hugging Face, Bedrock, etc.) aux pipelines existants.
Collaborer avec les Data Scientists pour industrialiser les use cases IA.
Évaluer la pertinence d’outils de nouvelle génération (LangChain, LlamaIndex, VectorDB, etc.).
4. Conseil, accompagnement et expertise
Être le référent technique sur la plateforme Data pour les équipes internes et clients.
Accompagner les Data Engineers et Data Scientists dans la mise en œuvre des bonnes pratiques.
Participer aux phases d’avant-vente et d’architecture auprès des clients Hextaem.
Assurer une veille technologique active sur les sujets Cloud, Big Data et GénIA.
Compétences techniques :
Cloud & Data Platform: AWS (S3, Glue, Athena, Redshift, Lambda, IAM, CloudFormation/Terraform)
Data Engineering: Databricks (Spark, Delta Lake, MLflow), ETL/ELT, orchestration (Airflow, ADF)
Gouvernance & Sécurité: Data lineage, catalog (Glue Data Catalog, Unity Catalog), RBAC, encryption
Langages: Python, SQL, PySpark
CI/CD & DevOps: Git, Docker, Terraform, GitHub Actions / Jenkins
IA Générative (bonus)L:LMs (OpenAI, Bedrock, Hugging Face), LangChain, VectorDB, RAG patterns
Candidate profile
Bac +5 (école d’ingénieur, master en informatique, data ou cloud).
Expérience significative (5 à 10 ans) en architecture data / big data / cloud.
Pratique confirmée de Databricks et des services AWS.
Connaissance ou appétence forte pour les architectures IA génératives.
Français courant, anglais professionnel.
Working environment
Intervenir sur des projets data & IA de nouvelle génération.
Travailler dans un écosystème cloud moderne (AWS, Azure, GCP, Databricks).
Faire partie d’une communauté d’experts passionnés par la donnée et l’innovation.
Bénéficier d’un environnement agile, humain et formateur, au sein d’un cabinet à taille humaine.
Apply to this job!
Find your next career move from +10,000 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Architecte Data (AWS / Databricks / GénIA)
Hexateam
