Le poste Architecte Data (AWS / Databricks / GénIA)
Partager cette offre
Dans le cadre du développement de ses activités autour de la Data Platform et de l’Intelligence Artificielle Générative, Hextaem recherche un(e) Architecte Data pour intervenir sur la conception, l’industrialisation et la modernisation d’une plateforme Big Data Cloud bâtie sur AWS, Databricks et des services IA avancés.
L’objectif est de définir et de mettre en œuvre une architecture scalable, sécurisée et orientée IA, capable de supporter les cas d’usage analytiques, data science et génAI (RAG, copilotes, modèles internes).
Missions principales1. Conception et architecture de la plateforme Data
Définir l’architecture cible sur AWS (S3, Glue, Athena, Lambda, Redshift, etc.).
Concevoir les pipelines de données dans Databricks (ingestion, transformation, orchestration).
Définir les standards de data quality, gouvernance et sécurité (IAM, encryption, lineage).
Structurer les environnements (bronze / silver / gold) selon les meilleures pratiques Lakehouse.
2. Gouvernance et performance
Mettre en place des patterns de développement et d’industrialisation (CI/CD Data).
Superviser la performance des jobs et optimiser les coûts de la plateforme.
Assurer la traçabilité et la conformité des données (RGPD, ISO, sécurité).
3. Génération d’intelligence et IA générative
Participer à la conception d’architectures hybrides Data + IA Générative (RAG, embeddings, vector stores).
Intégrer des modèles LLM (OpenAI, Anthropic, Hugging Face, Bedrock, etc.) aux pipelines existants.
Collaborer avec les Data Scientists pour industrialiser les use cases IA.
Évaluer la pertinence d’outils de nouvelle génération (LangChain, LlamaIndex, VectorDB, etc.).
4. Conseil, accompagnement et expertise
Être le référent technique sur la plateforme Data pour les équipes internes et clients.
Accompagner les Data Engineers et Data Scientists dans la mise en œuvre des bonnes pratiques.
Participer aux phases d’avant-vente et d’architecture auprès des clients Hextaem.
Assurer une veille technologique active sur les sujets Cloud, Big Data et GénIA.
Compétences techniques :
Cloud & Data Platform: AWS (S3, Glue, Athena, Redshift, Lambda, IAM, CloudFormation/Terraform)
Data Engineering: Databricks (Spark, Delta Lake, MLflow), ETL/ELT, orchestration (Airflow, ADF)
Gouvernance & Sécurité: Data lineage, catalog (Glue Data Catalog, Unity Catalog), RBAC, encryption
Langages: Python, SQL, PySpark
CI/CD & DevOps: Git, Docker, Terraform, GitHub Actions / Jenkins
IA Générative (bonus)L:LMs (OpenAI, Bedrock, Hugging Face), LangChain, VectorDB, RAG patterns
Profil recherché
Bac +5 (école d’ingénieur, master en informatique, data ou cloud).
Expérience significative (5 à 10 ans) en architecture data / big data / cloud.
Pratique confirmée de Databricks et des services AWS.
Connaissance ou appétence forte pour les architectures IA génératives.
Français courant, anglais professionnel.
Environnement de travail
Intervenir sur des projets data & IA de nouvelle génération.
Travailler dans un écosystème cloud moderne (AWS, Azure, GCP, Databricks).
Faire partie d’une communauté d’experts passionnés par la donnée et l’innovation.
Bénéficier d’un environnement agile, humain et formateur, au sein d’un cabinet à taille humaine.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +9 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Architecte Data (AWS / Databricks / GénIA)
Hexateam
