Le poste Lead MLOps – Expert Python RAG Conversationnel Production (Azure Cloud – Full Microsoft)
Partager cette offre
Dans un contexte cabinet / finance / environnement régulé, nous recherchons un Lead MLOps senior, expert Python, ayant déjà mis en production un RAG conversationnel sur Azure.
Il ne s’agit pas d’un rôle de Data Scientist ni d’un profil POC.
Nous cherchons un Lead Engineering capable d’industrialiser, structurer et opérer un système GenAI en production, dans un environnement complexe et multi-acteurs.
Transformer un RAG conversationnel (POC ou existant) en système production-grade.
Concevoir et structurer l’architecture technique sur Azure Cloud.
Mettre en place les pipelines CI/CD et MLOps adaptés aux systèmes LLM/RAG.
Déployer, monitorer et opérer la solution en production.
Définir les standards de gouvernance IA, versioning, auditabilité et conformité.
Interagir étroitement avec les architectes Azure et équipes Ops Cloud.
Être force de proposition, cadrer, arbitrer et assumer les décisions techniques.
Passer du POC à la PROD de manière structurée et mesurable.
Maîtrise concrète des environnements Azure :
Azure OpenAI
Azure AI Search / Vector Search
Azure ML / Fabric / Databricks
Azure DevOps / GitHub Actions
AKS ou services managés Azure
Monitoring Azure (logs, métriques, alerting)
Capacité à dialoguer techniquement avec les architectes et équipes Ops Azure.
RAG Conversationnel – ExigencesArchitecture modulaire (ingestion / retrieval / génération découplés)
Gestion du contexte conversationnel
Optimisation retrieval (chunking, reranking, hiérarchisation)
Contrôle des hallucinations
Monitoring qualité & performance
Évaluation automatisée (LLM-as-a-Judge, métriques retrieval, A/B testing)
Pipelines CI/CD pour ML / GenAI
Versioning code / data / modèles
Tests unitaires & intégration
Monitoring technique (latence, coûts, erreurs)
Monitoring sémantique (qualité des réponses)
Rollback & gestion des incidents
Gouvernance IA & standards engineering
Python expert (FastAPI, modularité, clean architecture)
Structuration claire du code
Gitflow maîtrisé
Scalabilité & résilience
Documentation et standards d’équipe
7–10+ ans d’expérience
Lead MLOps / ML Engineering senior
Expérience démontrée de mise en production RAG conversationnel sur Azure
Habitué aux environnements cabinet / finance / régulés
Leadership affirmé, capacité à s’imposer
Capable de proposer des solutions pragmatiques et surtout de les exécuter
Localisation : Paris centre
Télétravail partiel possible
Environnement exigeant mais agile
Culture d’équipe forte, esprit “team spirit”
Mode de fonctionnement dynamique, proche d’un esprit startup
Forte exposition aux enjeux stratégiques IA
Profils orientés uniquement Data Science
RAG prototype / non production-grade
Expérience Azure superficielle
Manque d’expérience MLOps réelle
Profil incapable de structurer et gouverner
Profil recherché
Lead IA / Lead RAG / Lead ML Eng ou Architecte GenAI
Capacité à concevoir + exécuter + industrialiser
Forte seniorité sur le passage POC → PROD
Habitué aux environnements finance / audit / assurance / regulated
Assertif, capable de tenir une ligne, d’arbitrer et d’imposer des standards
Vision produit + technique + delivery
Excellent communicant avec C-level + équipes techniques
Environnement de travail
7–10+ ans d’expérience
Lead MLOps / ML Engineering senior
Expérience démontrée de mise en production RAG conversationnel sur Azure
Habitué aux environnements cabinet / finance / régulés
Leadership affirmé, capacité à s’imposer
Capable de proposer des solutions pragmatiques et surtout de les exécuter
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Lead MLOps – Expert Python RAG Conversationnel Production (Azure Cloud – Full Microsoft)
5COM Consulting
