Le poste Ingénieur IA machine learning
Partager cette offre
Mission à Toulouse sur site avec télétravail partiel
Au sein de notre SOC, nous intégrons des technologies d'Intelligence Artificielle Générative pour automatiser l'analyse de menaces, contextualiser les alertes de sécurité et assister nos analystes. Nous recherchons un(e) Expert(e) en IA spécialisé(e) dans l'entraînement, l'alignement et l'évaluation de Modèles de Langage (LLM/SLM) afin de concevoir des modèles souverains, ultra-spécialisés en cybersécurité.
En collaboration directe avec l'équipe R&D Cyber et l'équipe SOC, le/la consultant(e) aura pour missions de :
Fine-tuning de modèles : Adapter et spécialiser des LLM open-source (Llama, Mistral, Qwen...) sur des données de cybersécurité (logs, rapports CTI, playbooks).
Alignement et limitation des hallucinations : Mettre en œuvre des techniques d'apprentissage par renforcement pour s'assurer que les modèles génèrent des réponses précises, sécurisées et sans biais/hallucinations (crucial pour le SOC).
Formatage et structuration des données : Définir et appliquer les meilleurs formats de prompt et de conversation pour l'entraînement.
Évaluation et Benchmarking : Mettre en place des pipelines d'évaluation rigoureux pour mesurer la performance des modèles spécialisés "Cyber" par rapport aux standards du marché.
Profil recherché
A. Fine-Tuning de Modèles (PEFT)
Maîtrise avancée des techniques d'adaptation à faible rang : LoRA et QLoRA.
Pratique courante d'au moins un framework de fine-tuning rapide : Unsloth, Axolotl, ou TRL (Transformer Reinforcement Learning d'Hugging Face).
B. Structuration & Formatage de Données
Expertise dans l'utilisation des formats de templates de discussion, notamment ChatML et Alpaca, pour structurer les datasets d'entraînement textuels.
C. Alignement & Reinforcement Learning (Contrôle des Hallucinations)
Solide expérience dans l'optimisation des réponses (Constraint-based generation & Alignment) via les méthodes : DPO (Direct Preference Optimization), GRPO (Group Relative Policy Optimization) et PPO (Proximal Policy Optimization).
Maîtrise des frameworks d'alignement : TRL, verl ou OpenRLHF.
D. Évaluation & Validation (MMLU / Benchmarking)
Capacité à concevoir des protocoles d'évaluation rigoureux.
Utilisation de benchmarks standards (ex: MMLU, GSM8K) et mise en place de frameworks d'évaluation comparatifs internes (méthodologies de type Evaluation Arena / LMSYS, LLM-as-a-judge).
SKILLS SECONDAIRES & APPRÉCIÉS (Nice to Have)
Sensibilité Cybersécurité : Expérience préalable ou fort intérêt pour les problématiques SOC (MITRE ATT&CK, analyse de logs, détection d'intrusions).
Stack MLOps : Connaissance de plateformes comme Hugging Face Hub, vLLM, Ollama ou Triton pour le déploiement et l'inférence optimisée.
Développement : Excellente maîtrise de Python et de PyTorch.
SOFT SKILLS
Rigueur scientifique : Rigueur absolue sur la qualité des données et la reproductibilité des benchmarks.
Communication : Capacité à vulgariser les concepts IA complexes auprès de profils purement cybersécurité (Analystes SOC, RSSI).
Autonomie : Capacité à délivrer dans un environnement R&D agile.
Environnement de travail
Créée en 2001, DEODIS est une société de conseil spécialisée dans la gestion des services IT et la transformation numérique des organisations informatiques. Au fil des années, DEODIS a su développer une expertise sur les solutions d’IT Service Management et plus globalement d’Enterprise Service Management, leaders du marché telles que ServiceNow, MicroFocus ou encore EasyVista.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Ingénieur IA machine learning
Deodis