Job Vacancy Ingénieur IA machine learning

Toulouse

Deodis

Machine Learning

Job position Ingénieur IA machine learning

Contractor

Permanent

As soon as possible

12 months renewable

40k-45k €, 450-470 €

5 to 10 years experience

Hybrid

Toulouse, Occitania

Published on 02/07/2026

Share this job

Mission à Toulouse sur site avec télétravail partiel

Au sein de notre SOC, nous intégrons des technologies d'Intelligence Artificielle Générative pour automatiser l'analyse de menaces, contextualiser les alertes de sécurité et assister nos analystes. Nous recherchons un(e) Expert(e) en IA spécialisé(e) dans l'entraînement, l'alignement et l'évaluation de Modèles de Langage (LLM/SLM) afin de concevoir des modèles souverains, ultra-spécialisés en cybersécurité.

En collaboration directe avec l'équipe R&D Cyber et l'équipe SOC, le/la consultant(e) aura pour missions de :

Fine-tuning de modèles : Adapter et spécialiser des LLM open-source (Llama, Mistral, Qwen...) sur des données de cybersécurité (logs, rapports CTI, playbooks).
Alignement et limitation des hallucinations : Mettre en œuvre des techniques d'apprentissage par renforcement pour s'assurer que les modèles génèrent des réponses précises, sécurisées et sans biais/hallucinations (crucial pour le SOC).
Formatage et structuration des données : Définir et appliquer les meilleurs formats de prompt et de conversation pour l'entraînement.
Évaluation et Benchmarking : Mettre en place des pipelines d'évaluation rigoureux pour mesurer la performance des modèles spécialisés "Cyber" par rapport aux standards du marché.

Candidate profile

A. Fine-Tuning de Modèles (PEFT)
Maîtrise avancée des techniques d'adaptation à faible rang : LoRA et QLoRA.
Pratique courante d'au moins un framework de fine-tuning rapide : Unsloth, Axolotl, ou TRL (Transformer Reinforcement Learning d'Hugging Face).
B. Structuration & Formatage de Données
Expertise dans l'utilisation des formats de templates de discussion, notamment ChatML et Alpaca, pour structurer les datasets d'entraînement textuels.
C. Alignement & Reinforcement Learning (Contrôle des Hallucinations)
Solide expérience dans l'optimisation des réponses (Constraint-based generation & Alignment) via les méthodes : DPO (Direct Preference Optimization), GRPO (Group Relative Policy Optimization) et PPO (Proximal Policy Optimization).
Maîtrise des frameworks d'alignement : TRL, verl ou OpenRLHF.
D. Évaluation & Validation (MMLU / Benchmarking)
Capacité à concevoir des protocoles d'évaluation rigoureux.
Utilisation de benchmarks standards (ex: MMLU, GSM8K) et mise en place de frameworks d'évaluation comparatifs internes (méthodologies de type Evaluation Arena / LMSYS, LLM-as-a-judge).

SKILLS SECONDAIRES & APPRÉCIÉS (Nice to Have)
Sensibilité Cybersécurité : Expérience préalable ou fort intérêt pour les problématiques SOC (MITRE ATT&CK, analyse de logs, détection d'intrusions).
Stack MLOps : Connaissance de plateformes comme Hugging Face Hub, vLLM, Ollama ou Triton pour le déploiement et l'inférence optimisée.
Développement : Excellente maîtrise de Python et de PyTorch.

SOFT SKILLS
Rigueur scientifique : Rigueur absolue sur la qualité des données et la reproductibilité des benchmarks.
Communication : Capacité à vulgariser les concepts IA complexes auprès de profils purement cybersécurité (Analystes SOC, RSSI).
Autonomie : Capacité à délivrer dans un environnement R&D agile.

Working environment

Discover Deodis

Puteaux, Ile-de-France

100 - 249 employees

IT services

Créée en 2001, DEODIS est une société de conseil spécialisée dans la gestion des services IT et la transformation numérique des organisations informatiques. Au fil des années, DEODIS a su développer une expertise sur les solutions d’IT Service Management et plus globalement d’Enterprise Service Management, leaders du marché telles que ServiceNow, MicroFocus ou encore EasyVista. En outre, DEODIS propose à ses clients des expertises pointues sur des sujets techniques comme le Performance Management, le Data Management et le Cloud Management. DEODIS dispose aussi d’un savoir-faire reconnu autour des référentiels du système d’information ITIL®, DevOps et Agile/SCRUM. Partenaire de confiance des acteurs majeurs du secteur financier, public et de l’industrie, DEODIS s’appuie sur plus de 300 consultants expérimentés partageant les mêmes valeurs : Excellence, Engagement, Innovation et Convivialité. En rejoignant DEODIS, vous intégrez une structure à taille humaine où vous pourrez développer vos compétences, accroître votre savoir-faire et partager votre expérience dans un environnement convivial.

Apply to this job!

Find your next career move from +10,000 jobs!

Manage your visibility

Salary, remote work... Define all the criteria that are important to you.
Get discovered

Recruiters come directly to look for their future hires in our CV library.
Join a community

Connect with like-minded tech and IT professionals on a daily basis through our forum.

Ingénieur IA machine learning

Deodis