Trouvez votre prochaine offre d’emploi ou de mission freelance GPU
Votre recherche renvoie 17 résultats.
Mission freelance
Expert GPU GRID
EXteam
Publiée le
GPU
Helm
Kubernetes
3 ans
500-630 €
Île-de-France, France
Missions principales (Doit connaitre Kubernetes, Helm, Python, Gestion et tunning de GPU (Nvidia)) Gestion du RUN • Supervision des alertes, incidents et changements ; • Coordination du triage (L1 → L2 → L3) avec l’équipe offshore ; • Rédaction & maintenance des runbooks, playbooks et SOP ; • Suivi du MTTR, escalades et reporting aux parties prenantes. Incident Management & RCA • Conduite d’enquêtes post‑mortem (RCA) ; • Mise en place d’actions correctives et préventives ; • Gestion du carnet d’incidents dans ServiceNow (SNOW). Optimisation des plateformes • Monitoring des métriques (latence, utilisation GPU, capacité des nœuds) ; • Propositions d’optimisation (autoscaling, right‑sizing, tuning des ressources) ; • Gestion des patchs de sécurité et suivi des CVE. Automation & CI/CD • Automatisation des tâches récurrentes (scripts Python, Terraform, Ansible) ; • Intégration des bonnes pratiques GitOps. Collaboration & gouvernance • Interface avec les Product Owners, les équipes DataScience et les fournisseurs d’infrastructure ; • Participation aux cérémonies Scrum/Kanban (stand‑up, grooming, retro) ; • Veille à la conformité ITSM (processes, KPI, SLA). Support aux utilisateurs • Gestion des demandes d’accès, des droits RBAC et de la documentation technique ; • Formation ponctuelle (on‑boarding) des nouveaux membres de l’équipe offshore Profil recherché Expérience • 5 + ans d’expérience en exploitation (Run/Production) d’environnements Kubernetes à grande échelle ; • Expérience confirmée avec des équipes offshore ou distribuées (3 personnes minimum). Compétences techniques • Kubernetes, Helm, Argo CD ; • Scripting Python (débogage, packaging : venv, poetry, uv) ; • Notions Data Science : pandas, numpy ; • CI/CD (GitLab, Jenkins), IaC (Terraform, Ansible) ; • Observabilité (Prometheus, Grafana, Loki) ; • Gestion des GPU (NVIDIA GRID) ; • Sécurité production : gestion CVE, RBAC, Vault.
Offre premium
Offre d'emploi
HPC Operations
Halian
Publiée le
Calcul hautes performances (HPC)
CPU
GPU
4 ans
France
FULL REMOTE Principal Engineer – HPC Operations Description du poste Nous recherchons un(e) Principal Engineer – HPC Operations expérimenté(e) pour piloter l’exploitation quotidienne d’infrastructures de calcul haute performance (HPC) dédiées à des workloads à grande échelle en IA et Machine Learning . Ce rôle clé consiste à garantir la stabilité, la performance, la sécurité et l’évolutivité des clusters HPC, en s’appuyant sur des technologies telles que Slurm, Kubernetes et des plateformes MLOps modernes . Vous interviendrez dans des environnements complexes et distribués à l’échelle internationale, tout en jouant un rôle de référent technique et de mentor pour les équipes opérationnelles. Responsabilités principales Assurer la gestion opérationnelle quotidienne des infrastructures HPC (compute, stockage, réseau, ordonnanceurs comme Slurm et Kubernetes). Optimiser la performance, la disponibilité et l’utilisation des ressources (CPU, GPU, stockage). Être le point de contact technique principal pour les déploiements HPC dans le périmètre. Agir comme point d’escalade technique (L3) pour les équipes support, en assurant une résolution rapide et efficace des incidents. Superviser l’état des systèmes via des outils de monitoring et d’observabilité (Prometheus, Grafana, DCGM). Gérer les environnements utilisateurs pour les workloads IA/ML via des containers et orchestrateurs (Docker, Kubernetes) et des outils MLOps (MLflow, Kubeflow). Définir et appliquer les politiques de planification des jobs (priorités, quotas, partitions) afin de garantir l’équité et l’efficacité des ressources. Piloter les analyses de causes racines (RCA) , contribuer aux post-mortems et mener des actions d’amélioration continue. Encadrer et accompagner les ingénieurs moins expérimentés , favoriser le partage de connaissances et la montée en compétences. Participer à l’ astreinte si nécessaire. Veiller au respect des politiques de sécurité, des processus opérationnels et des exigences d’audit , et maintenir la documentation associée. Profil recherché Formation & expérience Bac+5 en informatique, ingénierie ou domaine technique équivalent. Minimum 8 ans d’expérience en HPC, ingénierie systèmes ou DevOps, dont au moins 2 ans dans un rôle senior ou de leadership technique . Compétences techniques Expertise avancée en environnements HPC complexes (matériel, logiciels, stockage). Expérience confirmée avec Slurm et/ou Kubernetes appliqués à des workloads IA/ML. Solide maîtrise de la gestion des GPU , des ordonnanceurs de charges et de l’optimisation des performances. Bonne connaissance des outils de monitoring (Prometheus, Grafana, DCGM). Excellentes compétences en automatisation et scripting : Python, Bash, Ansible, Terraform. Très bonne maîtrise de Linux (RHEL, CentOS, Ubuntu). Connaissances approfondies en réseaux haute performance (RDMA, InfiniBand, RoCE). Expérience avec des solutions de stockage telles que NFS, Lustre, Ceph.
Mission freelance
Ingénieur ML Platform Senior
Cherry Pick
Publiée le
GPU
Machine Learning
Python
12 mois
610 €
Paris, France
En tant qu' Ingénieur ML au sein de l'équipe ML Platform, vous mettrez à profit votre solide expérience en industrialisation , votre maîtrise de Python et votre expertise pratique de l'entraînement de modèles. Votre rôle sera de faciliter le travail quotidien du ML Lab sur (leur "neocloud" de choix) et d'assurer la liaison avec l'outillage MLOps (principalement sur AWS ), en étroite collaboration avec un ingénieur DevOps dédié. Responsabilités Clés Favoriser l'expérimentation rapide : Créer et maintenir les outils permettant aux chercheurs d'itérer rapidement sur de nouvelles approches ML. Gérer des expériences de recherche à grande échelle : Concevoir et superviser des cycles d'entraînement massifs sur l'infrastructure , en implémentant le suivi des expériences ( experiment tracking ) et la reproductibilité. Faciliter la collaboration externe : Permettre une collaboration sécurisée avec des partenaires académiques et l'accès aux ressources open-source tout en respectant les protocoles de sécurité. Optimisation des performances et des ressources : Profiler et optimiser les pipelines d'entraînement ; gérer efficacement les ressources GPU. Développement d'outils de recherche : Développer des bibliothèques et utilitaires spécifiques aux domaines du Lab (nouvelles architectures, techniques d'entraînement, frameworks d'évaluation). Transfert de connaissances : Partager les enseignements issus de la recherche expérimentale avec l'ensemble de l'équipe ML Platform et les chercheurs
Offre d'emploi
Ingénieur DevOps Data / IA Générative On-Premise — Secteur bancaire
WE +
Publiée le
Ansible
Dataiku
Docker
12 mois
Île-de-France, France
Contexte et environnement Notre client, acteur majeur du secteur bancaire, engage un projet stratégique autour de la conception, du déploiement, de l’industrialisation et de l’exploitation d’une plateforme d’intelligence artificielle générative en environnement on-premise. Ce dispositif s’inscrit dans un contexte bancaire exigeant, marqué par de forts enjeux de sécurité, de conformité, de souveraineté, de gouvernance des données et de résilience des services. L’objectif est de mettre à disposition des solutions GenAI industrialisées, sécurisées et exploitables à grande échelle pour différents métiers et entités internes. L’intervention s’effectuera au sein d’une équipe dédiée aux produits et services Data & IA, dans un environnement technique complexe, distribué, hautement disponible et soumis à des exigences fortes en matière de production IT. Périmètre d’intervention Le périmètre couvre l’ensemble du cycle de vie de la plateforme, depuis la contribution à la conception du service jusqu’à son maintien en conditions opérationnelles et de sécurité en production. Le consultant interviendra sur un dispositif à forts enjeux techniques, au croisement des sujets DevOps, Data, IA générative, conteneurisation, automatisation, sécurité et exploitation de plateformes critiques. Dans un environnement bancaire, la capacité à sécuriser les déploiements, fiabiliser les processus d’industrialisation et garantir la conformité des services sera déterminante. Missions principales Dans ce cadre, le consultant contribuera notamment à : Industrialiser et automatiser le déploiement d’une plateforme d’IA générative en environnement on-premise sécurisé ; Contribuer à la conception et à l’évolution de l’architecture de la plateforme ; Participer à la mise en place de services managés intégrant les contraintes de sécurité, de conformité, de gouvernance et de production bancaire ; Accompagner la mise en production des offres et services associés ; Documenter les services, les modes opératoires et les éléments nécessaires à leur exploitation ; Réaliser des présentations et démonstrations afin de valoriser les offres et services auprès des parties prenantes ; Maintenir les plateformes IA déployées en conditions opérationnelles et de sécurité ; Contribuer au traitement des sujets techniques au sein d’une équipe produit ; Participer aux échanges de cadrage, de priorisation et de co-construction de la roadmap ; Prendre en charge des éléments de backlog formalisés par le Product Owner ; Assurer un rôle de référent technique sur un produit ou un périmètre de la plateforme ; Participer aux rituels d’équipe et aux instances de coordination du dispositif ; Contribuer aux astreintes techniques liées au périmètre. Compétences attendues Le consultant devra présenter une expérience solide sur les environnements DevOps, Data et plateformes distribuées, avec une capacité à intervenir sur des sujets d’industrialisation, d’automatisation et d’exploitation en environnement critique. Les compétences attendues sont notamment les suivantes : Maîtrise du déploiement et de la manipulation de workloads Data ; Bonne compréhension des environnements conteneurisés et des pratiques CI/CD ; Expérience sur des plateformes Kubernetes, OpenShift et Docker ; Capacité à intervenir sur des environnements on-premise sécurisés ; Connaissance des meilleures pratiques en matière de sécurité des données, conformité et gouvernance ; Expérience en automatisation et infrastructure as code ; Capacité à documenter, structurer et sécuriser des services techniques destinés à la production ; Aptitude à porter un rôle de référent technique au sein d’une équipe produit. Une expérience dans le secteur bancaire, financier ou dans un environnement fortement réglementé sera particulièrement appréciée. Une connaissance des plateformes d’IA générative, des environnements LLMOps ou des plateformes agentiques constitue également un plus.
Offre premium
Mission freelance
Expert VDI & Cloud 3D
REESK DIGITAL SOLUTION
Publiée le
3D
Animation
Architecture
36 mois
600 €
Île-de-France, France
Missions principales: Architecturer et optimiser des infrastructures VDI (Virtual Desktop Infrastructure) pour des environnements 3D (Maya, AutoCAD, Houdini, ZBrush, Unreal Engine, etc.) sous Windows et Linux. Analyser et résoudre les bottlenecks techniques liés aux performances GPU, RAM, et stockage pour des workflows créatifs (rendus, streaming, collaboration à distance). Collaborer avec les partenaires pour industrialiser les solutions et rendre les infrastructures autonomes. Documenter les processus techniques et former les équipes internes. Anticiper la transition vers Linux pour les studios (optimisation RAM, réduction des coûts). Participer à la roadmap pour le déploiement de solutions VDI dans l’industrie (ex : BNP, EDF).
Offre d'emploi
Tech Lead Python / Angular / CICD + Cultura IA
R&S TELECOM
Publiée le
Agent IA
GPU
Interface Homme-Machine (IHM)
6 mois
Bordeaux, Nouvelle-Aquitaine
Le développement d'IHM autour de la ferme GPU L'intégration des services autour de la plateforme IA MISTRAL Profil basé idéalement à Bordeaux mais ouvert à du remote (prévoir quelques déplacements à Bordeaux). Nous souhaitons un profil solide, car les enjeux sont fort et les éléments techniques complexes. Il sera amené à prendre de fortes responsabilités. Le développement d'IHM autour de la ferme GPU L'intégration des services autour de la plateforme IA MISTRAL Profil basé idéalement à Bordeaux mais ouvert à du remote (prévoir quelques déplacements à Bordeaux). Nous souhaitons un profil solide, car les enjeux sont fort et les éléments techniques complexes. Il sera amené à prendre de fortes responsabilités.
Mission freelance
ML Engineer senior orienté plateforme / DevOps ML
Trait d'Union
Publiée le
AWS Cloud
Deep Learning
Docker
1 an
400-760 €
Paris, France
Permettre à des chercheurs de tester, entraîner et industrialiser rapidement des modèles de machine learning à grande échelle, dans un environnement hybride : neocloud pour la recherche AWS (MLOps / prod) Gérer des entraînements de modèles à grande échelle (GPU / distribué) Assurer la reproductibilité des expériences Optimiser les ressources (GPU, compute) Créer des outils internes pour la recherche ML Faire le lien entre recherche académique ↔ production industrielle Avoir déjà travaillé : soit dans une boîte très technique (type scale-up / deeptech) soit dans un environnement de recherche / labo Parler Anglais
Mission freelance
ML Platform Senior DevOps Engineer
ARGANA CONSULTING CORP LLP
Publiée le
AWS Cloud
Cloud
Docker
6 mois
400 €
Paris, France
Nous recherchons un(e) DevOps Engineer Senior pour intervenir au sein d’une équipe ML Platform & ML Lab, dans un environnement technique avancé orienté Machine Learning et infrastructure cloud à grande échelle. 🎯 Votre rôle 🔵 Configuration et gestion de l’infrastructure cloud (Lambda) pour l’accès GPU des équipes ML 🔵 Mise en place de bonnes pratiques FinOps et protection contre les erreurs critiques 🔵 Optimisation des images Docker pour réduire les temps de cold start 🔵 Mise en place et maintien des systèmes de monitoring des entraînements de modèles 🔵 Contribution aux projets ML Platform sur AWS (CI/CD, tooling, infrastructure) 🔵 Automatisation des process et amélioration continue des workflows 🔵 Renforcement de la sécurité (audit, vulnérabilités, gestion des risques) 🚀 Votre impact 🔵 Améliorer la productivité des équipes ML 🔵 Garantir la robustesse et la scalabilité des environnements de training 🔵 Accélérer les workflows via automation et CI/CD 🔵 Renforcer la fiabilité et la sécurité des infrastructures cloud 🛠️ Stack & environnement 🔵 AWS 🔵 Terraform 🔵 Docker (optimisation d’images large scale) 🔵 GitLab CI / Jenkins 🔵 Linux / UNIX 🔵 Monitoring & observability 🔵 Environnement ML / GPU / cloud (Lambda) 📌 Informations complémentaires 🔵 Mission freelance 🔵 Hybride ou remote selon organisation 🔵 Mission longue durée
Offre d'emploi
Ingénieur.e développement Linux C++/Qt - Défense - H/F
█ █ █ █ █ █ █
Publiée le
Linux
39-43 €
Nantes, Pays de la Loire
Offre importée
Offre issue du marché tech, identifiée automatiquement pour vous donner une vue complète des opportunités.
Accès restreint à la communauté
Rejoignez notre plateforme pour accéder aux détails de cette offre et obtenir un accès aux meilleures offres du marché.
Offre d'emploi
Expert Kubernetes /IA H/F
SPIE ICS
Publiée le
Agent IA
Grafana
Kubernetes
12 mois
40k-70k €
400-650 €
Fontenay-aux-Roses, Île-de-France
Nous recherchons pour notre client un(e) Expert Kubernetes /IA (H/F). Rôle principal : Garantir la disponibilité, performance et stabilité du cluster IA (GPU/CPU/réseau/stockage), automatiser son exploitation et assurer le support. Vos missions : Maintien en condition opérationnelle (MCO) du cluster IA, incluant la gestion des nœuds GPU/CPU, du stockage et du réseau. Administration des systèmes Linux : installation, configuration et optimisation. Exploitation et gestion des environnements Kubernetes : déploiement, montée en charge (scaling) et haute disponibilité (HA). Supervision et monitoring des infrastructures à l’aide d’outils tels que Prometheus et Grafana. Gestion des incidents techniques, analyse post-mortem et mise en place de plans d’action correctifs. Automatisation des tâches opérationnelles via Ansible et scripts Bash/Python. Gestion des jobs : ordonnancement des tâches GPU, gestion des quotas et priorités. Pilotage des mises à jour des systèmes d’exploitation, des pilotes NVIDIA et des composants Kubernetes. Gestion des incidents liés à l’infrastructure et coordination des interventions. Rédaction et mise à jour de la documentation d’exploitation pour assurer la traçabilité et la continuité des opérations. Profil recherché Vous êtes certifié Kubernetes, justifiez d’une expérience professionnelle minimum de 8 ans dans un poste similaire, et maîtrisez les environnements suivants : Infrastructure : Linux Ubuntu, Kubernetes, Docker, GPU NVIDIA (drivers, CUDA, MIG), Ansible, gestion des environnements distribués. Observabilité : Prometheus, Grafana Stockage : systèmes de fichiers distribués, stockage haute performance et stockage objet Réseau : comprendre l’architecture réseau d’un cluster (VLAN, Load balancing...) Méthodes : ITIL/ITSM, gestion des incidents et des changements, documentation d’exploitation.
Mission freelance
POT9165 - Un Responsable Ingénierie Applicative / Confirmé sur Paris
Almatek
Publiée le
OpenStack
6 mois
Paris, France
Almatek recherche pour l'un de ses clients Un Responsable Ingénierie Applicative / Confirmé sur Le Responsable Ingénierie Applicative dirige des activités d’études et de développement qui contribuent à l’évolution et la maintenance du SI. Mission: Membre de la Direction technique Informatique (DTI), vous concevrez une architecture cloud de type Infrastructure as a Service pour du stockage disque et/ou bande ainsi que des capacités de calcul CPU/GPU sous Openstack. En tant que DevOps, vous serez responsable de la construction et de la mise en place de nouveaux outils gestion de l'infrastructure, de la sécurisation des environnements, de l'automatisation des déploiements en collaboration avec les équipes de DTI. ADMINISTRATION LINUX : Sénior (plus de 7 ans sur le poste) Administration Système : Sénior (plus de 7 ans sur le poste) Assurer la mise en conformité RGPD, PSSI de l’Etat, NIS2 : Sénior (plus de 7 ans sur le poste) Comprendre et lire l'anglais technique : langue : technique/intermédiaire Concevoir l’offre IaaS CPU/GPU : Sénior (plus de 7 ans sur le poste) Esprit d'analyse, rigueur et travail d'équipe : Expérimenté (entre 3 et 7 ans sur le poste) Habilitation à travailler en ZRR : Oui MCO/MCS de l’offre IaaS : Sénior (plus de 7 ans sur le poste) Mettre en oeuvre les outils de contrôle des accès et d’authentification : Sénior (plus de 7 ans sur le poste) OpenStack : Sénior (plus de 7 ans sur le poste) Python (Django ou Flask) : Sénior (plus de 7 ans sur le poste) Rédaction de documents d'architecture technique : Expérimenté (entre 3 et 7 ans sur le poste) Technologies de Conteneurisation : Sénior (plus de 7 ans sur le poste) Localisation : Paris
Mission freelance
Administrateur Système (Socle IA) H/F
Cheops Technology
Publiée le
Agent IA
12 mois
400 €
Évreux, Normandie
Administration et exploitation de modèles LLM : Mistral AI, OpenAI, Meta Llama o Déploiement et hébergement de modèles open source / propriétaires o Gestion des APIs IA et intégration applicative o Fine-tuning / quantization / optimisation des modèles o Serving de modèles : vLLM, Ollama, TGI, TensorRT-LLM o Gestion GPU / VRAM / performance inference o Vectorisation / embeddings / bases vectorielles o Administration de bases vectorielles : Pinecone, Weaviate, Milvus, Elasticsearch o Mise en œuvre d’architectures RAG (Retrieval-Augmented Generation) o Sécurisation des flux IA et gouvernance des prompts / données o Monitoring des usages, coûts et performances des modèles o Automatisation et orchestration MLOps / LLMOps
Mission freelance
[MDO] ASIC Verification Engineer (ARM) min 5 XP - 1548
ISUPPLIER
Publiée le
6 mois
400-455 €
Paris, France
Responsabilités principales : -Assurer la qualité globale de nos conceptions, qui contribuent à des lancements passionnants de matériel portable sans fil - Un fort accent sur les IP ARM (CPU (Cortex-a v9 arch), GPU (mali), débogage (css600, coresight), etc.) où vos connaissances et votre expérience nous permettront de revoir les décisions architecturales/de conception et d'intensifier la vérification de ces blocs -Servir de contributeur individuel pour posséder et développer la vérification de nos blocs IP principaux - Propriété tout au long du cycle de vie du projet, par exemple : revues de spécifications, plans de vérification, développement de cas de test, environnements UVM, couverture (analyse), débogage, GLS, etc. -Travailler en étroite collaboration avec d'autres équipes pour recueillir des informations pertinentes et partager vos connaissances sur la conception afin d'améliorer davantage les exigences et les spécifications. Ainsi qu'en fournissant des retours essentiels lors de leurs efforts de débogage -Collaborer avec l'équipe mondiale de vérification pour améliorer nos processus et lancer des initiatives visant à améliorer la qualité globale de la conception ainsi que la manière de travailler pour devenir la meilleure équipe de vérification de la catégorie Connaissances, compétences et aptitudes : - Expérience pratique prouvée (5+ ans) avec des méthodologies et processus de vérification de pointe, tels que UVM / SystemVerilog, vérification formelle, vérification aléatoire par contraintes, assertions, métriques de couverture, analyse de couverture, simulation au niveau de la porte, tests d'indicateurs clés de performance, etc. - Une solide compréhension des IP liées à ARM est requise : CPU (Cortex-a v9 arch), GPU (Mali), débogage (css600, Coresight), etc. - Expérience pratique dans la conception et la mise en œuvre de cas de test basés sur le C pour configurer et tester les IP ARM ainsi que la capacité de réutiliser les bancs d'essai fournis par le fabricant - Expérience dans l'utilisation et la création d'un environnement de test basé sur UVM pour la vérification au niveau des blocs ainsi que la réutilisation de ces environnements au niveau (sous-)système - Capacité à lire et comprendre le code RTL (SystemVerilog, Verilog, VHDL) - Expérience avec les systèmes de contrôle de révision et les techniques CI/CD - Compétences interpersonnelles phénoménales ; capacité à collaborer entre équipes et à travailler de manière indépendante - Excellentes compétences en développement des processus, en documentation et en communication écrite et orale
Offre d'emploi
Ingénieur systèmes linux H/F
VIVERIS
Publiée le
40k-50k €
Grenoble, Auvergne-Rhône-Alpes
Contexte de la mission : Dans un contexte d'innovation autour de l'intelligence artificielle et du calcul intensif, vous intervenez sur une infrastructure IT hybride combinant systèmes d'information classiques et plateformes HPC (High Performance Computing). Au sein d'une équipe à taille humaine, vous participez à l'exploitation, au maintien en conditions opérationnelles et à l'évolution d'environnements techniques complexes, intégrant notamment des clusters GPU. Vous évoluez dans un environnement exigeant, couvrant des périmètres variés tels que les systèmes Linux, le stockage, la virtualisation, le réseau et l'automatisation. Responsabilités : - Assurer l'exploitation, la performance et la sécurité des infrastructures (serveurs, HPC, stockage, virtualisation), tout en contribuant à leur évolution ; - Participer à la supervision (monitoring, gestion des incidents) et à l'automatisation des opérations afin d'améliorer la fiabilité des systèmes ; - Collaborer avec l'équipe et apporter un support technique avancé aux utilisateurs internes.
Mission freelance
Ingénieur IA / MLOps / LLMOps (H/F)
SPIE ICS
Publiée le
IA
6 mois
400-550 €
Fontenay-aux-Roses, Île-de-France
Rôle principal Industrialiser les modèles d’intelligence artificielle sur le cluster Kubernetes, structurer les pipelines d’entraînement et d’inférence, et accompagner les équipes Data Scientists et métiers dans leurs projets IA. Missions Concevoir et mettre en place des pipelines MLOps / LLMOps (CI/CD IA) robustes et automatisés. Gérer les workflows d’entraînement des modèles IA. Optimiser l’utilisation des GPU via batching, mixed precision, et parallélisation multi-GPU. Déployer des API d’inférence performantes et scalables. Mettre en place et gérer un registre (registry) des modèles IA. Assurer la gestion des versions des datasets et des modèles. Effectuer une veille technologique constante sur les outils et méthodes IA. Apporter un support technique aux équipes R&D. Réaliser des benchmarks de performance des modèles et des pipelines. Compétences clés MLOps / LLMOps : Expérience dans la mise en place et la gestion de pipelines MLOps, maîtrise des outils tels que MLflow, Weights & Biases, Kubeflow, Argo Workflows, GitLab CI, GitHub Actions, vLLM. Intelligence Artificielle : Expertise en IA générative, deep learning, utilisation des frameworks Hugging Face. Optimisation GPU : Maîtrise de CUDA, techniques de batching, mixed precision, multi-GPU. Langages de script : Python, Bash. DevOps : Intégration et automatisation avec Kubernetes, Docker, gestion des déploiements automatisés.
Mission freelance
ML Engineer : LLM multimodal et fine-tuning
INSYCO
Publiée le
AWS Glue
Azure
CI/CD
6 mois
Paris, France
Bonjour, Nous recherchons pour notre client grand compte un ML Engineer spécialisé en modèles LLM multimodaux et fine-tuning pour l'audiovisuel Nous étudions - prioritairement - les candidatures qui nous sont adressées à freelance à insyco . fr avec les informations suivantes : Argumentaire écrit répondant de façon ciblée au besoin ci-dessous CV à jour en français Date de prochaine disponibilité Tarif journalier Merci d'indiquer la référence MLE/5344-6 dans l'objet de votre message Contexte de la prestation La prestation s'inscrit chez un grand compte du secteur des médias et de l'audiovisuel, engagé dans la plateformisation de son offre numérique et le développement de ses usages data et IA. Le besoin porte sur l'adaptation et le fine-tuning de modèles open-source multimodaux pour des cas d'usage audiovisuels, leur industrialisation et leur mise en production, ainsi que leur intégration dans l'écosystème média existant. Activités principales Identifier, adapter et fine-tuner des modèles open-source (vision, audio, parole, texte) pour des cas d'usage audiovisuels spécifiques. Implémenter des stratégies avancées d'interaction et d'optimisation (prompt-engineering, RAG (Retrieval-Augmented Generation), LoRA/distillation, quantization, pruning) pour maximiser précision, latence et pertinence éditoriale. Architecturer des pipelines multimodaux end-to-end fusionnant vidéo, audio, images et texte pour enrichir les métadonnées, optimiser l'indexation et automatiser les workflows de production. Établir des métriques d'évaluation, benchmarker et itérer sur les systèmes d'IA via des KPIs techniques et business clairement définis. Concevoir et déployer des solutions multimodales cross-data et cross-modality pour étendre les capacités prédictives et génératives des modèles. Administrer et optimiser l'infrastructure technique nécessaire au déploiement, monitoring et ajustement des modèles en production (clusters GPU/TPU, gateway d'inférence, scaling policies). Orchestrer l'intégration des services IA dans l'écosystème média existant (MAM/PAM, NRCS, chaînes de transcription, pipelines de distribution, systèmes d'information logiciels SI) en collaboration avec product owners et tech leads. Structurer, enrichir et valider les datasets audiovisuels en garantissant leur alignement avec les exigences éditoriales, culturelles et éthiques. Instrumenter, mesurer et raffiner les modèles en conditions opérationnelles (accuracy, fairness, explainability, pertinence culturelle, empreinte carbone). Coordonner avec les équipes pluridisciplinaires l'alignement des solutions IA avec les objectifs stratégiques et le cadre réglementaire (RGPD, AI Act). Élaborer et maintenir une documentation technique exhaustive assurant la transmissibilité des connaissances.
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
- xRACI et xRICEF, une nouvelle méthode ne plus rater le périmètre de votre projet
- Cfe énorme, changement de domiciliation ?
- Redressement massif pour les SASU à l’IR
- Arrêt longue maladie et prévoyance : question sur les IJ
- PER assurantiel : avez-vous déjà regardé qui défend vraiment vos intérêts ?
- Besoin de vos retours honnêtes sur la recheche de missions free sur free-work.
17 résultats
Contrats
Lieu
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois