Le poste ML platform senior DevOps engineer
Partager cette offre
Équipes ML Platform et ML Lab
L'équipe ML Platform est centrée sur l'amélioration de la productivité des chercheurs dans l'entraînement de modèles de machine learning (ML) en développant des bibliothèques, des services et des bonnes pratiques, et en assurant une production ML robuste à grande échelle. L'équipe est composée de profils travaillant sur des projets transverses ainsi que d'ingénieurs accompagnant les équipes fonctionnelles dans leur parcours ML.
Le ML Lab est une équipe de recherche axée sur des travaux académiques, nécessitant donc des outils et une infrastructure dédiés en dehors de l'infrastructure du client, afin de pouvoir accéder librement aux ressources open source de pointe et collaborer avec des collaborateurs externes.
Mission
En tant qu'Ingénieur DevOps au sein de l'équipe ML Platform, vous tirerez parti de votre solide bagage en ingénierie logicielle, de votre maîtrise de Python et de votre expérience pratique avec les fournisseurs cloud pour faciliter le travail quotidien de l'équipe ML Lab sur — leur néocloud de référence — ainsi que les liens nécessaires avec l'infrastructure du client, principalement hébergée sur AWS.
Responsabilités principales
Configuration du fournisseur cloud (Lambda) pour l'accès GPU par le ML Lab.
Fonctionnalités FinOps et protection minimale contre les erreurs humaines.
Optimisation des images Docker pour un démarrage à froid plus rapide.
Mise en place et maintenance de systèmes de monitoring pour l'entraînement des modèles.
Participation mineure aux projets plus larges de l'équipe ML Platform sur AWS pour les autres chercheurs du client (CI/CD, outillage sur AWS, etc.).
Promotion et mise en œuvre de processus d'automatisation.
Renforcement des protocoles de sécurité via des évaluations de vulnérabilités et la gestion des risques pour déployer des mesures de cybersécurité.
Profil recherché
Vos compétences
Obligatoires — Techniques : Anglais obligatoire
Maîtrise de Terraform et AWS.
Solide expérience en CI/CD, idéalement avec GitLab CI et Jenkins.
Expérience étendue dans l'utilisation de Docker et la gestion d'images Docker à grande échelle au sein d'une organisation.
Compétence dans la mise en place et la maintenance de systèmes de monitoring.
Bonne connaissance des systèmes UNIX.
Obligatoires — Soft skills :
Capacité à formuler et défendre des opinions fortes de manière constructive, en favorisant le consensus.
Expérience pour comprendre que toutes les décisions ne iront pas dans votre sens, avec la capacité de ne pas être d'accord tout en s'engageant.
Approche centrée sur l'utilisateur en évitant les solutions court-termistes.
Aptitude à engager et motiver les collègues à adopter les bonnes pratiques.
Engagement envers la productivité et la résilience de l'équipe par le partage des compétences, au-delà de la contribution individuelle.
Nice to have — Techniques
Expérience adjacente aux sujets liés au ML.
Avoir travaillé avec Lambda.
Avoir travaillé dans un environnement on-premise, Slurm apprécié.
Environnement de travail
Vos compétences
Obligatoires — Techniques : Anglais obligatoire
Maîtrise de Terraform et AWS.
Solide expérience en CI/CD, idéalement avec GitLab CI et Jenkins.
Expérience étendue dans l'utilisation de Docker et la gestion d'images Docker à grande échelle au sein d'une organisation.
Compétence dans la mise en place et la maintenance de systèmes de monitoring.
Bonne connaissance des systèmes UNIX.
Obligatoires — Soft skills :
Capacité à formuler et défendre des opinions fortes de manière constructive, en favorisant le consensus.
Expérience pour comprendre que toutes les décisions ne iront pas dans votre sens, avec la capacité de ne pas être d'accord tout en s'engageant.
Approche centrée sur l'utilisateur en évitant les solutions court-termistes.
Aptitude à engager et motiver les collègues à adopter les bonnes pratiques.
Engagement envers la productivité et la résilience de l'équipe par le partage des compétences, au-delà de la contribution individuelle.
Nice to have — Techniques
Expérience adjacente aux sujets liés au ML.
Avoir travaillé avec Lambda.
Avoir travaillé dans un environnement on-premise, Slurm apprécié.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
ML platform senior DevOps engineer
Cherry Pick
