Le poste Senior DevOps - ML Platform
Partager cette offre
Vous rejoindrez l’équipe ML Platform, dont la mission est d’améliorer la productivité des chercheurs en machine learning en développant des bibliothèques, services, outils et bonnes pratiques, tout en garantissant une mise en production robuste des modèles ML à grande échelle.
L’équipe est composée :
d’ingénieurs travaillant sur des projets transverses,
et de profils accompagnant les équipes fonctionnelles dans leur parcours ML.
Vous travaillerez également en étroite collaboration avec le ML Lab, une équipe de recherche académique nécessitant des outils et infrastructures dédiés, distincts de l’infrastructure principale, afin de :
accéder librement aux technologies open source de pointe,
collaborer avec des partenaires externes,
expérimenter rapidement à grande échelle.
En tant que Senior DevOps Engineer au sein de l’équipe ML Platform, vous mettrez à profit votre solide background en ingénierie logicielle, votre maîtrise de Python et votre expérience des environnements cloud pour faciliter le travail quotidien du ML Lab sur , tout en assurant les interconnexions nécessaires avec l’infrastructure principale, majoritairement basée sur AWS.
Responsabilités principalesConfigurer et maintenir l’environnement cloud , notamment pour l’accès GPU du ML Lab
Mettre en place des mécanismes FinOps et des protections minimales contre les erreurs humaines (“fat fingers”)
Optimiser les images Docker afin de réduire les temps de cold start
Implémenter et maintenir des systèmes de monitoring pour l’entraînement des modèles ML
Contribuer ponctuellement aux projets transverses de l’équipe ML Platform sur AWS (CI/CD, outillage cloud, services communs pour les chercheurs)
Promouvoir et implémenter des processus d’automatisation
Renforcer la sécurité via des évaluations de vulnérabilités, la gestion des risques et le déploiement de mesures de cybersécurité adaptées
Profil recherché
Excellente maîtrise de Terraform et AWS
Solide expérience en CI/CD, idéalement avec GitLab CI et Jenkins
Expérience approfondie de Docker, incluant la gestion d’images Docker volumineuses à l’échelle d’une organisation
Maîtrise de la mise en place et de l’exploitation de systèmes de monitoring
Très bonne connaissance des systèmes UNIX/Linux
Postulez à cette offre !
Trouvez votre prochaine mission parmi +8 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Senior DevOps - ML Platform
Atlas Connect