Trouvez votre prochaine offre d’emploi ou de mission freelance Calcul hautes performances (HPC)
Votre recherche renvoie 3 résultats.
Offre premium
Offre d'emploi
HPC Operations
Halian
Publiée le
Calcul hautes performances (HPC)
CPU
GPU
4 ans
France
FULL REMOTE Principal Engineer – HPC Operations Description du poste Nous recherchons un(e) Principal Engineer – HPC Operations expérimenté(e) pour piloter l’exploitation quotidienne d’infrastructures de calcul haute performance (HPC) dédiées à des workloads à grande échelle en IA et Machine Learning . Ce rôle clé consiste à garantir la stabilité, la performance, la sécurité et l’évolutivité des clusters HPC, en s’appuyant sur des technologies telles que Slurm, Kubernetes et des plateformes MLOps modernes . Vous interviendrez dans des environnements complexes et distribués à l’échelle internationale, tout en jouant un rôle de référent technique et de mentor pour les équipes opérationnelles. Responsabilités principales Assurer la gestion opérationnelle quotidienne des infrastructures HPC (compute, stockage, réseau, ordonnanceurs comme Slurm et Kubernetes). Optimiser la performance, la disponibilité et l’utilisation des ressources (CPU, GPU, stockage). Être le point de contact technique principal pour les déploiements HPC dans le périmètre. Agir comme point d’escalade technique (L3) pour les équipes support, en assurant une résolution rapide et efficace des incidents. Superviser l’état des systèmes via des outils de monitoring et d’observabilité (Prometheus, Grafana, DCGM). Gérer les environnements utilisateurs pour les workloads IA/ML via des containers et orchestrateurs (Docker, Kubernetes) et des outils MLOps (MLflow, Kubeflow). Définir et appliquer les politiques de planification des jobs (priorités, quotas, partitions) afin de garantir l’équité et l’efficacité des ressources. Piloter les analyses de causes racines (RCA) , contribuer aux post-mortems et mener des actions d’amélioration continue. Encadrer et accompagner les ingénieurs moins expérimentés , favoriser le partage de connaissances et la montée en compétences. Participer à l’ astreinte si nécessaire. Veiller au respect des politiques de sécurité, des processus opérationnels et des exigences d’audit , et maintenir la documentation associée. Profil recherché Formation & expérience Bac+5 en informatique, ingénierie ou domaine technique équivalent. Minimum 8 ans d’expérience en HPC, ingénierie systèmes ou DevOps, dont au moins 2 ans dans un rôle senior ou de leadership technique . Compétences techniques Expertise avancée en environnements HPC complexes (matériel, logiciels, stockage). Expérience confirmée avec Slurm et/ou Kubernetes appliqués à des workloads IA/ML. Solide maîtrise de la gestion des GPU , des ordonnanceurs de charges et de l’optimisation des performances. Bonne connaissance des outils de monitoring (Prometheus, Grafana, DCGM). Excellentes compétences en automatisation et scripting : Python, Bash, Ansible, Terraform. Très bonne maîtrise de Linux (RHEL, CentOS, Ubuntu). Connaissances approfondies en réseaux haute performance (RDMA, InfiniBand, RoCE). Expérience avec des solutions de stockage telles que NFS, Lustre, Ceph.
Mission freelance
Ingénieur système linux
Cherry Pick
Publiée le
Calcul hautes performances (HPC)
Linux
12 mois
650 €
Paris, France
Missions du Poste Mise à niveau et migration des services d'infrastructure critiques (DNS, DHCP, LDAP, etc.). Conception et spécification de nos plateformes serveurs de nouvelle génération. Développement et extension des services de stockage pour répondre aux besoins croissants en performance et en capacité. Extension et modernisation de l'infrastructure interne de calcul haute performance (HPC). Gestion de la communication technique avec les fournisseurs externes (existants et nouveaux) sur les sujets d'infrastructure. Coordination et communication interne entre les différentes équipes pour piloter les projets, les améliorations ou les déploiements. Développement et support de l'infrastructure nécessaire aux équipes de recherche, de trading et aux services de l'entreprise.
Offre d'emploi
Ingénieur Intégration HPC – Simulation Numérique
RIDCHA DATA
Publiée le
Calcul hautes performances (HPC)
Google Cloud Platform (GCP)
Linux
1 an
Île-de-France, France
🎯 Contexte Dans le cadre d’un programme stratégique autour de la simulation numérique , une grande organisation industrielle renforce ses équipes afin d’optimiser le développement de produits via des solutions de calcul avancé (HPC). La simulation numérique joue un rôle clé dans la réduction des coûts de prototypage et l’amélioration des performances, en s’appuyant sur un écosystème de logiciels métiers spécialisés (acoustique, thermique, etc.). 🚀 Missions principales Mise en place et maintien d’environnements Linux (Shell / Bash) Développement de scripts pour orchestrateurs HPC (Slurm, LSF) Installation et configuration de postes Windows 10/11 (Batch, PowerShell, XML) Monitoring des ressources (serveurs, licences) Diagnostic des incidents multi-environnements : Windows Linux Orchestrateurs Logiciels de simulation Utilisation de MPI pour le calcul distribué (multi-nœuds) Accompagnement des utilisateurs (support, compréhension des besoins) Participation à des projets en mode Agile Contribution à des environnements Cloud (notamment GCP) 📦 Livrables attendus Documentation technique (conception) Code source développé Tests unitaires et d’intégration
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
3 résultats
Contrats
Lieu
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois