Find your next tech and IT Job or contract CPU
Your search returns 7 results.
Premium Job
Job Vacancy
HPC Operations
Halian
Published on
CPU
GPU
High performance computing (HPC)
4 years
France
FULL REMOTE Principal Engineer – HPC Operations Description du poste Nous recherchons un(e) Principal Engineer – HPC Operations expérimenté(e) pour piloter l’exploitation quotidienne d’infrastructures de calcul haute performance (HPC) dédiées à des workloads à grande échelle en IA et Machine Learning . Ce rôle clé consiste à garantir la stabilité, la performance, la sécurité et l’évolutivité des clusters HPC, en s’appuyant sur des technologies telles que Slurm, Kubernetes et des plateformes MLOps modernes . Vous interviendrez dans des environnements complexes et distribués à l’échelle internationale, tout en jouant un rôle de référent technique et de mentor pour les équipes opérationnelles. Responsabilités principales Assurer la gestion opérationnelle quotidienne des infrastructures HPC (compute, stockage, réseau, ordonnanceurs comme Slurm et Kubernetes). Optimiser la performance, la disponibilité et l’utilisation des ressources (CPU, GPU, stockage). Être le point de contact technique principal pour les déploiements HPC dans le périmètre. Agir comme point d’escalade technique (L3) pour les équipes support, en assurant une résolution rapide et efficace des incidents. Superviser l’état des systèmes via des outils de monitoring et d’observabilité (Prometheus, Grafana, DCGM). Gérer les environnements utilisateurs pour les workloads IA/ML via des containers et orchestrateurs (Docker, Kubernetes) et des outils MLOps (MLflow, Kubeflow). Définir et appliquer les politiques de planification des jobs (priorités, quotas, partitions) afin de garantir l’équité et l’efficacité des ressources. Piloter les analyses de causes racines (RCA) , contribuer aux post-mortems et mener des actions d’amélioration continue. Encadrer et accompagner les ingénieurs moins expérimentés , favoriser le partage de connaissances et la montée en compétences. Participer à l’ astreinte si nécessaire. Veiller au respect des politiques de sécurité, des processus opérationnels et des exigences d’audit , et maintenir la documentation associée. Profil recherché Formation & expérience Bac+5 en informatique, ingénierie ou domaine technique équivalent. Minimum 8 ans d’expérience en HPC, ingénierie systèmes ou DevOps, dont au moins 2 ans dans un rôle senior ou de leadership technique . Compétences techniques Expertise avancée en environnements HPC complexes (matériel, logiciels, stockage). Expérience confirmée avec Slurm et/ou Kubernetes appliqués à des workloads IA/ML. Solide maîtrise de la gestion des GPU , des ordonnanceurs de charges et de l’optimisation des performances. Bonne connaissance des outils de monitoring (Prometheus, Grafana, DCGM). Excellentes compétences en automatisation et scripting : Python, Bash, Ansible, Terraform. Très bonne maîtrise de Linux (RHEL, CentOS, Ubuntu). Connaissances approfondies en réseaux haute performance (RDMA, InfiniBand, RoCE). Expérience avec des solutions de stockage telles que NFS, Lustre, Ceph.
Contractor job
Expert Mainframe & administrateur Mainframe
KUBE Partners S.L. / Pixie Services
Published on
COBOL
IBM Db2
Mainframe
1 year
Paris, France
Au sein de la DSI, vous interviendrez sur les environnements Mainframe afin de garantir la disponibilité, la performance et la sécurité des applications métiers critiques (gestion des contrats, sinistres, comptabilité, etc.). Vous serez responsable de la maintenance, de l’optimisation et de la modernisation des systèmes mainframe, en lien avec les équipes applicatives et d’infrastructure. Missions principales • Administrer les environnements mainframe. • Superviser les traitements batch et temps réel. • Diagnostiquer et résoudre les incidents de performance et disponibilité. • Participer aux projets d’évolution ou de migration • Garantir la conformité sécurité. • Rédiger la documentation technique et accompagner les équipes internes. Mission Ingénieur système Mainframe • Installer, configurer et maintenir le système d'exploitation z/OS • Gérer les partitions logiques (LPAR) et les ressources CPU/mémoire • Superviser les sous-systèmes JES2/JES3, VTAM, TCP/IP • Assurer la sécurité via RACF et appliquer les politiques de conformité • Planifier et exécuter les sauvegardes et procédures de reprise (DRP) • Diagnostiquer et résoudre les incidents techniques • Automatiser les tâches via JCL, REXX et outils de scripting Expert système Mainframe • Définir l'architecture globale des systèmes Mainframe (LPAR, z/OS, sous-systèmes) • Concevoir des solutions haute disponibilité et plans de reprise (DRP) • Optimiser les performances et réaliser des analyses avancées (RMF, SMF) • Élaborer des politiques de sécurité et superviser la conformité réglementaire • Piloter la modernisation et l'intégration des technologies (API, Cloud hybride) • Encadrer les équipes techniques et assurer le transfert de compétences
Contractor job
Expert Linux / Devops
emagine Consulting SARL
Published on
Ansible
Linux administration
Terraform
3 years
Ile-de-France, France
Compétences clés: Troubleshooting avancé Diagnostic et résolution d'incidents complexes en intersection système, réseau et applicatif (N1 à N3). Analyse Root Cause (RCA), corrélation de logs multi-sources, escalade structurée et rédaction de comptes-rendus post-incident. Gestion des astreintes HNO sur des infrastructures critiques à fort SLA. Expertise Linux & services d'infrastructure Administration avancée de parcs Red Hat, CentOS et Debian (jusqu'à 1 400 serveurs). Gestion des packages (yum/dnf/apt), services systemd, LVM, XFS/ext4, NFS, certificats TLS, quotas disque et optimisation des ressources système (CPU, RAM, I/O). Exploitation des middlewares Apache, Nginx, Tomcat, Weblogic et WebSphere. Maîtrise des outils de supervision : Centreon, Nagios, Grafana, Dynatrace, Splunk. Relation éditeur (Red Hat, HashiCorp) Interaction avec les éditeurs Red Hat (gestion des subscriptions, application des errata via Red Hat Satellite) et HashiCorp (Terraform, Vault) pour le maintien en condition opérationnelle, la gestion des licences, les évolutions de version et le support sur incidents bloquants. Automatisation & industrialisation : Ansible, Terraform, Bash, Python Conception et déploiement de playbooks Ansible et AWX/Ansible Tower pour l'installation automatisée de serveurs, le déploiement d'applications, le patching et la standardisation des configurations à grande échelle. Provisioning d'infrastructure as code avec Terraform sur environnements cloud (GCP, Azure, AWS). Scripting Bash et Python pour l'automatisation des tâches récurrentes : collecte de métriques, archivage de logs, contrôle d'intégrité des services et génération de rapports
Job Vacancy
Architecte / Développeur OpenTelemetry
VISIAN
Published on
OpenTelemetry
1 year
40k-45k €
400-680 €
Ile-de-France, France
Missions principales 1. Architecture & Design (40%) Concevoir l’architecture globale de la plateforme d'ingestion de télémétrie basée sur OpenTelemetry (OTel Collector contrib/core) pour un déploiement multi-tenant et multi-cloud (AWS, GCP, Azure, On-Premise). Définir les stratégies de haute disponibilité, de tolérance aux pannes (buffering, retry policies) et de scalabilité horizontale des collecteurs (Gateway et Agents). Modéliser le cycle de vie de la donnée (filtrage, enrichissement, masquage des données sensibles/GDPR à la source, routage intelligent vers Splunk et Elastic). Garantir la sécurité de la plateforme (authentification mTLS, gestion des secrets, RBAC, isolation des tenants). 2. Développement & Engineering (40%) Développer et packager des configurations OTel complexes et, si nécessaire, coder des processeurs, récepteurs ou exportateurs personnalisés (Custom OTel Components) en Go (Golang). Automatiser le provisionnement des agents et des pipelines de collecte via des pratiques GitOps et de l'Infrastructure as Code (IaC) (Terraform, Helm charts, Kubernetes Operators). Créer l'interface de configuration "As-a-Service" (API-driven) permettant aux utilisateurs de provisionner et configurer leurs pipelines de collecte de manière autonome. Assurer l'interopréabilité et la traduction optimale des formats (OTLP vers Splunk HEC, OTLP vers Elastic ECS). 3. Évangélisation, Support & Amélioration Continue (20%) Documenter les standards de configuration et les meilleures pratiques pour les équipes de développement utilisatrices. Mettre en place le monitoring de la plateforme d’observabilité elle-même (auto-observabilité des collecteurs : rate d'ingestion, drop de messages, CPU/RAM). Assurer une veille technologique active sur l'écosystème OpenTelemetry (CNCF) et contribuer aux projets open-source si nécessaire.
Job Vacancy
Ingénieur Système Capacity Planning z/OS (H/F)
DCS EASYWARE
Published on
Guyancourt, Ile-de-France
Dans le cadre du renforcement de ses activités de Capacity Planning Mainframe , nous recherchons un Ingénieur Système sachant piloter la planification des capacités et anticiper les besoins en ressources afin de garantir la disponibilité et la performance des services. La mission vise à ajuster la capacité des plateformes aux besoins de performance exprimés par les clients, tout en garantissant une maîtrise des coûts. Vos missions Au sein de l’équipe Capacity Planning, vous interviendrez sur les environnements Mainframe / Système Z et participerez aux activités de Run et de Build. Vos principales missions seront les suivantes : Élaborer les plans de capacité mensuels et trimestriels. Analyser la consommation CPU, l’activité des partitions clients et les indicateurs de volumétrie. Modéliser et simuler des scénarios capacitaires à court et moyen terme. Produire des reportings, tableaux de bord et synthèses permettant d’orienter les décisions. Suivre les workloads, batchs et cut-off dans le cadre d’études spécifiques. Fournir des recommandations d’optimisation : provisioning, dimensionnement, évolution technologique. Apporter du conseil en amont des projets clients ou internes, notamment sur les sujets liés au WLM . Participer aux échanges avec les équipes clients, clusters et équipes Système Z.
Contractor job
Expert Windows core system poste de travail -Troubleshooting et Performance
VORSTONE
Published on
Helpdesk
Microsoft Windows
Windows Client
6 months
600-750 €
Paris, France
Vorstone recherche un Expert Windows core system poste de travail -Troubleshooting et Performance pour l’équipe poste de travail d'un client basé à Paris et disposant d’une expertise confirmée sur les environnements Windows, avec une forte compétence sur les couches cœur du système (Windows Core System). l'Expert Windows core system poste de travail interviendra sur des environnements complexes à forte exigence de performance. Le profil attendu doit maîtriser les problématiques d’analyse, de diagnostic et d’optimisation des systèmes, notamment dans des contextes complexes et à forte exigence de performance. L’objectif du poste est de diagnostiquer, analyser et résoudre des problématiques avancées de performance et de stabilité sur des environnements Windows 10/11 , en allant jusqu’à l’analyse des couches basses du système (Windows Core System). Missions principales Analyse et résolution d’incidents complexes de performance Windows Investigation de lenteurs système (boot, login, shutdown, applications) Analyse de comportements anormaux (CPU, mémoire, I/O disque, process) Diagnostic de problématiques liées aux drivers et filtres système (antivirus, mini-filters) Analyse de dumps système (crashs kernel et user mode) Contribution à l’amélioration de la stabilité et des performances des postes de travail
Job Vacancy
Administrateur Systèmes Virtualisation VMware (H/F)
DCS EASYWARE
Published on
Maisons-Alfort, Ile-de-France
Dans le cadre d’un projet de transformation d’infrastructure, nous recherchons un Administrateur Systèmes spécialisé VMware afin d’accompagner la migration d’un environnement de virtualisation Hyper-V vers VMware vSphere . Vous interviendrez en renfort opérationnel auprès des équipes infrastructure afin de contribuer à la migration des machines virtuelles, tout en assurant l’administration quotidienne de l’environnement VMware. Vos missions À ce titre, vos principales responsabilités seront les suivantes : Participer à la migration des machines virtuelles vers VMware vSphere ; Exécuter les procédures de migration et réaliser les tests de bon fonctionnement post-migration ; Suivre les anomalies rencontrées et contribuer à leur résolution ; Administrer l’environnement VMware : ESXi, vCenter, clusters ; Superviser les ressources CPU, RAM, stockage et contribuer à leur optimisation ; Gérer les snapshots selon les procédures définies ; Participer à la gestion des réseaux virtuels : vSwitch, portgroups, VLAN ; Automatiser certaines tâches via PowerShell / PowerCLI ; Assurer le support N2 : incidents, demandes, changements via l’outil ITSM ; Gérer les comptes et accès utilisateurs en lien avec Active Directory ; Rédiger et mettre à jour la documentation technique ; Escalader les incidents complexes vers les équipes N3 / ingénieurs ; Contribuer aux projets d’infrastructure et au reporting d’activité. Environnement technique VMware vSphere, vCenter, ESXi Migration V2V Windows Server Active Directory PowerShell / PowerCLI Supervision / monitoring Stockage SAN / NAS Sauvegarde : Veeam et/ou Commvault appréciés Hyper-V apprécié
Submit your CV
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Latest forum topics
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Experts
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Service
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Company
- Guaranteed Best & Top 2 Cryptocurrency Recovery Agency Recovering Lost & Stolen Cryptocurrency
- Guaranteed Best & Top 1 Cryptocurrency Recovery Expert Recovering Lost & Stolen Cryptocurrency
- Guaranteed Best & Top 1 Cryptocurrency Recovery Service Recovering Lost & Stolen Cryptocurrency
Jobs by city
Jobs by country
7 results
Contracts
Location
Remote type
Rate minimum.
£150
£1300 and more
Salary minimum
£20k
£250k