Trouvez votre prochaine offre d’emploi ou de mission freelance CPU à Paris
Votre recherche renvoie 3 résultats.
Offre d'emploi
Expert Kafka
KLETA
Publiée le
Apache Kafka
DevOps
3 ans
Paris, France
Dans le cadre de l’exploitation d’une plateforme Kafka parmi les plus volumineuses, nous recherchons un Expert Kafka pour assurer le build, le run et l’évolution continue de l’infrastructure de streaming. Vous interviendrez sur la gestion opérationnelle de clusters Kafka et Confluent Cloud à grande échelle, incluant des dizaines de clusters en production, plusieurs centaines d’instances et des dizaines de milliers de topics et partitions. Vous serez responsable de la performance, de la disponibilité et de la supervision de la plateforme, ainsi que de la gestion des connecteurs Kafka Connect et des flux temps réel à très fort débit. Vous participerez activement aux activités N3 et N4, en lien étroit avec le support éditeur et les équipes d’expertise, et contribuerez à la résolution d’incidents complexes. Vous interviendrez également sur l’industrialisation des déploiements et l’optimisation des infrastructures sous-jacentes (CPU, mémoire, stockage), dans une logique d’amélioration continue.
Mission freelance
Senior Lead Performance & Resilience Engineer (H/F) – Tests de charge & résilience
HOXTON PARTNERS
Publiée le
API
Kubernetes
3 mois
75002, Paris, Île-de-France
Dans le cadre d’un programme stratégique de construction d’une plateforme de règlements d’opérations de marché en euro tokenisé, nous recherchons un Lead Performance & Resilience Engineer pour piloter l’ensemble des tests de charge et de robustesse. La plateforme doit entrer en production en septembre 2026. Le projet nécessite le démarrage immédiat de campagnes de tests de résilience et de performance afin de sécuriser la scalabilité, la stabilité et la capacité du système à absorber des volumes critiques. Le consultant interviendra en tant que référent sur la définition de la stratégie de tests, la coordination des campagnes, l’analyse des résultats et la proposition de plans de remédiation en collaboration étroite avec les équipes techniques et les architectes. Missions principales : Définition de la stratégie globale de tests de performance et de résilience Conception des scénarios de tests de charge, stress, endurance et montée en charge Pilotage et supervision des campagnes de tests Analyse approfondie des métriques techniques (CPU, mémoire, réseau, logs, traces, throughput, latence) Identification des goulots d’étranglement et des causes racines Proposition et suivi des plans de remédiation Collaboration avec les équipes développement, architecture, DevOps et exploitation Reporting et documentation des analyses et recommandations
Offre d'emploi
Administrateur Systèmes et réseaux H/F
OUICODING
Publiée le
35k-50k €
Paris, Île-de-France
Vous travaillerez dans le cadre du déploiement et de l'exploitation d'une AI Factory à très grande échelle, reposant sur plusieurs clusters. Vous serez en charge de l'architecture, de l'optimisation et de l'évolution des infrastructures réseaux, systèmes et GPU fabrics alimentant des charges IA critiques (training, fine-tuning, inference). L'environnement est international, hautement distribué (Europe, Amérique du Nord, Asie) et orienté performance extrême, faible latence et scalabilité horizontale. Architecture & design de la GPU Fabric : -Concevoir et faire évoluer des architectures réseau haut débit, faible latence, adaptées aux NVL72 et aux workloads IA massivement parallèles -Définir les topologies réseau (leaf-spine, fat-tree, dragonfly le cas échéant) pour : Interconnexion intra-NVL72, Scale-out multi-racks / multi-clusters -Sélectionner et valider les technologies : InfiniBand HDR / NDR, Ethernet Spectrum / RoCEv2, Dimensionner les fabrics pour des usages IA à très grande échelle (NCCL-heavy, all-reduce intensif) Performance, RDMA & communications GPU : -Piloter le développement, l'optimisation et le tuning des communications RDMA -Piles RDMA : libibverbs, rdma-core, NVPeerMemory -Optimisations GPUDirect / GPUDirect-RDMA -Garantir des transferts GPU / GPU et GPU / NIC à très haute performance, sans surcharge CPU -Optimiser les communications collectives : NCCL, MPI / CUDA-aware MPI, Identifier et lever les goulots d'étranglement réseau, mémoire et CPU/GPU. Intégration Kubernetes & workloads IA : -Concevoir l'intégration réseau de clusters GPU dans des environnements Kubernetes -Gérer l'exposition et l'isolation des interfaces RDMA : Device Plugin, Network Operator / CNI avancés -Garantir le bon fonctionnement des workloads conteneurisés IA : Training distribué, Jobs MPI / NCCL, Pipelines data GPU Exploitation, observabilité & troubleshooting : -Mettre en place et exploiter des solutions de monitoring avancé : Latence, bande passante, congestion, erreurs -Outils : Prometheus, Grafana, NetQ, UFM (ou équivalents) -Analyser les performances réseau et GPU fabric en production -Proposer et implémenter : Ajustements MTU, Affinités CPU/GPU, Tuning NIC, switch et firmware -Assurer le support niveau 2/3 sur incidents critiques
Déposez votre CV
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Derniers posts sur le forum
3 résultats
Contrats
Lieu
1
1
Paris, France
0 Km
200 Km
Télétravail
Taux Journalier Moyen min.
150 €
1300 € et +
Salaire brut annuel min.
20k €
250k €
Durée
0
mois
48
mois