R&S TELECOM

Job Vacancy Senior Data Engineer – Optimisation et stabilisation d’une pipeline PySpark

Ile-de-France

R&S TELECOM

Job position

Contractor
Permanent
As soon as possible
12 months
40k-48k €, 400-480 €
5 to 10 years experience
Hybrid
Ile-de-France, France
Published on 29/12/2025

Share this job

L’équipe développe et maintient les modèles de prévision de la demande et des ventes pour l’ensemble des produits Décathlon, par centre d’approvisionnement continental. Aujourd’hui, notre pipeline est en production sur l’Europe, la Chine et l’Inde, et notre ambition pour 2026 est d’étendre la couverture à LATAM et MEA.

Dans ce cadre, nous recherchons un Data Engineer Senior expérimenté sur PySpark et l’optimisation de pipelines.

Notre Stack Data : AWS (S3, ECR, EKS); Databricks; Airflow; Pyspark; Python Et Github.

La mission portera principalement sur la reprise, l’optimisation et la refonte partielle du module de “refining”, hérité d’une autre équipe. Ce module présente aujourd’hui plusieurs limites : lenteur d'exécution (compute), manque de gouvernance, faible modularité, documentation incomplète et difficulté à évoluer ou à scaler à l’échelle mondiale. Le contexte inclut également plusieurs dettes techniques autour de la stabilité, de la qualité du code et du renforcement des tests (unitaires et fonctionnels).

Candidate profile

Objectifs et livrables

Le consultant aura pour principales responsabilités :

  • Refonte et optimisation du module “Refining” : Auditer le code existant, identifier les goulots de performance et axes d’amélioration. Revoir la structure du code pour renforcer la modularité, la lisibilité et la maintenabilité. Mettre en place une documentation claire et partagée (technique + fonctionnelle). Optimiser le traitement PySpark (logique de partitionnement, cache, broadcast, etc.). Proposer une approche flexible pour l’ajout de nouvelles features.

  • Renforcement de la robustesse et de la qualité : Implémenter ou renforcer les tests unitaires et fonctionnels. Améliorer la stabilité globale de la pipeline ML de forecast. Participer à la mise en place de bonnes pratiques d’ingénierie logicielle (CI/CD, gouvernance du code, monitoring).

  • Collaboration et transfert de compétences : Travailler étroitement avec les Data Scientists et les Machine Learning Engineers de l’équipe. Assurer un transfert de connaissances clair et structuré à l’équipe interne. Contribuer à la montée en compétence collective sur PySpark et la scalabilité de pipelines ML.

Livrables attendus :

  • Module “refining” refactoré, documenté et testé

  • Rapports d’audit et plan d’optimisation validés

  • Documentation technique centralisée

  • Pipeline stable et industrialisable à l’échelle mondiale

Compétences demandées

AWS EC2 -Expert

Programmation Python-Expert

GitHub Actions-Expert

Apache Airflow-Expert

AWS-Expert

DATABRICKS-Confirmé

AWS S3-Expert

PYSPARK-Expert

GITHUB-Expert

Vélizy-Villacoublay, Île-de-France
20 - 99 employees
IT services
R&S Telecom est une entreprise de services numériques et une équipe d'ingénieurs Telecom qui vous accompagnent dans vos projets en vous fournissant l’expertise et les conseils. Depuis 2014, notre expertise dans le conseil en intégration de nouvelles technologies, nous permet de proposer une approche globale de la gestion de projet alliant réflexion, accompagnement et assistance technique.

Apply to this job!

Find your next career move from +9,000 jobs!

  • Manage your visibility

    Salary, remote work... Define all the criteria that are important to you.

  • Get discovered

    Recruiters come directly to look for their future hires in our CV library.

  • Join a community

    Connect with like-minded tech and IT professionals on a daily basis through our forum.

Senior Data Engineer – Optimisation et stabilisation d’une pipeline PySpark

R&S TELECOM

Connecting Tech-Talent

Free-Work, THE platform for all IT professionals.

Free-workers
Resources
About
Recruiters area
2025 © Free-Work / AGSI SAS
Follow us