Job position Data Engineer Sénior (Hadoop / Python)
Share this job
Au sein du pôle Big Data d'un grand groupe, l'objectif principal de ce poste est de réaliser et de maintenir les développements nécessaires à l'alimentation du Datalake sur une plateforme Cloudera Hadoop, de mettre en place des extractions de données et d'accompagner les utilisateurs. Rattaché(e) au responsable Big Data, vous évoluerez dans un contexte de production à fortes attentes où la tenue des délais de livraison et le pilotage opérationnel sont primordiaux.
Vos principales missions seront les suivantes :
Développement et intégration : Prendre en charge les évolutions des données à intégrer et reprendre les développements existants pour l'alimentation du Datalake. Vous développerez également des extractions avec un niveau d'expertise en SQL et créerez des scripts Shell avancés pour l'automatisation.
Expertise technique et mentorat : Spécifier techniquement les tâches, fournir des requêtes de référence, effectuer des revues de code et accompagner les collaborateurs juniors, stagiaires ou alternants.
Support et accompagnement : Assurer le support de niveau 2, faire appliquer les bonnes pratiques et consignes aux utilisateurs, et rédiger la documentation requise (guides, description de processus).
Optimisation et maintenance : Garantir la maintenabilité, les performances et l'exploitabilité de la plateforme en respectant l'utilisation des modèles référencés par la Gouvernance de la Donnée. Vous optimiserez les traitements de la plateforme et ceux des utilisateurs, et mènerez des investigations (reverse engineering) dans une architecture héritée complexe
Candidate profile
Profil recherché :
Compétences techniques exigées (Niveau Maîtrise / Autonomie complète) : Écosystème Hadoop Cloudera, Hive, Impala, Python, Shell, Linux, SQL (niveau expert), Spark (Scala) et utilisation de l'outil de versionning GIT.
Compétences appréciées (Les "Plus") : L'utilisation de Jupyter, Power BI, SAS, ainsi que la pratique du langage VBA sont des atouts supplémentaires. Une connaissance de l'écosystème du domaine de la protection sociale ou de la retraite est idéale mais non obligatoire.
Savoir-être (Soft skills) : Vous possédez de fortes capacités de communication et de pédagogie, ce qui vous permet d'expliquer simplement des sujets techniques complexes à des interlocuteurs très variés (développeurs, bureaux d'étude, clients finaux). Vous faites preuve de diplomatie, d'écoute, de rigueur dans la structuration de l'activité via des outils comme JIRA, et vous aimez partager votre savoir-faire.
Working environment
Stack technique & Technologique : Cloudera Hadoop, Hive, Impala, Python, SQL, Shell, Spark, Linux, GIT, JIRA, VBA, Jupyter.
Méthodologie : Environnement Agile (méthodes Kanban et/ou Scrum).
Apply to this job!
Find your next career move from +800 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Data Engineer Sénior (Hadoop / Python)
Les Filles et les Garçons de la Tech
