Le poste Data Engineer Sénior (Hadoop / Python)
Partager cette offre
Au sein du pôle Big Data d'un grand groupe, l'objectif principal de ce poste est de réaliser et de maintenir les développements nécessaires à l'alimentation du Datalake sur une plateforme Cloudera Hadoop, de mettre en place des extractions de données et d'accompagner les utilisateurs. Rattaché(e) au responsable Big Data, vous évoluerez dans un contexte de production à fortes attentes où la tenue des délais de livraison et le pilotage opérationnel sont primordiaux.
Vos principales missions seront les suivantes :
Développement et intégration : Prendre en charge les évolutions des données à intégrer et reprendre les développements existants pour l'alimentation du Datalake. Vous développerez également des extractions avec un niveau d'expertise en SQL et créerez des scripts Shell avancés pour l'automatisation.
Expertise technique et mentorat : Spécifier techniquement les tâches, fournir des requêtes de référence, effectuer des revues de code et accompagner les collaborateurs juniors, stagiaires ou alternants.
Support et accompagnement : Assurer le support de niveau 2, faire appliquer les bonnes pratiques et consignes aux utilisateurs, et rédiger la documentation requise (guides, description de processus).
Optimisation et maintenance : Garantir la maintenabilité, les performances et l'exploitabilité de la plateforme en respectant l'utilisation des modèles référencés par la Gouvernance de la Donnée. Vous optimiserez les traitements de la plateforme et ceux des utilisateurs, et mènerez des investigations (reverse engineering) dans une architecture héritée complexe
Profil recherché
Profil recherché :
Compétences techniques exigées (Niveau Maîtrise / Autonomie complète) : Écosystème Hadoop Cloudera, Hive, Impala, Python, Shell, Linux, SQL (niveau expert), Spark (Scala) et utilisation de l'outil de versionning GIT.
Compétences appréciées (Les "Plus") : L'utilisation de Jupyter, Power BI, SAS, ainsi que la pratique du langage VBA sont des atouts supplémentaires. Une connaissance de l'écosystème du domaine de la protection sociale ou de la retraite est idéale mais non obligatoire.
Savoir-être (Soft skills) : Vous possédez de fortes capacités de communication et de pédagogie, ce qui vous permet d'expliquer simplement des sujets techniques complexes à des interlocuteurs très variés (développeurs, bureaux d'étude, clients finaux). Vous faites preuve de diplomatie, d'écoute, de rigueur dans la structuration de l'activité via des outils comme JIRA, et vous aimez partager votre savoir-faire.
Environnement de travail
Stack technique & Technologique : Cloudera Hadoop, Hive, Impala, Python, SQL, Shell, Spark, Linux, GIT, JIRA, VBA, Jupyter.
Méthodologie : Environnement Agile (méthodes Kanban et/ou Scrum).
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Data Engineer Sénior (Hadoop / Python)
Les Filles et les Garçons de la Tech
