Le poste Ingénieur Infrastructure Data – Cloudera / Hadoop
Partager cette offre
Au sein de l’équipe Data & IA, l’Ingénieur Infrastructure Data est responsable de l’administration, de l’évolution et du maintien en conditions opérationnelles des plateformes Big Data basées sur l’écosystème Cloudera CDP et des technologies Open Source. Il conçoit et met en œuvre des solutions d’ingestion, de stockage et de traitement de données (Hadoop, Ozone, Hive, Kafka, Spark, etc.), automatise les pipelines de données et veille à la qualité, la sécurité et la conformité des données, notamment au regard du RGPD. Il participe également à l’industrialisation et au déploiement de modèles de data science et de machine learning, tout en assurant le support technique aux équipes applicatives et métiers. Enfin, il contribue aux projets d’évolution des plateformes, à la migration des clusters Hadoop et à l’amélioration continue des infrastructures, en collaboration avec les équipes infrastructures, production et internationales.
Profil recherché
Le poste s’adresse à un ingénieur disposant d’une solide expérience dans l’administration et l’exploitation de plateformes Big Data, notamment dans l’écosystème Cloudera CDP 7.1.x. Il possède de bonnes compétences sur les environnements Linux RedHat (8 et 9), ainsi qu’en automatisation et scripting avec Python, Bash et des outils DevOps. Une maîtrise des technologies de l’écosystème Apache (Hadoop, Hive, Spark, Kafka, HBase, Ranger, Zookeeper…) et des outils d’orchestration et d’automatisation (Ansible, Airflow, Maven, Gradle) est attendue, ainsi qu’une capacité à intervenir sur des architectures de données distribuées et conteneurisées (Kubernetes, OpenShift). Le candidat doit également faire preuve d’une forte capacité d’analyse pour résoudre des incidents complexes, d’un bon sens du service pour accompagner les équipes métiers et applicatives, et d’une aisance en communication en anglais dans un contexte international.
Environnement de travail
Le poste s’inscrit au sein d’une équipe Data & IA en charge de l’exploitation et de l’évolution de plateformes Big Data critiques dans un environnement technique moderne basé sur l’écosystème Apache et la solution Cloudera CDP. L’ingénieur travaille en étroite collaboration avec les équipes infrastructures, les équipes de production applicative, les plateformes internationales ainsi que les équipes métiers afin d’assurer la disponibilité, la performance et la sécurité des systèmes de données. L’environnement est orienté DevOps et automatisation, avec l’utilisation de technologies telles que Hadoop, Spark, Kafka, Hive, Kubernetes/OpenShift, Python et Ansible. L’équipe assure une couverture opérationnelle étendue (8h–19h) avec un système d’astreintes par rotation afin de garantir la continuité de service des plateformes data.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Ingénieur Infrastructure Data – Cloudera / Hadoop
Deodis