Job position Ingénieur Infrastructure Data – Cloudera / Hadoop
Share this job
Au sein de l’équipe Data & IA, l’Ingénieur Infrastructure Data est responsable de l’administration, de l’évolution et du maintien en conditions opérationnelles des plateformes Big Data basées sur l’écosystème Cloudera CDP et des technologies Open Source. Il conçoit et met en œuvre des solutions d’ingestion, de stockage et de traitement de données (Hadoop, Ozone, Hive, Kafka, Spark, etc.), automatise les pipelines de données et veille à la qualité, la sécurité et la conformité des données, notamment au regard du RGPD. Il participe également à l’industrialisation et au déploiement de modèles de data science et de machine learning, tout en assurant le support technique aux équipes applicatives et métiers. Enfin, il contribue aux projets d’évolution des plateformes, à la migration des clusters Hadoop et à l’amélioration continue des infrastructures, en collaboration avec les équipes infrastructures, production et internationales.
Candidate profile
Le poste s’adresse à un ingénieur disposant d’une solide expérience dans l’administration et l’exploitation de plateformes Big Data, notamment dans l’écosystème Cloudera CDP 7.1.x. Il possède de bonnes compétences sur les environnements Linux RedHat (8 et 9), ainsi qu’en automatisation et scripting avec Python, Bash et des outils DevOps. Une maîtrise des technologies de l’écosystème Apache (Hadoop, Hive, Spark, Kafka, HBase, Ranger, Zookeeper…) et des outils d’orchestration et d’automatisation (Ansible, Airflow, Maven, Gradle) est attendue, ainsi qu’une capacité à intervenir sur des architectures de données distribuées et conteneurisées (Kubernetes, OpenShift). Le candidat doit également faire preuve d’une forte capacité d’analyse pour résoudre des incidents complexes, d’un bon sens du service pour accompagner les équipes métiers et applicatives, et d’une aisance en communication en anglais dans un contexte international.
Working environment
Le poste s’inscrit au sein d’une équipe Data & IA en charge de l’exploitation et de l’évolution de plateformes Big Data critiques dans un environnement technique moderne basé sur l’écosystème Apache et la solution Cloudera CDP. L’ingénieur travaille en étroite collaboration avec les équipes infrastructures, les équipes de production applicative, les plateformes internationales ainsi que les équipes métiers afin d’assurer la disponibilité, la performance et la sécurité des systèmes de données. L’environnement est orienté DevOps et automatisation, avec l’utilisation de technologies telles que Hadoop, Spark, Kafka, Hive, Kubernetes/OpenShift, Python et Ansible. L’équipe assure une couverture opérationnelle étendue (8h–19h) avec un système d’astreintes par rotation afin de garantir la continuité de service des plateformes data.
Apply to this job!
Find your next career move from +800 jobs!
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Ingénieur Infrastructure Data – Cloudera / Hadoop
Deodis