Partager cette offre
OnSpark est un cabinet spécialisé dans la GMAO/EAM et l'intégration SI, en forte croissance (40 collaborateurs, CA 3,3 M€). Dans le cadre de la diversification de son offre vers la Data et l'Intelligence Artificielle, nous recherchons un Data Engineer / Data Scientist pour accompagner nos clients grands comptes. Vous interviendrez au sein d'un Pôle Data mature, exploitant une plateforme Big Data on-premise (Cloudera Data Platform Private Cloud) et un environnement de Data Science (Cloudera Machine Learning). Vos missions s'articulent autour de l'ingestion de données massives issues de multiples partenaires institutionnels, de l'accompagnement des équipes métier et de la mise en œuvre de cas d'usage data avancés (data science, IA, machine learning, NLP, dataviz).
ResponsabilitésCollecte des données
Développer, industrialiser et maintenir des pipelines d'ingestion de sources de données internes et externes
Participer à la préparation et au suivi de la qualité des données
Identifier des opportunités d'utilisation de nouvelles données
Expertise & accompagnement métier
Accompagner les chargés d'études dans leur utilisation de la plateforme de données (POC/POV, support, expertise, formation)
Contribuer et maintenir en condition opérationnelle les cas d'usage sur la plateforme (simulateurs, prévisions, indicateurs, data science, IA)
Valoriser et exposer les résultats via des outils de visualisation ou de micro-services
Sécuriser & MCO
Comprendre les contraintes des équipes supports (sécurité, infrastructure, RGPD)
Contribuer aux bonnes pratiques de développement, standardisation des livrables, amélioration continue
Profil recherché
Formation Bac+5 (École d'ingénieur ou Master Big Data / Data Science)
Minimum 5 ans d'expérience dans les activités d'ingénierie data
Maîtrise de l'écosystème Hadoop : HDFS, Yarn, Oozie, Airflow, Spark, Hive, Impala
Distribution Cloudera CDP on-premise
Maîtrise du calcul distribué Spark on Yarn
Langages : Python (Pandas, Plotly), PySpark, R, SQL/HQL
Compétences en Machine Learning & Deep Learning
Connaissance d'au moins un outil de datavisualisation (QlikSense, Tableau, Power BI…)
Connaissance des principes de gouvernance de la donnée (dictionnaire, qualité, RGPD)
Connaissance des principes Agile / Cycle V
Bonnes pratiques CI/CD et versionning
La connaissance du secteur public et de la protection sociale est un plus
Excellentes qualités relationnelles, communicationnelles et rédactionnelles
Présence physique requise à Paris 12ème (télétravail possible jusqu'à 2 jours/semaine)
Mission longue durée avec possibilité d'intégration en CDI
Collaboration avec les équipes internes et autres prestataires
Postulez à cette offre !
Trouvez votre prochaine mission parmi +10 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
Data Engineer / Data Scientist
ONSPARK