Trouvez votre prochaine offre d’emploi ou de mission freelance Apache Spark

Votre recherche renvoie 103 résultats.
Freelance

Mission freelance
Administrateur / Expert Technique Big Data Hadoop Cloudera

CAT-AMANIA
Publiée le
Cloudera
Kubernetes
PostgreSQL

2 ans
400-700 €
Bordeaux, Nouvelle-Aquitaine
Dans le cadre du renforcement d'une équipe Data au sein d'une Direction Technique Informatique, nous recherchons un Ingénieur Expert Big Data Hadoop Cloudera (CDP) chargé d'assurer le maintien en conditions opérationnelles de plateformes Hadoop Cloudera en environnement Hors-Prod et Production. La mission couvre l'administration et l'exploitation des socles (supervision, gestion des incidents, optimisation des performances, capacity planning), la maintenance proactive (correctifs, mises à jour), ainsi que la rédaction de procédures et de dossiers d'architecture. Le profil interviendra également en support expertise auprès des équipes études et exploitation, et participera aux projets d'évolution des architectures techniques (logicielles, matérielles, sécurité). L'environnement technique s'articule autour de la distribution Cloudera CDP (HDFS, YARN, Hive, Impala, Spark, Ranger, Knox, Zookeeper, Iceberg) , avec des langages Shell, Python et Spark, un OS Linux RedHat, et un écosystème élargi incluant Kafka, PostgreSQL, Kubernetes, Ansible et des outils de supervision Prometheus/Grafana. Ce poste requiert une forte autonomie, un bon esprit d'équipe et la capacité à intervenir ponctuellement en dehors des heures ouvrées.
CDI

Offre d'emploi
Administrateur Cloudera & Kubernetes H/F

JEMS
Publiée le

75k-90k €
Levallois-Perret, Île-de-France
Nous recherchons un(e) Administrateur Expérimenté(e), passionné(e) par la technologie, pour travailler directement chez nos clients, en étant au cœur de leurs défis numériques. Si vous souhaitez participer à des projets d'envergure, continuer à apprendre et évoluer dans votre carrière, c'est l'occasion rêvée ! Vous aurez la charge des missions de Build et Run : RUN : • Administration et maintien en conditions opérationnelles de la plateforme Cloudera CDP • Gestion des clusters Hadoop (HDFS, YARN, Hive, Impala, Spark) via Cloudera Manager • Supervision, performance, gestion des incidents (niveau 3) • Gestion de la haute disponibilité (géo-cluster) et de la sécurité • Exploitation de Dataiku (optionnel) • Orchestration des workloads via Kubernetes BUILD : • Industrialisation des déploiements (automatisation, CI/CD) • Contribution aux évolutions d'architecture du socle Data • Mise en place et optimisation de pipelines data (Spark, Hive, Impala) • Intégration avec les environnements cloud (Azure / hybride) • Contribution au socle IA (Dataiku sur Outscale) Référence de l'offre : 1hnwz9a4s3
Freelance

Mission freelance
Architecte Expert Big Data Hadoop Cloudera (CDP)

CAT-AMANIA
Publiée le
Big Data
Cloudera
Kubernetes

2 ans
400-710 €
Bordeaux, Nouvelle-Aquitaine
Dans le cadre de l'évolution et de la modernisation d'un écosystème Data au sein d'une Direction Technique Informatique d'un grand acteur de la protection sociale, nous recherchons un Architecte Expert Big Data Hadoop Cloudera (CDP) pour concevoir, faire évoluer et maintenir des plateformes Big Data en environnement Hors-Prod et Production. La mission s'articule autour de trois axes majeurs : la participation aux projets d'évolution du socle Hadoop existant (évolutions logicielles et matérielles, sécurité, définition d'architecture, rédaction de dossiers), le maintien en conditions opérationnelles de la plateforme (administration, supervision, gestion des incidents, support aux équipes études et exploitation), et la contribution à un projet stratégique de nouvelle Plateforme DATA (étude d'impact, préconisation des choix techniques, définition des standards et normes, mise en œuvre et transfert de connaissances aux équipes exploitation). L'environnement technique s'appuie sur la distribution Cloudera CDP (HDFS, YARN, Hive, Impala, Spark, Ranger, Knox, Zookeeper, Iceberg) , avec des langages Shell, Python et Spark, un OS Linux RedHat, et un écosystème complémentaire incluant Kafka, PostgreSQL, Kubernetes et Ansible. Ce poste requiert une forte autonomie, une capacité à travailler en équipe pluridisciplinaire et une disponibilité pour des interventions ponctuelles en dehors des heures ouvrées.
CDI
Freelance

Offre d'emploi
Développeur/euse Big Data

CGI
Publiée le
Java
PL/SQL
PySpark

1 an
Lyon, Auvergne-Rhône-Alpes
Vous rejoignez CGI, leader mondial du conseil et des services numériques à Lyon et accompagnez nos clients. A Lyon, nos équipes accompagnent nos clients grands comptes dans la mise en œuvre de leurs projets stratégiques. Nos services couvrent l'ensemble du cycle de production logiciel, de l’amont des projets à la maintenance de solutions dans des domaines variés comme l'énergie, le transport, la pharma, le secteur public, la finance ou les télécommunications. Notre agence abrite également le centre mondial d'excellence de CGI dédié à la digitalisation de la supply chain, offrant ainsi de multiples perspectives d’évolution de carrière Fonctions et responsabilités Nous recherchons un(e) Développeur/euse Big Data Confirmé(e) pour intervenir sur la migration de traitements legacy vers des architectures modernes et participer à la refonte complète dans le cloud. Travail en Agile Migration de traitements existants (Informatica, PL-SQL) vers Spark Java Conception et développement de pipelines de données robustes et performants Maintenance corrective et évolutive des traitements SQL/PL-SQL existants Participation au projet de migration cloud sur Databricks Garantie de la performance, de la robustesse et de la qualité des données Participation active au RUN et à l'amélioration continue Contribution aux bonnes pratiques de développement Mise à jour du référentiel documentaire et partage de connaissances au sein de l'équipe Stack technique Spark / Java / SQL / PL-SQL / Databricks / Oracle / Informatica / Jenkins / Terraform / Git / Maven / Control-M Qualités requises pour réussir dans ce rôle Maîtrise de Spark (indispensable) Maîtrise de SQL / PL-SQL (indispensable) Programmation orientée objet Java ou Python Expérience sur des systèmes existants et culture du RUN en production
Freelance
CDI

Offre d'emploi
Data Platform / DataOps H/F

TechOps SAS
Publiée le
Azure
MuleSoft
PySpark

12 mois
40k-45k €
400-550 €
Paris, France
Nous recherchons un(e) Consultant(e) Data Platform / DataOps Senior pour intervenir au sein d’un groupe international engagé dans une transformation ambitieuse de son écosystème Data & Analytics. Au sein d’une équipe Data transverse, vous participerez à la conception, l’évolution et l’industrialisation d’une plateforme Data Cloud moderne, destinée à centraliser et valoriser les données provenant de multiples systèmes métiers. Vous contribuerez à la mise en place de solutions robustes, scalables et sécurisées permettant de répondre aux enjeux de gouvernance, d’intégration et d’exploitation de la donnée. Vos principales responsabilités seront les suivantes : Participer à l’architecture et à l’évolution de la plateforme Data ; Concevoir et industrialiser les pipelines de traitement et d’intégration de données ; Développer et optimiser les traitements de données à grande échelle sur Spark ; Mettre en œuvre les bonnes pratiques DataOps (CI/CD, automatisation, monitoring, qualité des données) ; Contribuer à l’intégration des applications et des flux de données au sein du SI ; Collaborer avec les équipes Data Engineering, Architecture, BI et Métiers ; Participer à l’amélioration continue de la performance, de la fiabilité et de la sécurité de la plateforme. Environnement technique : Azure, Databricks, Spark/PySpark, Azure Data Factory, Azure DevOps, Data Lake, CI/CD, API & intégration de données. Nous recherchons un profil disposant d’au moins 6 ans d’expérience sur des environnements Data Cloud, avec une solide expertise Azure et Spark. Une expérience des sujets d’intégration de données et des plateformes iPaaS constitue un véritable atout. Une connaissance de MuleSoft serait particulièrement appréciée. Le poste nécessite une forte capacité à évoluer dans des environnements internationaux, à dialoguer avec des interlocuteurs techniques et fonctionnels, ainsi qu’une bonne autonomie sur les problématiques de plateforme Data et d’industrialisation.
Freelance
CDI

Offre d'emploi
Développeur Python H/F

CONSORT GROUP
Publiée le
PySpark
Python

1 mois
55k-62k €
75017, Paris, Île-de-France
Chaque moment compte. Surtout ceux que vous vivez à fond. Bienvenue chez Consort Group. Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l’humain et la responsabilité sociétale au cœur de ses valeurs. C’est votre future équipe Les équipes de ConsortIA , sont des acteurs de référence de la Data, du Développement Digital et de l'Ingénierie Média. En combinant ces expertises, nous concevons des systèmes d’information augmentés, intégrés, agiles et sécurisés, au service de la performance et de la transformation numérique de nos clients. Développeur Python H/F C’est votre mission Vous êtes passionné·e par le développement de solutions data à grande échelle et les environnements Big Data ? Ce poste est fait pour vous. En tant que Développeur Python , vous êtes responsable du développement et de la maintenance de notre écosystème : Côté build : Concevoir et développer des applications et pipelines de traitement de données en Python et PySpark Développer des traitements distribués performants sur des environnements Spark Participer à la conception technique et à l’évolution des architectures Data Mettre en œuvre les bonnes pratiques de développement (qualité de code, tests, documentation) Participer aux revues de code et aux choix techniques de l’équipe Contribuer à l’automatisation des processus de déploiement et d’intégration continue Collaborer avec les équipes Data Engineering, DevOps et métiers dans un contexte Agile Côté run : Assurer le maintien en conditions opérationnelles des traitements de données Analyser et résoudre les incidents de production Optimiser les performances des jobs Spark et des applications Python Superviser les flux de données et garantir leur fiabilité Participer aux actions d’amélioration continue et à la réduction de la dette technique Assurer le support technique de niveau avancé auprès des équipes projet C’est votre parcours Vous avez au moins 5 ans d’expérience . Vous aimez relever des défis techniques autour de la performance, de la scalabilité et de la qualité logicielle, sans jamais cesser d’innover. Vous cherchez un cadre où vos idées comptent et où la technique va de pair avec la collaboration. C’est votre expertise : Python, PySpark, Apache Spark, SQL Environnements Linux, Git, CI/CD (GitLab CI, Jenkins ou équivalent) Méthodologies Agile / Scrum Connaissance des environnements Cloud (AWS, Azure ou GCP) Outils de conteneurisation et d’orchestration (Docker, Kubernetes) Anglais professionnel à l’écrit comme à l’oral C’est votre manière de faire équipe : Esprit d’analyse et capacité à résoudre des problématiques complexes Excellentes capacités de communication et de collaboration Autonomie et sens des responsabilités Curiosité technique et force de proposition Capacité d’adaptation dans des environnements en constante évolution C’est notre engagement Chez Consort Group, vous êtes un·e expert·e qu’on accompagne pour que chaque mission devienne une étape qui compte. Un onboarding attentif et humain Une vraie proximité managériale Des formations accessibles en continu Des engagements concrets : inclusion, égalité, solidarité Un package RH complet : mutuelle, carte TR, CSE, prévoyance Une culture du feedback et des projets qui font sens C’est clair Le process de recrutement : Un premier échange téléphonique avec notre team recrutement Un entretien RH ainsi qu’un échange métier avec un.e ingénieur.e d’affaires Un test ou un échange technique avec un.e de nos expert.es Un dernier point avec votre futur.e manager ou responsable de mission Et si on se reconnaît : on démarre ensemble C’est bon à savoir Lieu : Paris Contrat : CDI Télétravail : Hybride Salaire : De 55 K€ à 62 K€ (selon expérience) brut annuel Famille métier : Data Engineering / Développement Python / Big Data Ce que vous ferez ici, vous ne le ferez nulle part ailleurs. Ce moment, c’est le vôtre.
CDI

Offre d'emploi
CDI – Data Engineer Databricks (AWS) – 3 à 7 ans d’expérience

Hexateam
Publiée le
Amazon S3
Apache Airflow
AWS Glue

La Défense, Île-de-France
Contexte Dans le cadre de notre croissance, nous recrutons un Data Engineer pour intervenir sur des environnements Databricks sur AWS, avec des enjeux d’ingestion, de transformation et de fiabilité des données. Missions Développement et ingestion de données • Concevoir et développer des pipelines de données en Python et Spark sur Databricks • Mettre en place des flux entre sources externes (ex : Oracle) et un Data Lake (S3 / Delta Lake) • Optimiser les traitements et les performances Orchestration et qualité des données • Orchestrer les workflows avec AWS Airflow • Mettre en place des contrôles qualité et des mécanismes de validation • Développer des outils de monitoring et de gestion des anomalies Maintien en condition opérationnelle • Assurer la disponibilité et la performance des pipelines • Diagnostiquer et corriger les incidents • Participer à l’amélioration continue des traitements Contribution • Participer aux ateliers techniques et aux échanges avec les équipes • Documenter les pipelines, architectures et processus • Contribuer aux bonnes pratiques Data et Big Data
Freelance

Mission freelance
Data Scientist Microsoft Fabric / IA (H/F)

Link Consulting
Publiée le
Intelligence artificielle

12 mois
500-550 €
Paris, France
Notre client, acteur majeur du retail, recherche son futur Data Scientist (H/F) à Paris, pour développer les modèles d'IA exploitant ses données consolidées dans Microsoft Fabric au service de la performance de son réseau d'agence Vos missions : * Intégré à l'équipe data, vous développez des modèles au service de la performance commerciale et logistique, en lien étroit avec le Data Engineer. * Construire des modèles prédictifs : prévision des ventes, optimisation des stocks, recommandation produits * Exploiter les notebooks Fabric (Python, Spark) pour l'entraînement et le test * Passer des POC à l'industrialisation des modèles dans l'écosystème Microsoft * Collaborer avec le Data Engineer pour la mise en production * Tester, suivre et améliorer la performance des modèles (précision, ROI) * Documenter et fiabiliser les modèles déployés Les compétences techniques : * Python (pandas, scikit-learn, PySpark) * Microsoft Fabric (Data Science) * Machine learning * Forecasting * Azure ML * SQL
Freelance

Mission freelance
Data Engineer / Data Architect – Sénior

Deodis
Publiée le
Python

1 an
600 €
Île-de-France, France
Description du poste Description du poste Dans le cadre du projet de modernisation de la plateforme BI d’Amundi Technology, le consultant Data Engineer / Data Architect Senior interviendra au sein de l’équipe Cœur-Data de la R&D Épargne Salariale et Retraite. Il travaillera en collaboration avec une équipe de cinq personnes ainsi qu’avec les clients internes et les équipes transverses de l’entreprise. Missions principales Concevoir et mettre en œuvre des solutions de gestion et d’exploitation de données répondant aux besoins métiers existants et futurs. Participer à la définition de l’architecture du Lakehouse sur S3. Développer des pipelines de traitement de données en Python, Spark et PySpark . Mettre en place l’ordonnancement des traitements avec Dagster . Structurer, stocker et rendre accessibles les données aux équipes métiers, notamment marketing. Concevoir des rapports et solutions de restitution des données à partir du Lakehouse. Développer des solutions de collecte et de stockage des données. Réaliser les tests unitaires et assurer le suivi des traitements. Produire la documentation technique des développements. Accompagner les utilisateurs et la MOA lors des phases de recette. Assurer un reporting régulier sur l’avancement du projet et les éventuels blocages. Collaborer avec les équipes transverses sur les études et évolutions de la plateforme. Environnement technique Langages : Python, Spark, PySpark, SQL Versioning : Git CI/CD : Jenkins Gestion de projet : Jira Documentation : Confluence Environnement : Windows 10 + WSL Outils existants : Informatica, DAC, OBIEE, Eclipse BIRT, Oracle 19 Plateforme cible : Dagster, Trino, S3 Compétences recherchées Expertise en Data Engineering (Python, Spark, architecture de données). Bonne connaissance des environnements BI et Data Lake/Lakehouse. Expérience en Machine Learning appliqué à la donnée (Scikit-Learn, Feature Engineering). Capacité à échanger avec les métiers et à comprendre leurs besoins. Maîtrise des outils Informatica . Connaissance des outils LLM / GenAI pour l’accès et l’exploration de la donnée. Livrables attendus Solutions développées et déployées. Programmes testés et prêts pour la recette utilisateur. Documentation technique complète. Suivi d’avancement des travaux. Contribution à l’amélioration continue des processus de développement. En résumé : il s'agit d'une mission de Data Engineer / Data Architect Senior orientée modernisation d’une plateforme BI vers une architecture Lakehouse moderne, avec un fort volet développement Python/Spark, architecture data, industrialisation et collaboration avec les équipes métiers
CDI

Offre d'emploi
Chef de Projet Technique Data

UMANTIC
Publiée le

60k-90k €
Paris
Dans le cadre du renforcement de sa plateforme Data, un grand acteur du secteur audiovisuel recherche un Chef de Projet Technique pour accompagner ses équipes « Activation & Personnalisation » et « Pilotage ». L'objectif est de faire évoluer l'architecture data en adossant la CDP (Customer Data Platform) à la plateforme Data, afin de rendre les données activables pour les différentes entités du groupe à des fins de connaissance utilisateurs et d'activation marketing/publicitaire. La prestation, menée en interaction étroite avec les équipes techniques, consistera notamment à : * Rédiger les documents de cadrage, d'exploitation et de pilotage ; * Définir et suivre les indicateurs de performance, de monitoring et de tests, et alerter en cas de difficultés ; * Coordonner et définir les stratégies de mise en production ; * Organiser et animer les ateliers, réunions de suivi et rituels agiles ; * Faciliter les interactions entre les équipes et les parties prenantes ; * Assurer l'évolutivité, la sécurité et la stabilité des environnements. L'environnement technique repose principalement sur Python, Spark, SQL, dbt, BigQuery et Airflow, complété par d'autres services Google Cloud Platform ainsi que des outils du marché (CDP, régie publicitaire, Power BI). Présence sur site requise à hauteur de 50 % minimum du temps de la prestation.
CDI

Offre d'emploi
Tech Lead Data Engineer / Cloud Architecte

UMANTIC
Publiée le

70k-90k €
Paris
Acteur majeur du secteur des médias et du service public, notre client accélère l'industrialisation de ses plateformes Data et IA. La mission, au carrefour des équipes Data et d'un service transverse d'automatisation, vise à concevoir, industrialiser et intégrer une nouvelle plateforme technologique dans le respect des standards du SI global (cybersécurité, réseau, gestion des secrets) et avec un haut niveau de gouvernance et de sécurité des données. Les principales tâches sont: * Garantir l'intégration de la plateforme avec le SI global : cybersécurité, réseau, gestion des secrets (Vault/OpenBao). * Concevoir les mécanismes d'anonymisation et de chiffrement des données sensibles. * Concevoir et maintenir le service mesh pour la mise à disposition sécurisée des API Data/IA (haute disponibilité, performance). * Industrialiser les pipelines CI/CD (GitLab) et le provisionnement d'infrastructure (Terraform, Ansible). * Mettre en oeuvre les fondations Cloud & réseau : Shared VPC, interconnexions, VPC Service Control, DNS. * Piloter le déploiement de la gouvernance Collibra et son interconnexion avec l'écosystème Data (GCP, AWS). * Mettre en oeuvre Data Catalogue et lignage de bout en bout ; faire évoluer les architectures DataLake. * Co-designer les solutions MLOps et exécuter la migration de la stack vers la cible (GCP + Spark/Kubernetes/Kafka souverain).
Freelance
CDI

Offre d'emploi
DATA ENGINEER GCP/DBT/Pyspark

DATAMED RESEARCH
Publiée le
Apache Airflow
DBT
Google Cloud Platform (GCP)

2 ans
Paris, France
Contexte : migration de On premise vers GCP En tant que Data Engineer, vous serez au cœur de notre stratégie data. Vous concevrez et mettrez en œuvre des solutions innovantes pour collecter, transformer et stocker nos données massives. Votre expertise technique sera essentielle pour les projets et offrir des insights précieux à nos équipes métiers. Vos missions : Conception et développement: Définir et mettre en œuvre des architectures de données robustes (data lakes, data warehouses). Concevoir et développer des pipelines de données automatisés (ETL). Optimiser les performances des traitements de données. Technologies: Maîtrise des langages de programmation : Python, Scala, SQL. Expérience avec les outils de traitement de données : Spark, Hadoop, Kafka. Connaissance des bases de données relationnelles et NoSQL. Expérience avec les clouds (GCP) Collaboration: Travailler en étroite collaboration avec les équipes métiers. Participer à la définition de la roadmap data.
Freelance

Mission freelance
Ingénieur Data Engineer/ AI Engineer

STHREE SAS
Publiée le
Amazon Redshift
Azure
IA

6 mois
La Garenne-Colombes, Île-de-France
Mission principale Assurer la conception, l’industrialisation et l’exploitation des plateformes data et applicatives en combinant les compétences d’un Data Engineer (construction de pipelines, gestion des données, optimisation des traitements) et celles d’un Ingénieur DevOps (automatisation, CI/CD, infrastructure scalable, observabilité). Ce rôle garantit la fiabilité, la performance et la scalabilité de l’ensemble de la chaîne de valeur data, depuis l’ingestion jusqu’au déploiement en production. Responsabilités clés 1. Architecture & Ingestion de données Concevoir et maintenir des pipelines d’ingestion scalables et sécurisés. Intégrer des données provenant de multiples sources (API, bases SQL/NoSQL, streaming, fichiers). Structurer les données dans des environnements cloud ou on?premise (Data Lake, Data Warehouse, Lakehouse). 2. Traitement & Transformation Développer des workflows ETL/ELT performants. Optimiser les traitements batch et streaming (Spark, Flink, Kafka, etc.). Garantir la qualité, la gouvernance et la traçabilité des données. 3. Infrastructure & Automatisation DevOps Construire et maintenir des environnements d’exécution via Infrastructure as Code (Terraform, Ansible, CloudFormation). Mettre en place et gérer des pipelines CI/CD pour les projets data et applicatifs. Automatiser les déploiements, tests, monitoring et rollback.
Freelance

Mission freelance
Data Engineer QA / Data Quality Engineer — Cloud Platform Paiement

CONCRETIO SERVICES
Publiée le
Data quality
Méthode de Monte-Carlo
Test unitaire

6 mois
Nanterre, Île-de-France
RÉSUMÉ EXPRESS Data Quality Engineer senior (4 ans+, Bac+5) pour garantir la fiabilité des données d'une plateforme cloud de paiement à fort volume transactionnel. Il conçoit et implémente un framework de Data Quality automatisé, intègre les tests dans les pipelines Databricks/Spark et les pipelines CI/CD, met en place la data observabilité en production et évangélise les bonnes pratiques QA auprès de l'équipe Data Platform. Profil hybride rare : expertise data engineering + culture QA appliquée à la donnée. Expérience fintech ou paiement fortement appréciée. 2 jours de TT par semaine / Anglais professionnel opérationnel (B2) obligatoire. MISSIONS PRINCIPALES Framework de Data Quality Concevoir et implémenter un framework de validation des données couvrant les dimensions classiques : complétude, cohérence, unicité, précision, fraîcheur Développer des règles de validation custom en Python (Great Expectations, Soda Core, Pandera, dbt tests ou équivalent) et les intégrer dans les pipelines en production Définir et faire respecter les data contracts entre producteurs et consommateurs de données (schémas, SLAs, sémantiques) Tests Automatisés Data Concevoir et implémenter des tests unitaires pour les transformations Spark/Python (pytest, fixtures data), des tests d'intégration pour les pipelines et des tests de régression sur les sorties Intégrer les tests de qualité dans les pipelines CI/CD (GitLab CI) comme gates qualité automatiques avant déploiement Appliquer les pratiques QA software à la donnée — shift-left quality dès la phase de développement Data Observabilité & Monitoring Production Mettre en place le monitoring de la qualité des données en production : alerting sur anomalies, détection de data drift, tableaux de bord de santé des données Définir les seuils d'alerte et les mécanismes de détection d'anomalies sur les flux transactionnels Intervenir sur les incidents de qualité en production (données manquantes, pipeline en retard, données corrompues) Validation Databricks / Spark à l'Échelle Intégrer des checks de qualité dans les pipelines Spark/Databricks (Delta Live Tables, Jobs) sans dégrader les performances Gérer la validation de schémas Delta Lake, les assertions sur les données et le logging des erreurs de qualité à grande échelle Évangélisation & Shift-Left Promouvoir les bonnes pratiques QA auprès des data engineers : tests intégrés dès le développement, data contracts, documentation des règles de qualité Former et accompagner l'équipe Data Platform dans l'adoption des pratiques de qualité
CDI

Offre d'emploi
Ingénieur Infrastructure H/F

Le Groupe SYD
Publiée le
Ansible
Bash
ClickHouse

45k-55k €
Paris, France
🌟 Quel sera ton poste ? 🌟 💼 Poste : Ingénieur Infrastructure H/F 📍 Lieu : Paris (75) 🏠 Télétravail : 3 jours sur site par semaine 📝 Contrat : CDI 👉 Contexte client : Tu rejoins un acteur majeur du secteur financier , engagé dans la modernisation, la sécurisation et l’industrialisation de ses plateformes Data à grande échelle. En tant qu’ Ingénieur Infrastructure tu interviens sur le maintien en conditions opérationnelles, l’évolution technologique et la performance d’environnements Data complexes (CDP 7.1.x, Hadoop, stockage distribué, ingestion API…). 🎯 Tu auras pour missions de : Tu auras pour missions de : Recueillir les besoins métiers. Développer l’ingestion (API) et concevoir les stockages (Ozone, Hadoop…). Automatiser les traitements (batchs/pipelines). Nettoyer, transformer et structurer les données. Documenter les bases et garantir la conformité RGPD. Assurer la maintenance corrective/évolutive. Déployer et industrialiser les modèles ML. Assurer validation, monitoring et robustesse. Participer au design, à l’installation et à la qualification des plateformes. Contribuer à l’industrialisation continue. Support aux équipes métiers/applicatives/infra. Communication régulière au chef de projet. Astreintes + interventions HNO. Amplitude équipe : 8h–19h. 🧰 Stack technique : Cloudera CDP 7.1.x : HBase, Hive, Kafka, Solr, Knox, Spark, Ranger, Zookeeper, Kerberos, LDAP Systèmes : RedHat 8, RedHat 9 Langages & DevOps : Python, Bash, Java, Maven, Gradle, Ansible, DevOps Stockage & Data : Ozone, Hadoop, Druid, Clickhouse Traitement & orchestration : Airflow, Flink, Trino, Starburst Containers : Openshift, Kubernetes (K8s), Cloudera Data Services Autres : écosystème Apache, automatisation, migration clusters Hadoop
Freelance

Mission freelance
Administrateur(trice) Dataiku DSS - LUXEMBOURG

FUZYO FRANCE
Publiée le
Dataiku
Python
Scripting

6 mois
400-600 €
Luxembourg
Mission au Luxembourg. Il est impératif et obligatoire de résider proche frontière LUXEMBOURG Nous recherchons un(e) consultant(e) expérimenté(e) pour administrer et faire évoluer une plateforme Dataiku DSS au sein d’une équipe Data Science & AI. Vous contribuerez également à des projets techniques transverses (OpenShift, DevOps, MLOps, LLMOps). Missions : Administration, maintenance et optimisation de la plateforme Dataiku DSS Automatisation des opérations via Python (monitoring, upgrades, gestion utilisateurs) Support aux utilisateurs (data scientists, analystes, métiers) Collaboration avec les équipes infrastructure (OpenShift / Kubernetes) Développement de composants réutilisables (plugins, recettes, indicateurs) Rédaction et mise à jour de la documentation technique Participation à des projets DevOps, MLOps, LLMOps Profil recherché : Bac+3 à Bac+5 en informatique, data engineering ou équivalent Expérience >6 ans en administration de Dataiku DSS en environnement de production Maîtrise de Python, scripting, CI/CD Connaissances en OpenShift, Kubernetes, Big Data (Hadoop, Spark, Kafka) Autonomie, rigueur, esprit analytique Expérience dans le secteur bancaire appréciée
103 résultats

Contrats

Freelance CDI CDD Alternance Stage

Lieu

Télétravail

Télétravail partiel Télétravail 100% Présentiel

Taux Journalier Moyen min.

150 € 1300 € et +

Salaire brut annuel min.

20k € 250k €

Durée

0 mois 48 mois

Expérience

≤ 2 ans d’expérience 3 à 5 ans d’expérience 6 à 10 ans d’expérience > 10 ans d’expérience

Publication

Au service des talents IT

Free-Work est une plateforme qui s'adresse à tous les professionnels des métiers de l'informatique.

Ses contenus et son jobboard IT sont mis à disposition 100% gratuitement pour les indépendants et les salariés du secteur.

Free-workers
Ressources
A propos
Espace recruteurs
2026 © Free-Work / AGSI SAS
Suivez-nous