Find your next tech and IT Job or contract PySpark
Your search returns 51 results.
Job Vacancy
Data engineer - Expert Pyspark
DATAMED RESEARCH
Published on
PySpark
Python
24 months
40k-58k €
400-560 €
Paris, France
Dans le cadre d'un programme stratégique de modernisation de la plateforme Data, intervention en tant que Data Engineer Expert PySpark pour accompagner la migration des traitements de données d'une architecture On-Premise vers Google Cloud Platform (GCP). La mission vise à industrialiser les pipelines de données, optimiser les performances des traitements Big Data et mettre en place une architecture cloud scalable, sécurisée et résiliente. Principales responsabilités Participer à la définition de l'architecture cible Data sur GCP. Analyser les flux et traitements existants sur l'environnement On-Premise. Concevoir et développer des pipelines de données distribués avec PySpark . Migrer les traitements ETL/ELT vers les services GCP. Optimiser les performances des jobs Spark et réduire les temps de traitement. Industrialiser les workflows de traitement et d'intégration des données. Mettre en œuvre les bonnes pratiques de développement, de monitoring et de sécurité. Assurer la qualité, la fiabilité et la traçabilité des données. Participer aux phases de tests, validation et mise en production. Accompagner les équipes Data dans l'adoption des nouvelles solutions Cloud.
Job Vacancy
Développeur Big Data Hadoop/PySpark/Python
Digistrat consulting
Published on
Apache Hive
Apache Spark
Hadoop
3 years
38k-43k €
300-400 €
Paris, France
🏭 Secteurs stratégiques : Banque d’investissement PAS DE FULL REMOTE NI SOUS TRAITANCE MERCI 🗓 Démarrage : ASAP 💡 Contexte /Objectifs : Le département a lancé un programme stratégique, qui comporte plusieurs projets d'harmonisation des processus et outils. L'un de ces streams a pour vocation de constituer un datalake sur une stack Hadoop, afin de servir les besoins en data et reporting. Ce datalake a également pour vocation de devenir la brique centrale de l'architecture du SI . Nous recherchons un profil Hadoop / PySpark qui sera en charge, en lien avec l'équipe de production applicative / devops, de mettre en œuvre techniquement les évolutions du datalake. Passionné par les données, capable de s’adapter à un environnement dynamique et en constante évolution, le prestataire doit faire preuve d'autonomie, d'initiative et d'une forte capacité d'analyse pour résoudre des problèmes complexes. 🤝Principales missions : Les tâches suivantes seront confiés au consultant : • Mettre en œuvre de nouvelles ingestions de données, data prep/transformation • Maintenir et faire évoluer nos outils de gestion des pipeline de données (Pyspark + shell scripting) • Adresser à l'équipe devops les demandes relatives aux évolutions de la plateforme • Eventuellement mettre en œuvre une couche d'APIs afin d'exposer nos données
Job Vacancy
Tech Lead Databricks - Lyon
KOMEET TECHNOLOGIES
Published on
Databricks
PySpark
50k-60k €
Lyon, Auvergne-Rhône-Alpes
En tant que Tech Lead, vous êtes l'expert Data Engineering et le référent technique dans vos missions. Vous intervenez principalement sur les problématiques d’ingestion, de traitement et d’industrialisation des données sur la data plateforme. Sans être responsable de l’architecture Data globale, vous avez un rôle clé dans la qualité des livrables, la standardisation des pratiques et la montée en compétence des Data Engineers. Expérience attendue : 7 à 12+ ans en Data Engineering avec une expérience dans un rôle de référent technique Vous correspondez au/à la Tech Lead que nous recherchons si : Vous disposez d’un leadership technique , reconnu et légitime auprès des équipes Vous savez animer, encadrer et fédérer une équipe autour de bonnes pratiques techniques et d’objectifs communs Vous faites preuve d’une excellente communication , associée à une forte capacité pédagogique Vous adoptez un esprit critique constructif et savez challenger les choix techniques dans une logique d’amélioration continue Vous êtes capable de prendre du recul sur des problématiques techniques afin de proposer des solutions pertinentes et durables Vous êtes autonome , proactif et doté d’un fort sens des responsabilités Vous favorisez le partage de connaissances et la montée en compétence collective Vous savez collaborer efficacement avec des rôles transverses (Architectes, Product Owners, DevOps, ML Engineers) Vous maîtrisez Python et SQL à un niveau avancé , avec une forte sensibilité aux bonnes pratiques de software engineering (qualité, maintenabilité, testabilité) Vous êtes capable de définir, documenter et faire appliquer des standards de développement , incluant la structuration des projets, les conventions de code et les stratégies de tests Vous avez une expérience significative dans la mise en place et la maintenance de chaînes CI/CD appliquées aux pipelines Data Vous portez une attention particulière à la qualité des données , à la testabilité et à l’ observabilité des pipelines en production Vous pratiquez régulièrement les revues de code , le mentoring et l’accompagnement technique des Data Engineers Vous êtes en mesure de concevoir des frameworks internes et des briques techniques réutilisables afin d’industrialiser et standardiser les développements Vous comprenez les enjeux de performance, de scalabilité et de maîtrise des coûts , et savez les intégrer dans vos choix techniques
Job Vacancy
Tech Lead Databricks
KOMEET TECHNOLOGIES
Published on
Databricks
PySpark
55k-70k €
Paris, France
En tant que Tech Lead, vous êtes l'expert Data Engineering et le référent technique dans vos missions. Vous intervenez principalement sur les problématiques d’ingestion, de traitement et d’industrialisation des données sur la data plateforme. Sans être responsable de l’architecture Data globale, vous avez un rôle clé dans la qualité des livrables, la standardisation des pratiques et la montée en compétence des Data Engineers. Expérience attendue : 7 à 12+ ans en Data Engineering avec une expérience dans un rôle de référent technique Vous correspondez au/à la Tech Lead que nous recherchons si : Vous disposez d’un leadership technique , reconnu et légitime auprès des équipes Vous savez animer, encadrer et fédérer une équipe autour de bonnes pratiques techniques et d’objectifs communs Vous faites preuve d’une excellente communication , associée à une forte capacité pédagogique Vous adoptez un esprit critique constructif et savez challenger les choix techniques dans une logique d’amélioration continue Vous êtes capable de prendre du recul sur des problématiques techniques afin de proposer des solutions pertinentes et durables Vous êtes autonome , proactif et doté d’un fort sens des responsabilités Vous favorisez le partage de connaissances et la montée en compétence collective Vous savez collaborer efficacement avec des rôles transverses (Architectes, Product Owners, DevOps, ML Engineers) Vous maîtrisez Python et SQL à un niveau avancé , avec une forte sensibilité aux bonnes pratiques de software engineering (qualité, maintenabilité, testabilité) Vous êtes capable de définir, documenter et faire appliquer des standards de développement , incluant la structuration des projets, les conventions de code et les stratégies de tests Vous avez une expérience significative dans la mise en place et la maintenance de chaînes CI/CD appliquées aux pipelines Data Vous portez une attention particulière à la qualité des données , à la testabilité et à l’ observabilité des pipelines en production Vous pratiquez régulièrement les revues de code , le mentoring et l’accompagnement technique des Data Engineers Vous êtes en mesure de concevoir des frameworks internes et des briques techniques réutilisables afin d’industrialiser et standardiser les développements Vous comprenez les enjeux de performance, de scalabilité et de maîtrise des coûts , et savez les intégrer dans vos choix techniques
Premium Job
Job Vacancy
Data engineer Databricks/AWS
VISIAN
Published on
AWS Cloud
Databricks
FastAPI
1 year
40k-60k €
400-700 €
La Défense, Ile-de-France
Vous maîtrisez le métier d'ingénieur données sur Databricks (sur AWS). Vos responsabilités seront les suivantes : • Concevoir, développer et maintenir des pipelines de données évolutifs sur la plateforme Databricks. • Gérer les processus d'ingestion de données provenant de diverses sources dans l'environnement Databricks (ingestion XML, Kakfa, etc.). • Mettre en œuvre et optimiser les processus ETL (Extraction, Transformation, Chargement) afin de garantir une transformation et une intégration efficaces des données. • Garantir la qualité, l'intégrité et la sécurité des données sur l'ensemble des pipelines. • Surveiller et résoudre les problèmes de performance des pipelines de données, en mettant en œuvre les maintenances et mises à jour nécessaires. • Documenter les processus, les spécifications techniques et les bonnes pratiques des pipelines de données. • Assurer le transfert de connaissances vers l'équipe d'ingénieurs données qui prendra en charge la gestion de la plateforme à l'avenir. Parler couramment l'anglais/néerlandais ou l'anglais/français est un impératif.
Job Vacancy
Expert Databricks & Spark
CAT-AMANIA
Published on
Databricks
PySpark
3 months
40k-45k €
400-550 €
Lyon, Auvergne-Rhône-Alpes
Mission Freelance : Lead Data Engineer / Expert Databricks & Spark (H/F) 📋 Contexte de la mission Au sein d'un grand pôle industriel et de sa direction des systèmes d'information, vous rejoignez l'équipe Transverse SI Chaînes Communicantes à Lyon. Cette équipe, actuellement en pleine phase de structuration, pilote et supervise des projets d'envergure commune. L'objectif majeur de votre intervention est d' accompagner la migration globale et l'industrialisation d'une nouvelle plateforme data cible autour des technologies les plus modernes du marché. Vous serez l'un des piliers techniques pour mener à bien la refonte complète de nos applications d'informatique décisionnelle (Business Intelligence) à forte valeur ajoutée. 🎯 Vos principales responsabilités1. Ingénierie Data & Développement (Activité principale) Pipelines de données : Concevoir, développer et maintenir des pipelines de données robustes sous Databricks et Spark . Traitements complexes : Développer l'ensemble des flux de traitement de données en Python, PySpark et SQL . Modélisation : Contribuer activement à la définition et à la mise en œuvre du modèle de données cible en exploitant Delta Lake et Unity Catalog . Orchestration : Assurer l'ordonnancement des traitements via Databricks Workflows et Lakeflow Jobs . 2. Industrialisation & Qualité Standards de production : Mettre en œuvre des pratiques d'industrialisation poussées (tests unitaires/d'intégration, pipelines CI/CD pour la Data). Performance & FinOps : Optimiser l'exécution des requêtes techniques, garantir la scalabilité du système tout en maîtrisant les coûts d'infrastructure cloud. MCO : Participer au suivi de la production (Run), analyser les incidents techniques et piloter l'amélioration continue de la plateforme (fiabilité et observabilité). 3. Cadrage & Accompagnement (Activité secondaire) Participer au cadrage fonctionnel des besoins en étroite collaboration avec le Product Owner et les équipes utilisatrices. Assurer l'interfaçage de la plateforme avec Power BI pour faciliter l'exposition et la consommation des données par le métier. Contribuer à l'intégration de flux d'alimentation temps réel vers le datalake (via Kafka ). Rédiger la documentation technique et animer les rituels agiles au sein de la feature team . 👤 Profil recherché Nous recherchons un Lead Data Engineer / Expert Databricks senior (Niveau 3) capable de démontrer une autonomie complète après une phase d'intégration de 4 jours sur nos spécificités métiers. Vous devez justifier d’une expertise confirmée de 4 ans minimum sur l’environnement Databricks , idéalement validée par une certification officielle de l'éditeur. Votre parcours témoigne obligatoirement d'une participation active à un projet d'envergure de migration ou de transformation d'architectures data , soutenu par de solides compétences en modélisation de données (Delta Lake, Unity Catalog). Sur le plan technique, vous possédez une maîtrise parfaite de l'écosystème Spark / PySpark, de Python et de SQL , ainsi qu'un savoir-faire éprouvé dans l'automatisation de l'infrastructure via Terraform pour les sujets Cloud et Databricks. Au-delà de vos compétences de développeur émérite, vous affichez un véritable leadership technique naturel (sans posture managériale requise) qui vous permet de guider, structurer, standardiser et documenter le travail d'une équipe. Force de proposition, orienté solutions robustes et pragmatiques, vous savez collaborer avec des profils variés, allant des Data Scientists et experts BI jusqu’au Product Owner et interlocuteurs métiers. 💻 Environnement de travail Vous évoluerez au cœur de Lyon au sein d’une structure moderne favorisant un équilibre de vie professionnelle grâce à un accord de télétravail fixé à 50% . La mission s’inscrit dans un cadre méthodologique strictement Agile , au sein d'une équipe transverse dynamique et en pleine construction, actuellement composée d'un chef de projet et appuyée par des experts du pôle (référents techniques, managers, coordinateurs). La stack technique mise à votre disposition est à la pointe de l'ingénierie des données : Databricks, Spark, PySpark, Delta Lake, Unity Catalog , le tout s'exécutant sur un environnement cloud public. L’industrialisation, l’observabilité et la qualité de service sont au centre des préoccupations de cette DSI, s'appuyant sur des chaînes CI/CD automatisées et de l'Infrastructure as Code. Vous aurez l'opportunité d'intervenir sur des flux de données complexes, incluant l'ingestion de sources variées, l'intégration de technologies événementielles comme Kafka , et la liaison étroite avec des outils de restitution de premier ordre tels que Power BI . Aucun horaire décalé (HHN) ni aucune astreinte ne sont prévus pour cette mission, vous assurant un cadre de production stable au quotidien. 🛠️ Stack technique récapitulative Incontournables (Niveau Expert) : Databricks, Spark, PySpark, Python, SQL. Architecture Data : Modélisation de données, Delta Lake, Unity Catalog. DevOps / Industrialisation : CI/CD, Tests automatisés, Terraform, Databricks Workflows. Écosystème apprécié : Kafka, Lakeflow / DLT, Power BI, Certifications Cloud.
Job Vacancy
DATA ENGINEER GCP/DBT/Pyspark
DATAMED RESEARCH
Published on
Apache Airflow
DBT
Google Cloud Platform (GCP)
2 years
Paris, France
Contexte : migration de On premise vers GCP En tant que Data Engineer, vous serez au cœur de notre stratégie data. Vous concevrez et mettrez en œuvre des solutions innovantes pour collecter, transformer et stocker nos données massives. Votre expertise technique sera essentielle pour les projets et offrir des insights précieux à nos équipes métiers. Vos missions : Conception et développement: Définir et mettre en œuvre des architectures de données robustes (data lakes, data warehouses). Concevoir et développer des pipelines de données automatisés (ETL). Optimiser les performances des traitements de données. Technologies: Maîtrise des langages de programmation : Python, Scala, SQL. Expérience avec les outils de traitement de données : Spark, Hadoop, Kafka. Connaissance des bases de données relationnelles et NoSQL. Expérience avec les clouds (GCP) Collaboration: Travailler en étroite collaboration avec les équipes métiers. Participer à la définition de la roadmap data.
Job Vacancy
Développeur Python H/F
CONSORT GROUP
Published on
PySpark
Python
1 month
55k-62k €
75017, France
Chaque moment compte. Surtout ceux que vous vivez à fond. Bienvenue chez Consort Group. Consort Group, accompagne depuis plus de 30 ans les entreprises dans la valorisation de leurs données et infrastructures. Elle s'appuie sur deux leaders, Consortis et Consortia, et place l’humain et la responsabilité sociétale au cœur de ses valeurs. C’est votre future équipe Les équipes de ConsortIA , sont des acteurs de référence de la Data, du Développement Digital et de l'Ingénierie Média. En combinant ces expertises, nous concevons des systèmes d’information augmentés, intégrés, agiles et sécurisés, au service de la performance et de la transformation numérique de nos clients. Développeur Python H/F C’est votre mission Vous êtes passionné·e par le développement de solutions data à grande échelle et les environnements Big Data ? Ce poste est fait pour vous. En tant que Développeur Python , vous êtes responsable du développement et de la maintenance de notre écosystème : Côté build : Concevoir et développer des applications et pipelines de traitement de données en Python et PySpark Développer des traitements distribués performants sur des environnements Spark Participer à la conception technique et à l’évolution des architectures Data Mettre en œuvre les bonnes pratiques de développement (qualité de code, tests, documentation) Participer aux revues de code et aux choix techniques de l’équipe Contribuer à l’automatisation des processus de déploiement et d’intégration continue Collaborer avec les équipes Data Engineering, DevOps et métiers dans un contexte Agile Côté run : Assurer le maintien en conditions opérationnelles des traitements de données Analyser et résoudre les incidents de production Optimiser les performances des jobs Spark et des applications Python Superviser les flux de données et garantir leur fiabilité Participer aux actions d’amélioration continue et à la réduction de la dette technique Assurer le support technique de niveau avancé auprès des équipes projet C’est votre parcours Vous avez au moins 5 ans d’expérience . Vous aimez relever des défis techniques autour de la performance, de la scalabilité et de la qualité logicielle, sans jamais cesser d’innover. Vous cherchez un cadre où vos idées comptent et où la technique va de pair avec la collaboration. C’est votre expertise : Python, PySpark, Apache Spark, SQL Environnements Linux, Git, CI/CD (GitLab CI, Jenkins ou équivalent) Méthodologies Agile / Scrum Connaissance des environnements Cloud (AWS, Azure ou GCP) Outils de conteneurisation et d’orchestration (Docker, Kubernetes) Anglais professionnel à l’écrit comme à l’oral C’est votre manière de faire équipe : Esprit d’analyse et capacité à résoudre des problématiques complexes Excellentes capacités de communication et de collaboration Autonomie et sens des responsabilités Curiosité technique et force de proposition Capacité d’adaptation dans des environnements en constante évolution C’est notre engagement Chez Consort Group, vous êtes un·e expert·e qu’on accompagne pour que chaque mission devienne une étape qui compte. Un onboarding attentif et humain Une vraie proximité managériale Des formations accessibles en continu Des engagements concrets : inclusion, égalité, solidarité Un package RH complet : mutuelle, carte TR, CSE, prévoyance Une culture du feedback et des projets qui font sens C’est clair Le process de recrutement : Un premier échange téléphonique avec notre team recrutement Un entretien RH ainsi qu’un échange métier avec un.e ingénieur.e d’affaires Un test ou un échange technique avec un.e de nos expert.es Un dernier point avec votre futur.e manager ou responsable de mission Et si on se reconnaît : on démarre ensemble C’est bon à savoir Lieu : Paris Contrat : CDI Télétravail : Hybride Salaire : De 55 K€ à 62 K€ (selon expérience) brut annuel Famille métier : Data Engineering / Développement Python / Big Data Ce que vous ferez ici, vous ne le ferez nulle part ailleurs. Ce moment, c’est le vôtre.
Job Vacancy
Lead Data Engineer
CAT-AMANIA
Published on
Apache Airflow
PySpark
6 months
40k-70k €
400-550 €
Levallois-Perret, Ile-de-France
• Analyse et cadrage Recueillir et analyser les besoins métiers. Formaliser les US en spécifications techniques exploitables. • Pilotage technique Assurer un pilotage intermédiaire sur un périmètre projet (coordination technique, suivi d’avancement). Contribuer aux choix techniques structurants. • Développement et expertise Réaliser des développements complexes. Assurer la maintenance applicative (Gestion des obsolescence et vulnérabilités) Apporter un support technique aux équipes sur les composants critiques. • Contribution agile Participer à l’élaboration et à la priorisation du backlog avec les PO et BA. Animer et contribuer aux rituels techniques (code reviews, challenger les estimations de charge etc.) • Architecture et standards Concevoir et mettre en oeuvre l’architecture applicative et technique. Veiller au respect des normes, bonnes pratiques et standards Groupe. • Qualité et documentation Garantir la qualité des livrables (revues de code, bonnes pratiques). Assurer la production et la maintenance de la documentation projet. • RUN Planification des activités, gestion du calendrier de l’équipe et priorisation des actions Assurer le suivi d’exploitation des traitements PySpark en production : supervision, résolution des incidents, analyse des performances et amélioration continue des traitements Maîtrise avancée des environnements de conteneurisation et d’orchestration, notamment Kubernetes et Docker, ainsi que de la gestion sécurisée des secrets avec HashiCorp Vault Maîtrise avancée des traitements Big Data, incluant PySpark 3 ainsi que la manipulation de formats de données distribués (Parquet, gestion des buckets). Maîtrise opérationnelle de l’orchestration de workflows de données à l’aide de l’outil Apache Airflow. Maîtrise confirmée des bases de données relationnelles, particulièrement PostgreSQL. Maîtrise des outils de gestion de code et de qualité logicielle, incluant GitLab, Fortify et SonarQube. Maîtrise des outils de stockage objet, notamment via l’utilisation des commandes MinIO. Maîtrise des outils de transfert de fichiers, en particulier CFT (Cross File Transfer). Pour l’ensemble du projet de titrisation Bail : • Dossiers d’architecture (schémas, principes techniques, choix structurants). • Backlog enrichi et priorisé en lien avec les parties prenantes. • Composants applicatifs développés, testés et documentés. • Comptes rendus des revues de code et plan d’amélioration continue. • Documentation projet à jour (Spécifications techniques, JIRA, Page Confluence, Runbook). • Reporting d’avancement sur le périmètre confié. • RUN : Reporting de type Morning check
Contractor job
SENIOR DATA ENGINEER
UCASE CONSULTING
Published on
Databricks
PySpark
6 months
580-630 €
Ile-de-France, France
Dans le cadre du renforcement de son équipe Data Engineering, notre client recherche un Senior Data Engineer afin d'accompagner la conception, l'industrialisation et l'optimisation de ses plateformes de données sur Azure et Snowflake. 🎯 Vos missions : • Concevoir, développer et optimiser des pipelines de données robustes et performants. • Participer à la mise en place et à l'évolution des architectures Data Warehouse, Data Lake et Data Lakehouse. • Déployer et maintenir les infrastructures via Terraform (Infrastructure as Code). • Concevoir et améliorer les pipelines CI/CD sous Azure DevOps. • Garantir la qualité, la performance et la sécurité des traitements de données. • Accompagner les Data Engineers de l'équipe à travers du coaching, du partage de bonnes pratiques et des revues de code. • Participer à la gouvernance des données, à la gestion des métadonnées et à l'optimisation des coûts. • Collaborer étroitement avec les équipes métiers, Data Analysts, Data Scientists et IT. 🛠 Environnement technique : • Azure • Snowflake • Snowpark • dbt • Python • Azure Data Factory • Terraform • Azure DevOps • Git • PowerShell • Azure CLI • PowerDesigner
Job Vacancy
DATA ENGINEER GCP/DBT/Pyspark
DATAMED RESEARCH
Published on
Apache Airflow
Apache Spark
BigQuery
24 months
45k-62k €
450-580 €
Issy-les-Moulineaux, Ile-de-France
Contexte : migration de On premise vers GCP En tant que Data Engineer, vous serez au cœur de notre stratégie data. Vous concevrez et mettrez en œuvre des solutions innovantes pour collecter, transformer et stocker nos données massives. Votre expertise technique sera essentielle pour les projets et offrir des insights précieux à nos équipes métiers. Vos missions : Conception et développement: Définir et mettre en œuvre des architectures de données robustes (data lakes, data warehouses). Concevoir et développer des pipelines de données automatisés (ETL). Optimiser les performances des traitements de données. Technologies: Maîtrise des langages de programmation : Python, Scala, SQL. Expérience avec les outils de traitement de données : Spark, Hadoop, Kafka. Connaissance des bases de données relationnelles et NoSQL. Expérience avec les clouds (GCP) Collaboration: Travailler en étroite collaboration avec les équipes métiers. Participer à la définition de la roadmap data.
Job Vacancy
Data Engineer
CAT-AMANIA
Published on
Apache Airflow
PySpark
6 months
40k-70k €
400-520 €
Levallois-Perret, Ile-de-France
Rôle et responsabilités des Développeurs • Développement et expertise Réaliser des développements de complexité moyenne. Assurer la maintenance applicative (Gestion des obsolescence et vulnérabilités) • Contribution agile Participer aux rituels techniques (estimation de charge, engagement sur le sprint). • Architecture et standards Concevoir et mettre en oeuvre l’architecture applicative et technique. Veiller au respect des normes, bonnes pratiques et standards Groupe. • Qualité et documentation Garantir la qualité des livrables (revues de code, bonnes pratiques). Assurer la production et la maintenance de la documentation projet. • RUN Assurer le suivi d’exploitation des traitements PySpark en production : supervision, résolution des incidents, analyse des performances et amélioration continue des traitements - Maîtrise avancée des environnements de conteneurisation et d’orchestration, notamment Kubernetes et Docker, ainsi que de la gestion sécurisée des secrets avec HashiCorp Vault - Maîtrise avancée des traitements Big Data, incluant PySpark 3 ainsi que la manipulation de formats de données distribués (Parquet, gestion des buckets). - Maîtrise opérationnelle de l’orchestration de workflows de données à l’aide de l’outil Apache Airflow. - Maîtrise confirmée des bases de données relationnelles, particulièrement PostgreSQL. - Maîtrise des outils de gestion de code et de qualité logicielle, incluant GitLab, Fortify et SonarQube. - Maîtrise des outils de stockage objet, notamment via l’utilisation des commandes MinIO. - Maîtrise des outils de transfert de fichiers, en particulier CFT (Cross File Transfer). Pour l’ensemble du projet de titrisation Bail : • Dossiers d’architecture (schémas, principes techniques, choix structurants). • Backlog enrichi et priorisé en lien avec les parties prenantes. • Composants applicatifs développés, testés et documentés. • Comptes rendus des revues de code et plan d’amélioration continue. • Documentation projet à jour (Spécifications techniques, JIRA, Page Confluence, Runbook). • Reporting d’avancement sur le périmètre confié. • RUN : Reporting de type Morning check
Job Vacancy
Business Analyst Data / Référentiels (H/F)
Amontech
Published on
DBT
PySpark
Python
1 year
Niort, Nouvelle-Aquitaine
Contexte Dans le cadre d'un programme stratégique autour de la Data et de l'Intelligence Artificielle, nous recherchons un(e) Business Analyst Data pour renforcer une équipe en charge des référentiels d'entreprise. L'objectif est d'accompagner les évolutions fonctionnelles et techniques d'une plateforme de référentiels transverse utilisée par plusieurs métiers. Vous interviendrez en amont des développements afin d'analyser les besoins, mesurer les impacts et préparer les dossiers destinés aux équipes de réalisation. Missions Recueillir et analyser les besoins métiers. Réaliser les études d'impact sur les différents composants du système d'information. Participer à la définition des solutions fonctionnelles et techniques. Rédiger les spécifications fonctionnelles et techniques. Produire les schémas d'architecture et de flux. Préparer les dossiers de présentation pour les équipes de développement. Assurer les échanges avec les équipes métiers et techniques. Participer aux ateliers de conception et aux revues de solution. Environnement technique API TIBCO Informatica MDM Informatica Data Quality Java ReactJS SQL Jira Confluence Compétences requisesFonctionnelles Analyse d'impact Recueil du besoin Rédaction de spécifications Modélisation de données Communication et animation d'ateliers Techniques Maîtrise du SQL Bonne compréhension des bases de données Connaissance des API Connaissance d'Informatica MDM appréciée Jira et Confluence
Job Vacancy
Data Engineer Pyspark/Azure
DATAMED RESEARCH
Published on
Azure
DAX
Microsoft Power BI
12 months
Nantes, Pays de la Loire
Contexte Transformer des données sources complexes en données exploitables pour les métiers, dans le respect des standards et de la stratégie data de SNCF Gares & Connexions . Missions principales Comprendre les enjeux métier et les besoins data Modéliser les données Développer et optimiser les traitements en Python / SQL / PySpark Industrialiser, superviser et documenter les traitements Collaborer avec les équipes métier et techniques Être force de proposition Contribuer à l’évolution et à l’optimisation de la plateforme data Travailler dans un cadre agile
Contractor job
[FBO] Data Engineer expérimenté
ISUPPLIER
Published on
Databricks
PySpark
Python
3 years
La Défense, Ile-de-France
Contexte de la mission Dans le cadre d'un programme de transformation digitale visant à démocratiser l'accès aux actifs privés pour la clientèle Retail & Wealth Management, notre client déploie une infrastructure de données pour consolider, transformer et distribuer des données financières et documentaires vers des partenaires de distribution. Le Data Engineer interviendra en autonomie sur la conception et le déploiement de pipelines de données et d'interfaces API dans un environnement cloud Azure / Databricks à forte volumétrie. Responsabilités Architecture & ingestion de données Concevoir et implémenter des pipelines ETL/ELT avec PySpark sur Databricks Construire et maintenir une architecture data lake Bronze–Silver–Gold (architecture médaillon) Développer des jobs de transformation pour des datasets financiers (NAV, capital calls, distributions, reportings) Gérer les tables Delta Lake pour un stockage ACID-compliant APIs & intégrations partenaires Développer et maintenir des Azure Functions pour les intégrations API temps réel avec des partenaires externes Développer des APIs RESTful en Python pour la distribution de données Collaborer avec les data consumers pour comprendre leurs besoins et garantir la qualité des flux Qualité, performance & DevOps Implémenter des contrôles qualité et des frameworks de tests automatisés Optimiser les jobs Spark et fonctions serverless (performance et coûts) Travailler en CI/CD via Azure DevOps Stack technique DomaineTechnologiesLangage principalPython (maîtrise avancée obligatoire)Traitement distribuéPySpark, DatabricksStockage / Data lakeDelta Lake, architecture médaillon (Bronze–Silver–Gold)SQLTransformation et analyse de donnéesCloud AzureDatabricks, Azure Functions, Azure DevOps, PipelinesQualité de codePre-commit hooks, ruff, mypy, blackVersioningGit — stratégies de branchingTestspytest
Job Vacancy
Data Engineer (Databricks)
LOVOTECH
Published on
Cloud
Databricks
DBT
12 months
40k-50k £GB
400-520 £GB
Ile-de-France, France
Dans le cadre du développement de la plateforme data, nous recherchons un(e) Data Engineer pour concevoir, construire et maintenir des pipelines de données robustes sur la plateforme Databricks. Vous évoluerez au sein d’une équipe data (Data Engineering / Data Platform / Analytics Engineering) et contribuerez à la mise en place d’une architecture moderne orientée cloud et data lakehouse. Missions principales Concevoir et développer des pipelines de données batch et streaming sur Databricks Construire et optimiser des traitements de données distribuées avec Apache Spark Modéliser des données dans une architecture lakehouse (Bronze / Silver / Gold) Mettre en place des workflows d’ingestion (ETL / ELT) depuis différentes sources (API, bases SQL, fichiers, events streaming) Assurer la qualité, la fiabilité et la gouvernance des données Optimiser les performances des jobs Spark (coût, latence, scalabilité) Mettre en place CI/CD pour les pipelines data Collaborer avec les Data Analysts, Data Scientists et équipes produit Participer à la mise en place des bonnes pratiques DataOps
Submit your CV
-
Manage your visibility
Salary, remote work... Define all the criteria that are important to you.
-
Get discovered
Recruiters come directly to look for their future hires in our CV library.
-
Join a community
Connect with like-minded tech and IT professionals on a daily basis through our forum.
Latest forum topics
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Experts
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Service
- Tracking & Recovering Lost & Stolen Cryptocurrency Top 1 Most Legit & Best Cryptocurrency Recovery Company
- Guaranteed Best & Top 2 Cryptocurrency Recovery Agency Recovering Lost & Stolen Cryptocurrency
- Guaranteed Best & Top 1 Cryptocurrency Recovery Expert Recovering Lost & Stolen Cryptocurrency
- Guaranteed Best & Top 1 Cryptocurrency Recovery Service Recovering Lost & Stolen Cryptocurrency
Jobs by city
Jobs by country
51 results
Contracts
Location
Remote type
Rate minimum.
£150
£1300 and more
Salary minimum
£20k
£250k