Trouvez votre prochaine offre d’emploi ou de mission freelance Data scientist

Le “Data Scientist” est le spécialiste Big Data en entreprise, chargé de la structuration des informations et de l'optimisation de la sécurité des données stockées, quel que soit leur volume. Sa mission : catégoriser avec soin les données pour éviter les risques de défaillance du système informatique. Il cherche ainsi à détecter de nouvelles failles potentiellement exploitables par les hackers et leur impact sur les activités de l'entreprise. In fine, il veille à proposer des solutions de protection efficaces. Cet expert de la gestion et de l'analyse de données massives est à la fois un spécialiste des chiffres, des statistiques et des programmes informatiques : il extrait de la valeur des données pour accompagner l'entreprise dans sa prise de décision stratégiques ou opérationnelles. Le “Data Scientist” collabore de manière transverse avec des profils variés : informaticiens, statisticiens, data analysts, data miners, experts marketing et webmarketing…
Informations sur la rémunération de la fonction Data scientist.

Votre recherche renvoie 118 résultats.
Freelance

Mission freelance
Data Engineer (h/f)

emagine Consulting SARL
Publiée le

1 mois
450-480 €
92150, Suresnes, Île-de-France
Localisation: Suresnes / 2 jours de TT par semaine Durée: 3 ans Résumé : Passant d’une organisation centrée sur le matériel à un fournisseur complet de logiciels et de services dans le domaine des solutions de paiement, ce rôle est essentiel pour garantir une gestion efficace des données afin d’améliorer les fonctions de l’entreprise. Responsabilités : Définir et analyser les structures de données. Concevoir, construire et gérer des pipelines ETL pour traiter les données brutes. Mettre en œuvre et gérer des solutions de stockage : entrepôts de données (Amazon Redshift), datalakes (AWS S3 avec Databricks) et bases de données NoSQL. Collaborer avec des data scientists, analystes et équipes métier pour identifier et satisfaire les besoins en données. Assurer la fiabilité de la production par la surveillance et les interventions nécessaires. Expérimenter de nouvelles technologies de données pour améliorer l’infrastructure de données et l’efficacité des flux de travail. Compétences : Master (BAC+5) dans un domaine pertinent. Au moins 4 ans d’expérience en tant qu’ingénieur de données. Expertise avancée en Python. Solides compétences en Java (Spring Boot). Familiarité avec Scala est un atout. Maîtrise des processus ETL et de la construction de pipelines de données. Expérience pratique avec Databricks et Spark pour le traitement de données. Expérience avec diverses solutions de stockage, y compris les bases de données relationnelles et NoSQL. Expérience professionnelle avec les services cloud AWS. Expérience dans un environnement agile. Anglais courant.
CDI

Offre d'emploi
Développeur IA / AI Engineer - Paris H/F

Webnet
Publiée le
Cloud
Docker
Intelligence artificielle

45k-55k €
Paris, France
Dans ce cadre de projets chez nos clients grands compte, nous recherchons un Développeur IA pour concevoir, intégrer et industrialiser des modèles d’intelligence artificielle. Vous participez au développement des solutions intégrant des technologies d’intelligence artificielle pour automatiser des processus métier et créer de nouveaux produits numériques. Vous interviendrez sur l’ensemble du cycle de vie des solutions IA : conception, développement, intégration et optimisation. Vous aurez pour missions : Concevoir et développer des solutions basées sur l’intelligence artificielle Intégrer des modèles de machine learning et LLM dans des applications Développer des API et services backend pour exposer les fonctionnalités IA Participer à la mise en production et à l’industrialisation des modèles Optimiser les performances des pipelines data et des modèles Collaborer avec les data scientists, product owners et équipes produit Mettre en place des bonnes pratiques de MLOps et monitoring
CDI

Offre d'emploi
Machine Learning Engineer

█ █ █ █ █ █ █
Publiée le
CI/CD
Deep Learning
Docker

Ville de Paris - Archives de Paris - Centre annexe, Île-de-France

Offre importée

Offre issue du marché tech, identifiée automatiquement pour vous donner une vue complète des opportunités.

Accès restreint à la communauté

Rejoignez notre plateforme pour accéder aux détails de cette offre et obtenir un accès aux meilleures offres du marché.

CDI

Offre d'emploi
Product Owner IA - Paris H/F

Webnet
Publiée le
Gestion de projet
Intelligence artificielle
Python

48k-55k €
Paris, France
Dans le cadre du développement de solutions basées sur l’intelligence artificielle chez nos client grands compte, nous recherchons un Product Owner IA capable de piloter la conception et la mise en production de produits intégrant des technologies d’IA et de data. Vous travaillerez au cœur d’équipes pluridisciplinaires composées de développeurs, data scientists, designers et experts métier. Vous aurez pour missions : Définir et piloter la vision produit autour des solutions d’intelligence artificielle Recueillir et prioriser les besoins métiers et utilisateurs Rédiger et maintenir le product backlog et les user stories Travailler en étroite collaboration avec les équipes Data / IA / Engineering Prioriser les fonctionnalités en fonction de la valeur business et de la faisabilité technique Suivre les cycles de développement en méthodologie agile (Scrum / Kanban) Participer à la définition des KPIs produit et à l’analyse de la performance Assurer la communication avec les parties prenantes internes et externes
Freelance

Mission freelance
Data Engineer - Azure

CONCRETIO SERVICES
Publiée le
Databricks
PySpark

12 mois
300-400 €
Nouvelle-Aquitaine, France
Contexte Rejoignez une équipe agile SAFe pour concevoir et industrialiser des pipelines Data et ML robustes sur un environnement Azure moderne. Vous serez au cœur de la transformation des prototypes data scientists en solutions de production. Vos missions Pipelines Data & ML Développement de pipelines Batch sous Azure Databricks Utilisation avancée de PySpark, Delta Lake, MLFlow, Workflows Optimisation des performances : partitionnement, gestion mémoire, exploitation GPU Mise en place de mécanismes de reprise d'erreur, de traçabilité et de monitoring Collaboration avec les data scientists pour industrialiser leurs modèles Développement logiciel Conception de packages Python robustes et maintenables Respect des standards : qualité de code, tests unitaires, CI/CD, documentation Développement d'APIs via Azure Functions et/ou Azure Container Apps Contribution projet & RUN Participation aux phases projet : faisabilité, architecture, conception, réalisation, MEP Activités d'amélioration continue et participation aux rituels agiles
Freelance

Mission freelance
Chef de projet IA (H/F) - 92

Mindquest
Publiée le
AI
JIRA

3 mois
Issy-les-Moulineaux, Île-de-France
Notre client, un acteur majeur dans son secteur, lance un projet ambitieux intégrant des solutions d’Intelligence Artificielle (IA) pour optimiser ses processus métiers. Dans ce cadre, nous recherchons un Chef de Projet expérimenté pour : Piloter le delivery des livrables en respectant les contraintes de coûts, délais et qualité. Coordonner les équipes techniques (développeurs, data scientists, experts IA) et fonctionnelles. Garantir l’alignement entre les solutions IA déployées et les besoins métiers. 1. Pilotage de Projet Planification et suivi : Élaborer et maintenir le plan de projet (jalons, livrables, risques). Animer les comités de pilotage et les points d’avancement avec la direction. Assurer le reporting régulier (tableaux de bord, indicateurs de performance). Gestion des parties prenantes : Faciliter la communication entre les équipes techniques, les métiers et la direction. Anticiper et résoudre les blocages (techniques, organisationnels, budgétaires). 2. Delivery de Solutions IA Cadrage technique : Participer à la conception des solutions IA (cas d’usage, architectures, choix technologiques). Valider la faisabilité technique et les contraintes (data, infrastructure, sécurité). Suivi des livrables : Coordonner les équipes pour respecter les délais et la qualité des livrables (POC, MVP, industrialisation). Organiser les tests utilisateurs et les recettes fonctionnelles. Gestion des risques : Identifier et mitiger les risques liés à l’IA (biais, conformité RGPD, performance des modèles).
Freelance

Mission freelance
Data Engineer - Google Cloud Platform - Scripting Bash - Requêtes complexes SQL

ARKAMA CS
Publiée le
Bash
Google Cloud Platform (GCP)

1 an
Hauts-de-France, France
Conception, Développement et Optimisation de Pipelines de Données sur GCP : Concevoir, développer et maintenir des pipelines robustes et performants de collecte, transformation et chargement de données à partir de diverses sources (Oracle, fichiers, APIs, etc.) vers BigQuery et d'autres destinations. Utiliser et orchestrer les services Google Cloud Platform (Dataflow, Dataproc, Cloud Composer/Airflow, Pub/Sub, Cloud Storage, BigQuery) pour construire des architectures de données scalables et fiables. Assurer l'automatisation des traitements, la gestion des dépendances et l'ordonnancement des jobs de données. Optimiser les performances des pipelines et la consommation des ressources GCP. Modélisation et Gestion des Données : Participer à la conception et à l'évolution des modèles de données dans BigQuery, en collaboration avec les Data Analysts et les équipes métier. Assurer la qualité, la cohérence et l'intégrité des données stockées et mises à disposition. Mettre en place et gérer des stratégies de versioning des schémas de données et de cycle de vie des données. Run Opérationnel, Maintenance et Support N2/N3 : Assurer le support opérationnel de niveau 2/3 du produit Topase dans ensemble (GCP + Solution éditeur). Développer et maintenir des scripts Bash pour l'automatisation des tâches opérationnelles, la supervision des flux, l'extraction/transformation de données et les tâches de maintenance système. Écrire, optimiser et exécuter des requêtes SQL complexes pour l'analyse, la qualification, le diagnostic d'incidents, la manipulation et la restitution de données dans BigQuery et Oracle. Gérer les incidents en collaboration avec l'éditeur et les équipes internes. Participer à la qualification des livraisons de patchs éditeur impactant les flux de données. Gérer les incidents éditeur sur son CRM et participer aux ateliers de suivi. Monitoring, Logging et Alerting des Données : Mettre en place et maintenir des solutions de supervision spécifiques aux flux de données, à la qualité des données, aux performances des traitements et à l'utilisation des ressources GCP (Stackdriver, Grafana, Looker Studio). Définir et implémenter des alertes pertinentes pour détecter proactivement les anomalies de données ou de pipelines. Créer des dashboards visuels pour le suivi des KPI opérationnels et métier liés à la donnée. Infrastructure as Code (IaC) pour la Data : Participer à la définition et à l'implémentation de l'infrastructure de données (bases de données, services GCP) via des outils IaC (Terraform). Garantir la reproductibilité et la traçabilité des environnements de données (Dev, Recette, Pré-Prod, Prod). Collaboration et Conseil : Travailler en étroite collaboration avec les Data Scientists, Data Analysts, Product Owners et les équipes métier pour comprendre les besoins en données et proposer des solutions techniques adaptées. Conseiller sur les meilleures pratiques d'ingénierie des données, l'utilisation des services GCP et l'optimisation des architectures de données. Participer aux rituels Agile/Kanban de l'équipe produit.
CDD
CDI
Freelance

Offre d'emploi
DATA OPS DATAIKU DSS

R&S TELECOM
Publiée le
AWS Cloud
Azure
CI/CD

6 mois
Bordeaux, Nouvelle-Aquitaine
Objectifs de la mission Industrialiser les projets de Machine Learning développés sous Dataiku DSS Mettre en place une chaîne MLOps robuste, sécurisée et maintenable Garantir la fiabilité, la performance et la gouvernance des flux de données alimentant Dataiku Assurer le bon passage du POC à la production, puis l’exploitation dans le temps Contribuer à la diffusion des bonnes pratiques MLOps & DataOps au sein des équipes Data Périmètre d’intervention Projets Data Science & IA développés sous Dataiku DSS Chaînes MLOps (entraînement, déploiement, supervision des modèles) Connexion de Dataiku aux sources de données de l’entreprise Environnements DEV / TEST / PROD Livrables attendus Pipelines MLOps Dataiku industrialisés et documentés Modèles ML déployés et supervisés en production Connecteurs Dataiku vers les sources de données opérationnels Documentation d’exploitation MLOps & DataOps Recommandations de standardisation et d’amélioration continue Interactions Rattachement : Responsable de domaine SI Dataplatform et BI avec un détachement opérationnel dans l’équipe Data Science le temps du projet Partenaires clés : équipes IT (projets, devs, MCO), directions métiers (commerce, marketing, supply chain, finance), conformité et sécurité. Data Scientists, Data Engineers, Architectes Data / Cloud, équipes de la direction technique : Infrastructures, Production, Sécurité & Exploitation Compétences Dataiku DSS – niveau avancé (MLOps & DataOps) Expérience confirmée en industrialisation de modèles ML Python, SQL CI/CD, Git Très bonne compréhension des architectures Data Environnements Cloud (AWS / GCP / Azure) Sensibilité forte aux enjeux sécurité, RUN et exploitation
Freelance
CDI

Offre d'emploi
Ingénieur DATA Senior

MGI Consultants
Publiée le
Apache Kafka
Python

3 ans
65k-75k €
550-650 €
Paris, France
Nous recherchons un(e) Ingénieur(e) Data Senior H/F pour accompagner un grand groupe du secteur industriel, présent dans plus de 130 pays. Au sein du département Digital IT/Deploy IT, le Senior Data Engineer devra intégrer la squad Data Connect qui est en charge de l’implémentation de produits data augmentés par l’IA pour accélérer la delivery des projets data et principalement l’ingestion de données dans le but de faciliter l’accès à la donnée legacy aux différents consommateurs (Cognite Data Fusion, RC et EP Surface Data Hub, dashboards Power BI, produits digitaux…). Vos missions sont les suivants : Comprendre, analyser et proposer des solutions techniques répondant aux besoins des différents acteurs de la donnée (spécialistes métier, domain managers, architectes, data scientists), Dans une logique de mise en production, automatiser la création et le déploiement de pipelines de données robustes sur Databricks, ADF, extracteurs Cognite Data Fusion ou autres (collecte, stockage, exposition), Développer le produit Data Connect Monitoring afin d’assurer une bonne qualité des données pour les différents consommateurs (préparation, complétude, épuration, enrichissement) dans le but d’exposer une donnée gouvernée, monitorée et de qualité, Participer activement aux différents workshops afin d’enrichir la vision produit et contribuer également à l’amélioration des outils utilisés (monitoring, observabilité, exposition...), Améliorer les processus internes : localisation et traçabilité de la donnée, standardisation des flux et des scripts de traitement des données, documentation.
Freelance
CDI

Offre d'emploi
Chef de projet IA - Change Manager IA

Deodis
Publiée le
Agent IA

12 mois
40k-45k €
400-500 €
Bordeaux, Nouvelle-Aquitaine
mission à Bordeaux, 3 jours sur site Vous interviendrez dans le cadre de la Transformation IA Générative. Vous rejoindrez une équipe de 5 personnes (3 stagiaires data scientist, 1 alternant en innovation, 1 manager) et collaborant étroitement avec toutes les équipes non techniques. Vous serez placé(e) sous la responsabilité du Directeur de la Transformation IA Générative. La prestation s'inscrit dans un contexte de transformation d'entreprise à l'ère de l'IA Générative, pour des profils non techniques. Missions principales Accompagner les équipes métier dans leur transformation IA et les rendre progressivement autonomes dans leur quotidien. Il s'agit de donner aux collaborateurs les outils, les connaissances et la confiance pour intégrer l'IA de manière durable et concrète. À ce titre, vous serez notamment amené(e) à : *Pilotage des licences: Administrer l'attribution des licences IA, s'assurer de leur bonne utilisation et analyser les données d'usage pour orienter les actions d'accompagnement. *Animation des événements IA: Concevoir et animer les rendez-vous mensuels : onboarding pour les nouveaux utilisateurs et webinaire "La Parole au Champion" pour partager les bonnes pratiques. Assurer la régularité, améliorer les formats et mesurer l'impact. *Veille technologique: Suivre les nouvelles solutions d'IA générative (généralistes comme spécialisées) et faire remonter les opportunités d'adoption de façon structurée. *Documentation Confluence: Maintenir une base de référence toujours à jour : bonnes pratiques, cas d'usage, tutoriels, retours d'expérience. *Accompagnement terrain: Aider les équipes métier à mettre en place agents, skills et workflows IA. Valoriser et diffuser les réussites pour créer une dynamique collective. *Activités complémentaires Communication Codir / Comex: Préparer et animer les points réguliers sur l'avancement : métriques d'adoption, personae, succès, points de vigilance, prochaines étapes. Contexte technique & organisationnel Outils & Framework : Claude, ChatGPT, Copilot, Power Automate et outils no-code Langages : Python Infrastructure : Azure / Snowflake Méthodologie : Scrum (sprint planning, daily, retrospective)
Freelance

Mission freelance
Senior Data Engineer & AI Engineer (H/F)

Comet
Publiée le
Batch
BigQuery
CI/CD

7 mois
400-650 €
Île-de-France, France
Nous recherchons un(e) Senior Data & AI Engineer pour concevoir et opérer une plateforme data cloud-native sur Google Cloud Platform. Vous interviendrez à l’intersection de l’ingénierie des données à grande échelle et de l’IA générative appliquée : pipelines BigQuery, services IA GCP (Vertex AI, Gemini) et déploiement de systèmes RAG / agents LLM permettant de rendre les données business intelligibles et actionnables. Mission hands-on à fort impact pour un(e) expert(e) maîtrisant aussi bien le socle data que l’IA appliquée. Responsabilités : Data Engineering & BigQuery Concevoir et maintenir des pipelines ELT scalables : BigQuery, Cloud Workflows, Pub/Sub Écrire et optimiser du SQL avancé : window functions, CTEs, procédures stockées, partitionnement Modéliser les données pour les usages BI et ML Piloter l’optimisation des coûts BigQuery : clustering, vues matérialisées, gestion des slots, tuning Mettre en place la qualité, la traçabilité et l’observabilité des données Gérer l’infrastructure as code avec Terraform Automatiser le déploiement des pipelines data via CI/CD (Cloud Build, GitHub Actions) IA Générative & Services GCP Architecturer et déployer des systèmes RAG connectés aux données internes (structurées et non structurées) Utiliser des LLMs (Gemini, GPT-4o, open-source) pour des cas d’usage analytiques, RAG et agents autonomes en production Construire des agents autonomes capables d’interroger et d’analyser les données business Concevoir des stratégies de prompt engineering et de gestion de contexte pour agents LLM Productioniser des modèles ML via Vertex AI Pipelines, Model Registry et Feature Store Mettre en place l’évaluation et le monitoring de la qualité des modèles en production Utiliser le Model Context Protocol (MCP) pour connecter des agents LLM à des sources de données externes (bases de données, APIs, outils internes) Gouvernance & Collaboration Définir et appliquer les politiques de gouvernance des données et les garde-fous d’usage de l’IA Participer aux revues d’architecture et contribuer aux décisions de plateforme Collaborer avec Data Scientists, Analystes BI et Software Engineers en équipes Agile
Freelance

Mission freelance
Ingénieur IA / MLOps / LLMOps (H/F)

SPIE ICS
Publiée le
IA

6 mois
400-550 €
Fontenay-aux-Roses, Île-de-France
Rôle principal Industrialiser les modèles d’intelligence artificielle sur le cluster Kubernetes, structurer les pipelines d’entraînement et d’inférence, et accompagner les équipes Data Scientists et métiers dans leurs projets IA. Missions Concevoir et mettre en place des pipelines MLOps / LLMOps (CI/CD IA) robustes et automatisés. Gérer les workflows d’entraînement des modèles IA. Optimiser l’utilisation des GPU via batching, mixed precision, et parallélisation multi-GPU. Déployer des API d’inférence performantes et scalables. Mettre en place et gérer un registre (registry) des modèles IA. Assurer la gestion des versions des datasets et des modèles. Effectuer une veille technologique constante sur les outils et méthodes IA. Apporter un support technique aux équipes R&D. Réaliser des benchmarks de performance des modèles et des pipelines. Compétences clés MLOps / LLMOps : Expérience dans la mise en place et la gestion de pipelines MLOps, maîtrise des outils tels que MLflow, Weights & Biases, Kubeflow, Argo Workflows, GitLab CI, GitHub Actions, vLLM. Intelligence Artificielle : Expertise en IA générative, deep learning, utilisation des frameworks Hugging Face. Optimisation GPU : Maîtrise de CUDA, techniques de batching, mixed precision, multi-GPU. Langages de script : Python, Bash. DevOps : Intégration et automatisation avec Kubernetes, Docker, gestion des déploiements automatisés.
Freelance

Mission freelance
Product Manager (H/F)

Freelance.com
Publiée le
Product management

1 an
100-480 €
Bordeaux, Nouvelle-Aquitaine
Contexte de la mission Dans le cadre du développement d’un produit de paiement fractionné (4x) , vous interviendrez au sein du domaine Risk Management B2C d’une direction produit. Vous intégrerez une équipe produit complète composée de : Product Managers Développeurs Data Analysts & Data Scientists L’objectif est de piloter un produit stratégique à fort enjeu business et réglementaire. 🎯 Vos missions Votre rôle sera de piloter et faire évoluer un produit de paiement fractionné , en maximisant la valeur client. À ce titre, vous serez amené(e) à : Piloter le bon fonctionnement du produit (technique & fonctionnel) Recueillir les besoins utilisateurs et les transformer en features Prioriser le backlog en fonction de la valeur business Piloter le delivery avec les équipes tech et data Assurer la communication produit et le partage des insights Suivre la performance via des KPI et une approche data-driven 🎯 Enjeux Améliorer l’expérience client sur le paiement fractionné Optimiser le delivery produit au quotidien Assurer la conformité réglementaire (Directive Crédit Conso – 2026) 🧩 Environnement🔧 Technique .NET Snowflake Jira / Confluence ⚙️ Organisation Méthodologie Agile Scrum Rituels : Daily, Sprint Planning, Refinement, Demo, Retro Collaboration étroite : Produit / Tech / Métier
Freelance

Mission freelance
253535/Expert Dataiku DSS - Bordeaux

WorldWide People
Publiée le
Dataiku

3 mois
Bordeaux, Nouvelle-Aquitaine
Expert Dataiku DSS - Bordeaux COMPETENCES · Dataiku DSS – niveau avancé (MLOps & DataOps) · Expérience confirmée en industrialisation de modèles ML · Python, SQL · CI/CD, Git · Très bonne compréhension des architectures Data · Environnements Cloud (AWS / GCP / Azure) · Sensibilité forte aux enjeux sécurité, RUN et exploitation CONTEXTE Le domaine SI Dataplatform & BI souhaite renforcer ses capacités d’industrialisation des projets Data Science et IA. La plateforme Dataiku DSS est utilisée pour le développement des modèles ML et nécessite une expertise externe pour sécuriser leur mise en production, leur exploitation dans le temps et leur alimentation en données. La mission s’inscrit à l’interface entre l’équipe Data Science et l’équipe Dataplatform de la DSI, avec une forte orientation d’industrialisation (build & run). OBJECTIFS DE LA MISSION · Industrialiser les projets de Machine Learning développés sous Dataiku DSS · Mettre en place une chaîne MLOps robuste, sécurisée et maintenable · Garantir la fiabilité, la performance et la gouvernance des flux de données alimentant Dataiku · Assurer le bon passage du POC à la production, puis l’exploitation dans le temps · Contribuer à la diffusion des bonnes pratiques MLOps & DataOps au sein des équipes Data PERIMETRE D’INTERVENTION • Projets Data Science & IA développés sous Dataiku DSS • Chaînes MLOps (entraînement, déploiement, supervision des modèles) • Connexion de Dataiku aux sources de données de l’entreprise • Environnements DEV / TEST / PROD LIVRABLES ATTENDUS · Pipelines MLOps Dataiku industrialisés et documentés · Modèles ML déployés et supervisés en production · Connecteurs Dataiku vers les sources de données opérationnels · Documentation d’exploitation MLOps & DataOps · Recommandations de standardisation et d’amélioration continue INTERACTIONS · Rattachement : Responsable de domaine SI Dataplatform et BI avec un détachement opérationnel dans l’équipe Data Science le temps du projet · Partenaires clés : équipes IT (projets, devs, MCO), directions métiers (commerce, marketing, supply chain, finance), conformité et sécurité. Data Scientists, Data Engineers, Architectes Data / Cloud, équipes de la direction technique : Infrastructures, Production, Sécurité & Exploitation COMPETENCES · Dataiku DSS – niveau avancé (MLOps & DataOps) · Expérience confirmée en industrialisation de modèles ML · Python, SQL · CI/CD, Git · Très bonne compréhension des architectures Data · Environnements Cloud (AWS / GCP / Azure) · Sensibilité forte aux enjeux sécurité, RUN et exploitation
Freelance

Mission freelance
Data Engineer Senior — Cloud Platform Paiement

CONCRETIO SERVICES
Publiée le
AWS Cloud
Data Engineering
Databricks

6 mois
Nanterre, Île-de-France
RÉSUMÉ EXPRESS Data Engineer senior (4 ans+, Bac+5) pour construire et opérer les pipelines data d'une plateforme cloud de paiement à fort volume transactionnel. Il maîtrise Python/PySpark et Databricks en production, conçoit les architectures data lakehouse sur AWS (S3, Redshift), optimise les jobs Spark et garantit la fiabilité et la qualité des données pour les usages analytics et ML. Expérience fintech ou paiement fortement appréciée. 2 jours de télétravail par semaine / Anglais professionnel opérationnel obligatoire. MISSIONS PRINCIPALES Design & Construction des Pipelines Data Concevoir et construire les pipelines ETL/ELT d'ingestion, transformation et chargement depuis de multiples sources (terminaux POS, APIs, systèmes de paiement) Choisir les patterns adaptés selon les cas d'usage : batch vs streaming, data warehouse vs data lake vs lakehouse Développer en Python/PySpark avec des pratiques d'ingénierie logicielle solides (tests, packaging, code maintenable) Databricks & Optimisation Spark Construire et optimiser les workflows Databricks (Jobs, Delta Live Tables) en production sur des volumes significatifs Optimiser les jobs Spark : partitionnement, broadcast joins, caching, memory management, tuning des performances et des coûts Architecture Data & Stockage AWS Concevoir les structures de données et les patterns de stockage sur AWS (S3, Redshift, formats Parquet/Delta/Iceberg) Modéliser et optimiser les données dans Redshift (distribution keys, sort keys, requêtes analytiques) Gérer la sécurité des données dans un contexte de données de paiement sensibles (IAM, chiffrement, conformité) Fiabilité Production & Qualité des Données Assurer le monitoring et l'alerting des pipelines en production, intervenir sur les incidents (données manquantes, pipeline en retard, données corrompues) Mettre en place des contrôles de qualité des données (data validation, schema evolution, data lineage) Collaboration & Veille Travailler avec les data scientists pour comprendre leurs besoins et leur fournir des datasets de qualité pour le ML Assurer une veille technologique active sur les nouvelles technologies et best practices data
Freelance

Mission freelance
Consultant Data Engineer GCP

STHREE SAS
Publiée le

7 mois
Lille, Hauts-de-France
4. Description de la prestation et des missions attendues Le/La Data Engineer sera intégré(e) à l'équipe produit TOPASE NLS et interviendra sur les missions suivantes : 🔹 Conception, développement et optimisation des pipelines de données (GCP) Concevoir, développer et maintenir des pipelines robustes et performants pour la collecte, la transformation et le chargement des données depuis diverses sources (Oracle, fichiers, API, etc.) vers BigQuery et autres cibles. Exploiter et orchestrer les services Google Cloud Platform (Dataflow, Dataproc, Cloud Composer/Airflow, Pub/Sub, Cloud Storage, BigQuery) afin de construire des architectures data scalables et fiables. Automatiser les traitements, gérer les dépendances et orchestrer les jobs de données. Optimiser les performances des pipelines ainsi que la consommation des ressources GCP. 🔹 Modélisation et gestion des données Participer à la conception et à l'évolution des modèles de données dans BigQuery, en lien avec les Data Analysts et les équipes métiers. Garantir la qualité, la cohérence et l'intégrité des données. Mettre en œuvre des stratégies de versioning des schémas et de gestion du cycle de vie des données. 🔹 Run opérationnel, maintenance et support N2/N3 Assurer le support opérationnel de niveau 2/3 de la solution TOPASE (environnement GCP + solution éditeur). Développer et maintenir des scripts Bash pour automatiser les tâches récurrentes (supervision, traitement de données, maintenance). Rédiger, optimiser et exécuter des requêtes SQL complexes (BigQuery et Oracle) pour l'analyse, le diagnostic d'incidents et la restitution de données. Gérer les incidents en collaboration avec les équipes internes et l'éditeur. Participer à la qualification des livraisons de patchs éditeur impactant les flux de données. Suivre les incidents via le CRM éditeur et contribuer aux comités de suivi. 🔹 Monitoring, logging et alerting Mettre en place et maintenir des dispositifs de supervision des flux de données, de la qualité, des performances et de l'utilisation des ressources (Stackdriver, Grafana, Looker Studio). Définir et implémenter des alertes permettant la détection proactive des anomalies. Concevoir des tableaux de bord pour le suivi des KPI opérationnels et métier. 🔹 Infrastructure as Code (IaC) Contribuer à la définition et à l'implémentation de l'infrastructure data via Terraform. Garantir la reproductibilité et la traçabilité des environnements (Dev, Recette, Pré-prod, Prod). 🔹 Collaboration et conseil Travailler en étroite collaboration avec les équipes Data (Data Scientists, Data Analysts), les Product Owners et les métiers. Proposer des solutions techniques adaptées et conseiller sur les bonnes pratiques en Data Engineering. Participer aux rituels Agile/Kanban de l'équipe produit. 5. Compétences et expériences requises5.1 Expertise technique Cloud GCP : Expertise confirmée des services data (BigQuery, Dataflow, Cloud Storage, Pub/Sub, Composer/Airflow, Stackdriver, Data Catalog). Bases de données : Maîtrise avancée SQL (optimisation, requêtes complexes), expérience sur BigQuery et Oracle 19 (MySQL/PostgreSQL appréciés). Scripting : Excellente maîtrise de Bash (indispensable pour le run). Systèmes : Bonne maîtrise des environnements Linux (RedHat). IaC : Solide expérience avec Terraform. CI/CD : Maîtrise d'un outil comme GitLab CI. Monitoring/Logging : Stackdriver, Grafana, ELK, Looker Studio. Versioning : Git (GitLab). Réseaux : Connaissances solides (TCP/IP, HTTP/S, DNS, load balancing, firewall). Data Engineering : Maîtrise des concepts ETL/ELT, Data Warehouse, Data Lake et streaming. 5.2 Environnement technique TOPASE NLS OS : RedHat Enterprise 9.4 Cloud : Azure (solution éditeur) & GCP (data, monitoring, pipelines) CI/CD : GitLab CI IaC : Terraform Monitoring : Looker Studio, GANTI, Grafana, ELK Bases : Oracle, BigQuery Langage : Bash 5.3 Méthodologies et soft skills Expérience en environnement Agile (Scrum, Kanban). Excellentes capacités d'analyse et de résolution de problèmes, notamment en situation d'incident. Autonomie, proactivité et sens de l'amélioration continue. Bonnes compétences de communication (français courant, anglais technique). Esprit d'équipe et partage des connaissances. Sens des responsabilités, notamment en environnement de production. 5.4 Expérience Minimum 3 ans d'expérience en tant que Data Engineer, idéalement sur GCP. Expérience sur des environnements à forte volumétrie, avec des enjeux de performance, fiabilité et disponibilité.

Déposez votre CV

  • Fixez vos conditions

    Rémunération, télétravail... Définissez tous les critères importants pour vous.

  • Faites-vous chasser

    Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.

  • 100% gratuit

    Aucune commission prélevée sur votre mission freelance.

Les questions fréquentes à propos de l’activité d’un Data scientist

Quel est le rôle d'un Data scientist

À l'ère du Big Data, le Data Scientist est un peu l'évolution du Data Analyst. C'est un spécialiste de l'analyse et de l'exploitation de données au sein d'une entreprise. Son rôle est de donner du sens à ces données, afin d'en extraire de la valeur, pour permettre à l'entreprise de prendre des décisions stratégiques et/ou opérationnelles. Il fait partie des fonctions à haute responsabilité dans une entreprise.

Quels sont les tarifs d'un Data scientist

Le taux journalier moyen d'un freelance data scientist est d'environ 450 €/jour. Il peut varier en fonction des années d'expérience et de la position géographique du professionnel. Le salaire d'un data analyst débutant est de 35 K€. Le salaire du data scientist expérimenté, oscille entre 50 K€ à 60 K€.

Quelle est la définition d'un Data scientist

Le Data Scientist est un élément indispensable de l'entreprise, étant donné qu'il est chargé de l'analyse de données massives appelée Big Data. C'est lui qui gère la collecte, le stockage, l'analyse et l'exploitation de millions de données recueillies via différents canaux. Ces données servent à analyser les performances de l'entreprise, et à anticiper les comportements des consommateurs, ou les nouvelles tendances. C'est un domaine à la fois excitant et prometteur. Il génère de nouveaux challenges, et permet aux professionnels de toujours gagner en compétences. Le Data Scientist a de solides connaissances en marketing. Ce professionnel est très sollicité auprès des entreprises qui cherchent sans cesse à améliorer leurs performances et à rester compétitives. Après avoir terminé son analyse, le Data Scientist va alors rédiger un rapport où il explique ses conclusions à la direction, ou à son client.

Quel type de mission peut gérer un Data scientist

Le Data Scientist a pour principale mission de « prédire l'avenir ». La quantité importante de données que génèrent maintenant les entreprises peut se révéler très utile si elle est bien utilisée. Le scientifique des données pourra alors assurer le développement stratégique de l'entreprise, ainsi que sa transformation digitale. Pour y parvenir, il doit déchiffrer les masses de données opaques afin de leur donner un sens. Son rôle est donc de transformer des données en informations exploitables. Il pourra proposer à ses clients des solutions de pilotage IT pour répondre à des besoins spécifiques. Le fait de créer des algorithmes lui permettra d'anticiper sur les comportements et les besoins futurs, afin d'orienter des décisions importantes. C'est d'ailleurs cette forme de créativité qui le distingue du Data Analyst. Grâce à son expertise, le Data Scientist doit pouvoir présenter des propositions innovantes et pertinentes à ses clients, implémenter et déployer des modèles de machine learning, et enfin communiquer ses conclusions aux services concernés. Il peut intervenir pour des projets à court, ou à moyen terme.

Quelles sont les compétences principales d'un Data scientist

Le Data Scientist doit maîtriser de nombreux savoir-faire pour bien effectuer ses missions. Nous pouvons en mentionner quelques-uns : • Être capable d'analyse efficacement des données statistiques et les modéliser • Avoir une bonne connaissance des outils de programmation et du langage informatique • Maîtriser les techniques de visualisation des données • Posséder de fortes affinités pour le marketing • Avoir le sens des affaires et une bonne aptitude à la communication • Être rigoureux, organisé, avec une force de proposition • Pouvoir respecter la confidentialité des données • Savoir travailler en équipe, sous pression et gérer le stress • Mener une veille IT

Quel est le profil idéal pour un Data scientist

De nombreuses écoles commencent à offrir des diplômes en mathématiques et applications avec spécialité statistique, ingénierie Big Data, ou analyse des données massives. Il existe aussi d'autres formations permettant d'accéder au métier de Data Scientist, notamment en école supérieure d'informatique, de statistique, ou en école d'ingénieur. Il faudra tout de même justifier d'une expérience de 4 à 5 ans dans l'analyse de données ou dans un environnement datacenter.
118 résultats

Contrats

Freelance CDI CDD Alternance Stage

Lieu

Télétravail

Télétravail partiel Télétravail 100% Présentiel

Taux Journalier Moyen min.

150 € 1300 € et +

Salaire brut annuel min.

20k € 250k €

Durée

0 mois 48 mois

Expérience

≤ 2 ans d’expérience 3 à 5 ans d’expérience 6 à 10 ans d’expérience > 10 ans d’expérience

Publication

Au service des talents IT

Free-Work est une plateforme qui s'adresse à tous les professionnels des métiers de l'informatique.

Ses contenus et son jobboard IT sont mis à disposition 100% gratuitement pour les indépendants et les salariés du secteur.

Free-workers
Ressources
A propos
Espace recruteurs
2026 © Free-Work / AGSI SAS
Suivez-nous