KLETA

Offre d'emploi Data Engineer Spark Senior

Paris

KLETA

Le poste

Freelance
CDI
3 ans
10k-73k €⁄an, 100-670 €⁄j
5 à 10 ans d’expérience
Télétravail partiel
Paris, France
Publiée le 10/04/2024

Partager cette offre

  1. Analyse des Exigences :

    • Collaborer avec les équipes métier pour comprendre les besoins en matière d'analyse de données et de traitement.

  2. Conception de Solutions :

    • Concevoir des architectures de données et des solutions de traitement distribué en utilisant Apache Spark.

    • Proposer des modèles de données adaptés aux cas d'utilisation spécifiques.

  3. Développement de Pipelines de Données :

    • Développer des pipelines de données robustes et évolutifs en utilisant Apache Spark pour l'ingestion, le nettoyage, la transformation et la préparation des données.

    • Utiliser Spark Streaming pour le traitement en temps réel des flux de données.

  4. Optimisation des Performances :

    • Optimiser les performances des jobs Spark en ajustant les configurations, en utilisant des techniques de partitionnement et de cache, et en améliorant l'efficacité des transformations.

  5. Gestion des Versions :

    • Utiliser des outils de contrôle de version pour gérer le code source et les artefacts des pipelines Spark.

  6. Tests et Validation :

    • Élaborer des stratégies de test pour les pipelines Spark et mettre en œuvre des tests unitaires, d'intégration et de régression.

    • Valider la qualité des données à différentes étapes du pipeline.

  7. Déploiement et Monitoring :

    • Déployer les pipelines Spark sur des clusters de production et surveiller les performances en temps réel.

    • Mettre en place des alertes pour détecter les problèmes de performance ou de disponibilité.

  8. Sécurité :

    • Implémenter des mesures de sécurité pour protéger les données sensibles tout au long du pipeline.

    • Utiliser des technologies telles que Kerberos, Ranger, ou des outils de chiffrement pour assurer la sécurité des données.

  9. Documentation :

    • Documenter les pipelines de données, les flux de travail, les configurations et les bonnes pratiques.

    • Créer des guides d'utilisation pour les autres membres de l'équipe et les utilisateurs finaux.

Profil recherché

Expérience :

  • Au moins 5 à 7 ans d'expérience dans le domaine du développement de logiciels et de l'ingénierie des données, avec une expertise spécifique dans Apache Spark.

  • Une expérience significative dans la conception, le développement et le déploiement de pipelines de données distribués et évolutifs utilisant Spark.

Compétences Techniques :

  • Maîtrise avancée d'Apache Spark, y compris les concepts de base, les API RDD, DataFrame et Dataset, ainsi que Spark SQL et Spark Streaming.

  • Solide compréhension des technologies Big Data telles que Hadoop, Hive, HDFS, Kafka, etc.

  • Excellente maîtrise des langages de programmation comme Scala, Python ou Java, avec une préférence pour Scala pour le développement Spark.

  • Expérience pratique dans l'optimisation des performances Spark, y compris l'ajustement des configurations, l'utilisation efficace de la mémoire, la gestion des partitions, etc.

  • Connaissance des outils de développement et de déploiement tels que Git, Jenkins, Docker, Kubernetes, etc.

Environnement de travail

Le client utilise Spark pour traiter les données de streaming et fournir des analyses en temps réel pour améliorer l'expérience utilisateur, personnaliser les recommandations de contenu et optimiser les performances du système.

Neuilly-sur-Seine, Île-de-France
20 - 99 salariés
ESN
KLETA est la société de conseil en stratégie data et en développement de plateformes KLETA incarne une nouvelle génération de société en services data spécialisée dans le conseil en transformation data, la mise en place de solutions cloud performantes et le pilotage de projet agiles. Nous aidons nos clients à concevoir avec succès la dernière génération de solutions et d’applications métiers basées sur les données.

Postulez à cette offre !

Trouvez votre prochaine mission parmi +15 000 offres !

  • Fixez vos conditions

    Rémunération, télétravail... Définissez tous les critères importants pour vous.

  • Faites-vous chasser

    Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.

  • 100% gratuit

    Aucune commission prélevée sur votre mission freelance.

Data Engineer Spark Senior

KLETA

Au service des talents IT

Free-Work est une plateforme qui s'adresse à tous les professionnels des métiers de l'informatique.

Ses contenus et son jobboard IT sont mis à disposition 100% gratuitement pour les indépendants et les salariés du secteur.

Free-workers
Ressources
A propos
Espace recruteurs
2024 © Free-Work / AGSI SAS
Suivez-nous