Le poste DATA SCIENTIST INFORMATION RETRIEVAL
Partager cette offre
● Compétences techniques clés :
● Moteurs de recherche : Maîtrise avancée d'Elasticsearch, incluant le tuning de pertinence et la gestion des index.
● Recherche Vectorielle : Expérience concrète dans l'utilisation de bases de données vectorielles et de modèles d'embedding.
● Reranking : Solide expérience dans la conception de modèles de reranking (XGBoost/LightGBM pour le LTR, ou approches Deep Learning).
● Stack Data : Maîtrise de Python, SQL et de l'écosystème GCP (BigQuery, Vertex AI).
● Expérience de plus de 7 ans en avec une spécialisation marquée sur les problématiques de Information Retrieval (IR)
● En intervenant à toutes les étapes des projets, vous pourrez :
● Stratégie Search : Collaborer avec les Product Managers pour défi nir la roadmap de pertinence (recherche textuelle, sémantique, hybride).
● Architecture Vectorielle : Concevoir et déployer des solutions de Vector Search (Embeddings, ANN) pour capturer l'intention client au-delà des mots-clés.
● Optimisation du Ranking : Implémenter et itérer sur des modèles de Learning to Rank (LTR) et de Reranking pour arbitrer entre pertinence métier, mix marge et préférences utilisateur.
● Évaluation de la pertinence : Mettre en place des protocoles d'A/B testing rigoureux et des frameworks d'évaluation (nDCG, MRR, Click-through rate).
● Expertise Elasticsearch : Optimiser les confi gurations, les analyseurs et les requêtes complexes pour garantir des performances temps réel à grande échelle.
● Mentorat : Guider et élever le niveau technique des data scientists juniors sur les thématiques de NLP et de Search.
Profil recherché
● Compétences techniques clés :
● Moteurs de recherche : Maîtrise avancée d'Elasticsearch, incluant le tuning de pertinence et la gestion des index.
● Recherche Vectorielle : Expérience concrète dans l'utilisation de bases de données vectorielles et de modèles d'embedding.
● Reranking : Solide expérience dans la conception de modèles de reranking (XGBoost/LightGBM pour le LTR, ou approches Deep Learning).
● Stack Data : Maîtrise de Python, SQL et de l'écosystème GCP (BigQuery, Vertex AI).
● Expérience de plus de 7 ans en avec une spécialisation marquée sur les problématiques de Information Retrieval (IR)
● En intervenant à toutes les étapes des projets, vous pourrez :
● Stratégie Search : Collaborer avec les Product Managers pour défi nir la roadmap de pertinence (recherche textuelle, sémantique, hybride).
● Architecture Vectorielle : Concevoir et déployer des solutions de Vector Search (Embeddings, ANN) pour capturer l'intention client au-delà des mots-clés.
● Optimisation du Ranking : Implémenter et itérer sur des modèles de Learning to Rank (LTR) et de Reranking pour arbitrer entre pertinence métier, mix marge et préférences utilisateur.
● Évaluation de la pertinence : Mettre en place des protocoles d'A/B testing rigoureux et des frameworks d'évaluation (nDCG, MRR, Click-through rate).
● Expertise Elasticsearch : Optimiser les confi gurations, les analyseurs et les requêtes complexes pour garantir des performances temps réel à grande échelle.
● Mentorat : Guider et élever le niveau technique des data scientists juniors sur les thématiques de NLP et de Search.
Environnement de travail
● Compétences techniques clés :
● Moteurs de recherche : Maîtrise avancée d'Elasticsearch, incluant le tuning de pertinence et la gestion des index.
● Recherche Vectorielle : Expérience concrète dans l'utilisation de bases de données vectorielles et de modèles d'embedding.
● Reranking : Solide expérience dans la conception de modèles de reranking (XGBoost/LightGBM pour le LTR, ou approches Deep Learning).
● Stack Data : Maîtrise de Python, SQL et de l'écosystème GCP (BigQuery, Vertex AI).
● Expérience de plus de 7 ans en avec une spécialisation marquée sur les problématiques de Information Retrieval (IR)
● En intervenant à toutes les étapes des projets, vous pourrez :
● Stratégie Search : Collaborer avec les Product Managers pour défi nir la roadmap de pertinence (recherche textuelle, sémantique, hybride).
● Architecture Vectorielle : Concevoir et déployer des solutions de Vector Search (Embeddings, ANN) pour capturer l'intention client au-delà des mots-clés.
● Optimisation du Ranking : Implémenter et itérer sur des modèles de Learning to Rank (LTR) et de Reranking pour arbitrer entre pertinence métier, mix marge et préférences utilisateur.
● Évaluation de la pertinence : Mettre en place des protocoles d'A/B testing rigoureux et des frameworks d'évaluation (nDCG, MRR, Click-through rate).
● Expertise Elasticsearch : Optimiser les confi gurations, les analyseurs et les requêtes complexes pour garantir des performances temps réel à grande échelle.
● Mentorat : Guider et élever le niveau technique des data scientists juniors sur les thématiques de NLP et de Search.
Postulez à cette offre !
Trouvez votre prochaine mission parmi +9 000 offres !
-
Fixez vos conditions
Rémunération, télétravail... Définissez tous les critères importants pour vous.
-
Faites-vous chasser
Les recruteurs viennent directement chercher leurs futurs talents dans notre CVthèque.
-
100% gratuit
Aucune commission prélevée sur votre mission freelance.
DATA SCIENTIST INFORMATION RETRIEVAL
BEEZEN
