285 Emplois pour Nlp - France
Machine Learning Engineer (NLP)
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Description
What We're Looking For :
Meltwater's Consumer Intelligence AI Team is looking for a Machine Learning Engineer to help improve the multimodal semantic layer of MIRA, our AI assistant, while also developing innovative new features that power the next generation of applied generative AI in the Consumer Intelligence industry.
We are looking for someone with a creative, proactive, collaborative, and innovation focused mindset. You will work alongside a team of passionate machine learning engineers driven by enthusiasm for adopting new technologies and excitement about making the difference for customers using applied AI.
Our team is organized over 3 objectives : innovation, research and production.
- Innovation : We leverage our AI expertise to constantly imagine new business oriented features to enhance our products.
- Research : To implement our algorithms, we need to stay up-to-date to the latest breakthroughs over the Machine Learning world as well as the latest frameworks.
- Production : We make a point of designing and developing our algorithms with production-grade best practices. Scalability is our goal. The models and systems that we develop are running over billions of documents (text or image) per day.
Responsibilities :
Preferred Experience :
Nice to have :
Where You'll Work : 8, rue du Renard - 75004 Paris
Our Story
At Meltwater, we believe that when you have the right people in the right environment, great things happen.
Our best-in-class technology empowers our 27,000 customers around the world to make better business decisions through data. But we can't do that without our global team of developers, innovators, problem-solvers, and high-performers who embrace challenges and find new solutions for our customers.
Our award-winning global culture drives everything we do and creates an environment where our employees can make an impact, learn every day, feel a sense of belonging, and celebrate each other's successes along
the way.
We are innovators at the core who see the potential in people, ideas and technologies. Together, we challenge ourselves to go big, be bold, and build best-in-class solutions for our customers.
We're proud of our diverse team of 2,200+ employees in 50 locations across 25 countries around the world. No matter where you are, you'll work with people who care about your success and get the support you need to unlock new heights in your career.
We are Meltwater. Inspired by innovation, powered by people.
Equal Employment Opportunity Statement
Meltwater is an Equal Opportunity Employer and Prohibits Discrimination and Harassment of Any Kind : At Meltwater, we are dedicated to fostering an inclusive and diverse workplace where every employee feels valued, respected, and empowered. We are committed to the principle of equal employment opportunity and strive to provide a work environment that is free from discrimination and harassment.
All employment decisions at Meltwater are made based on business needs, job requirements, and individual qualifications, without regard to race, color, religion or belief, gender, gender identity or expression, sexual orientation, national origin, genetics, disability, age, marital status, veteran status, or any other status protected by the applicable laws and regulations.
Meltwater does not tolerate discrimination or harassment of any kind, and we actively promote a culture of respect, fairness, and inclusivity. We encourage applicants of all backgrounds, experiences, and abilities to apply and join us in our mission to drive innovation and make a positive impact in the world.
#J-18808-LjbffrMLOps Engineer – NLP Specialist
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
QuantCube recherche un(e) ingénieur(e) MLOps talentueux(se) spécialisé(e) en NLP (traitement du langage naturel).
Ce poste est idéal pour les personnes passionnées par la construction et la maintenance de pipelines complexes de données et de modèles d’apprentissage automatique, avec un fort intérêt pour l’application de l’IA à des problématiques économiques et financières concrètes.
Vous serez amené(e) à :
Comprendre les pipelines de données et de machine learning existants, et maintenir le datalake textuel actuel.
Concevoir des schémas conceptuels pour les pipelines de données et les workflows ML.
Collaborer avec les data scientists pour créer des modèles robustes afin d’approcher les indicateurs économiques d’intérêt, en utilisant des modèles NLP de pointe, y compris les LLMs (Large Language Models), des techniques avancées d’apprentissage statistique, l’analyse de séries temporelles, le machine learning et l’IA.
Développer des pipelines de modélisation de bout en bout en Python, en appliquant les bonnes pratiques du développement logiciel, de l’ingestion des données jusqu’au déploiement.
Comprendre les indicateurs économiques, leurs méthodologies et les facteurs qui les influencent.
Développer des procédures de collecte et de traitement des données massives, en mobilisant des compétences avancées en data engineering.
Explorer et évaluer la qualité des sources de données disponibles.
Développer et exécuter des tests de qualité sur des indices de production.
Collaborer avec l’équipe IT, notamment les architectes data et data engineers, pour la mise en œuvre des pipelines.
4 ans ou plus d’expérience en MLOps ou ingénierie ML, idéalement dans des environnements centrés sur le NLP.
Solides compétences en réflexion conceptuelle et en résolution de problèmes.
Bonne maîtrise des structures de données, de la modélisation et de l’architecture logicielle.
À l’aise avec la gestion de jeux de données à grande échelle.
Connaissances en économétrie et en techniques de séries temporelles, ainsi qu’en modèles de machine learning.
Familiarité avec les modèles NLP et de deep learning.
Excellente maîtrise de Python (y compris la programmation orientée objet), des commandes UNIX sous Linux et de SQL.
Expérience avec la plateforme cloud AWS (GCP et Azure sont un plus).
Compréhension des workflows CI/CD et du déploiement de modèles ML.
Bonne compréhension des principes macroéconomiques et financiers.
Maîtrise de l’anglais.
#J-18808-LjbffrLead Data Scientist - NLP
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Join to apply for the Lead Data Scientist - NLP role at QuantCube Technology
Join to apply for the Lead Data Scientist - NLP role at QuantCube Technology
Job Description
QuantCube Technology is looking for a Lead Data Scientist with deep expertise
Job Description
QuantCube Technology is looking for a Lead Data Scientist with deep expertise
in Natural Language Processing (NLP) and LLMs to lead the development of AI
models powering real-time economic indicators. In this role, you’ll design and
deploy end-to-end NLP pipelines, explore alternative data sources, and apply
the latest research to real-world financial and economic use cases. You’ll work
closely with data engineers, economists, and product teams to deliver
innovative, high-impact solutions.
- Lead end-to-end NLP model development, from data exploration and feature engineering to training, evaluation, and production deployment
- Track and integrate the latest developments in LLMs and NLP research Develop models from the ground up. Evaluate and integrate various alternative data sources to improve model accuracy
- Develop procedures for collecting and processing Big Data, using massive data engineering skills
- Explore and assess the quality of available data sources
- Develop and run quality tests on production indices
- Collaborate with IT team including Data Architects and Data Engineers for pipeline implementation
- Understand economic indicators, their methodologies, and influencing factors
- Create data visualizations and dashboards to communicate insights to stakeholders
- Interact with QuantCube product team and business experts to create or enhance new product lines, such as QuantCube’s business intelligence platform
Missions
- Diriger le développement de modèles NLP de bout en bout, de l'exploration des données et de l'ingénierie des fonctionnalités à la formation, l'évaluation et le déploiement de la production.
- Suivre et intégrer les derniers développements en matière de LLM et de recherche en NLP
- Développer des modèles à partir de la base. Évaluer et intégrer diverses sources de données alternatives afin d'améliorer la précision des modèles.
- Développer des procédures pour la collecte et le traitement des Big Data, en utilisant les compétences d'ingénierie des données massives
- Explorer et évaluer la qualité des sources de données disponibles
- Développer et exécuter des tests de qualité sur les indices de production
- Collaborer avec l'équipe IT, y compris les architectes et les ingénieurs de données, pour la mise en œuvre de la pipeline
- Comprendre les indicateurs économiques, leurs méthodologies et les facteurs d'influence
- Créer des visualisations de données et des tableaux de bord pour communiquer des informations aux parties prenantes
- Interagir avec l'équipe produit de QuantCube et les experts métier pour créer ou améliorer de nouvelles lignes de produits, telles que la plateforme d'intelligence économique de QuantCube.
- 3+ years of experience in Data Science and NLP
- Solid knowledge of traditional NLP and LLMs
- Strong conceptual thinking and problem-solving skills
- Solid knowledge of data structures, modeling, and software architecture
- Proficient in managing large-scale datasets
- Proven ability to supervise and support junior data scientists in a team setting
- Knowledge of econometric and time series techniques as well as Machine Learning Models
- Programming skills: Strong level in Python (including OOP), UNIX commands under Linux and SQL
- Experience with AWS cloud platform (GCP and Azure nice-to-have)
- Understanding of macroeconomic and financial principles
- Ability to translate business problems into data-driven solutions
- Fluency in English
- 3+ ans d'expérience en Data Science et NLP
- Solide connaissance du NLP traditionnel et des LLMs
- Solides compétences en matière de réflexion conceptuelle et de résolution de problèmes
- Solide connaissance des structures de données, de la modélisation et de l'architecture logicielle
- Maîtrise de la gestion d'ensembles de données à grande échelle
- Capacité avérée à superviser et à soutenir des data scientists juniors au sein d'une équipe
- Connaissance des techniques économétriques et de séries temporelles ainsi que des modèles d'apprentissage automatique
- Compétences en programmation : Niveau élevé en Python (y compris OOP), commandes UNIX sous Linux et SQL
- Expérience de la plateforme cloud AWS (GCP et Azure souhaitable)
- Compréhension des principes macroéconomiques et financiers
- Capacité à traduire les problèmes commerciaux en solutions basées sur les données.
- Maîtrise de l'anglais
1st interview (30min) with HR
2nd interview (1h): use case with the team
3rd interview (1h): Meet our Co-funders! Seniority level
- Seniority level Mid-Senior level
- Employment type Full-time
- Job function Engineering and Information Technology
Referrals increase your chances of interviewing at QuantCube Technology by 2x
Get notified about new Lead Software Engineer jobs in Paris, Île-de-France, France .
Senior Software Engineer - France Global Payroll Senior Data Scientist (French & English fluent)Boulogne-Billancourt, Île-de-France, France 3 weeks ago
Lead Programmer – Might & Magic: Fates (F/H/NB)Boulogne-Billancourt, Île-de-France, France 2 days ago
Courbevoie, Île-de-France, France 2 weeks ago
Manager I, Engineering - AI Platform, Evaluation & AnnotationBoulogne-Billancourt, Île-de-France, France 1 month ago
Lead Data Scientist & Futur Partner & Head of AI (H/F) Manager I, Engineering - Core Analytics - Datasets & Governance Consultant transformation Github Freelance Back-end (Senior) Software Engineer (H/F/X)We’re unlocking community knowledge in a new way. Experts add insights directly into each article, started with the help of AI.
#J-18808-LjbffrLead Data Scientist - NLP
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
QuantCube Technology est à la recherche d'un Data Scientist de premier plan avec une expertise approfondie en traitement du langage naturel (NLP) et LLMs pour diriger le développement de modèles AI alimentant des indicateurs économiques en temps réel. Dans ce rôle, vous allez concevoir et déployer des pipelines NLP de bout en bout, explorer des sources de données alternatives, et appliquer les dernières recherches à des cas d'utilisation financiers et économiques réels. Vous travaillerez en étroite collaboration avec des ingénieurs de données, des économistes et des équipes de produits pour fournir des solutions innovantes et à fort impact.
Diriger le développement de modèles NLP de bout en bout, de l'exploration des données et de l'ingénierie des fonctionnalités à la formation, l'évaluation et le déploiement de la production.
Suivre et intégrer les derniers développements en matière de LLM et de recherche en NLP
Développer des modèles à partir de la base. Évaluer et intégrer diverses sources de données alternatives afin d'améliorer la précision des modèles.
Développer des procédures pour la collecte et le traitement des Big Data, en utilisant les compétences d'ingénierie des données massives
Explorer et évaluer la qualité des sources de données disponibles
Développer et exécuter des tests de qualité sur les indices de production
Collaborer avec l'équipe IT, y compris les architectes et les ingénieurs de données, pour la mise en œuvre de la pipeline
Comprendre les indicateurs économiques, leurs méthodologies et les facteurs d'influence
Créer des visualisations de données et des tableaux de bord pour communiquer des informations aux parties prenantes
Interagir avec l'équipe produit de QuantCube et les experts métier pour créer ou améliorer de nouvelles lignes de produits, telles que la plateforme d'intelligence économique de QuantCube.
Solid knowledge of data structures, modeling, and software
architecture
3+ ans d'expérience en Data Science et NLP
Solide connaissance du NLP traditionnel et des LLMs
Solides compétences en matière de réflexion conceptuelle et de résolution de problèmes
Solide connaissance des structures de données, de la modélisation et de l'architecture logicielle
Maîtrise de la gestion d'ensembles de données à grande échelle
Capacité avérée à superviser et à soutenir des data scientists juniors au sein d'une équipe
Connaissance des techniques économétriques et de séries temporelles ainsi que des modèles d'apprentissage automatique
Compétences en programmation : Niveau élevé en Python (y compris OOP), commandes UNIX sous Linux et SQL
Expérience de la plateforme cloud AWS (GCP et Azure souhaitable)
Compréhension des principes macroéconomiques et financiers
Capacité à traduire les problèmes commerciaux en solutions basées sur les données.
Maîtrise de l'anglais
#J-18808-LjbffrData Scientist NLP / GenAI senior
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
UNIVERS OBSERVABLE DE L'ENTREPRISE
Notre client est une entreprise de conseil en stratégie qui a développé un outil permettant de collecter et d'analyser un grand volume de données web pour proposer automatiquement des idées sur-mesure à chaque utilisateur, en reproduisant le comportement humain d'acquisition de connaissances sur le web.
Dans le cadre d'un remplacement, notre client recherche un.e Data Scientist NLP / GenAI expérimenté.e pour rejoindre son équipe Data (2 personnes) et prendre un rôle central dans l'évolution de leur solution.
MISSIONS
En étroite collaboration avec les équipes internes, les clients et partenaires externes, vous aurez pour missions de :
- Développer des algorithmes de NLP et GenAI afin d'améliorer les modèles de restitutions de connaissances récoltées sur le web
- Explorer et créer des supports d'information permettant de transmettre la connaissance à l'utilisateur en tenant compte de sa charge cognitive (Visual Language Model, Text to Speech, graphes de connaissances.)
- Garantir la traçabilité et la fiabilité des résultats (IA explicable) en reliant les synthèses à leurs sources originales
- Concevoir des solutions d'IA performantes, scalables et souveraines (LLM open-source, solutions on-premise.)
- Réaliser une veille et mener des expérimentations pour évaluer de nouvelles approches ou de nouveaux modèles (LLMs, RAG, vector databases.)
- Travailler en binôme avec un post-doctorant, participer à la structuration de l'équipe et à la montée en compétences des autres membres de l'équipe sur les sujets d'IA générative et NLP.
Profil recherché
SPHÈRE ACADÉMIQUE
Vous êtes titulaire d'un BAC+5 ou d'un doctorat en data science, informatique, statistique ou linguistique informatique et vous possédez minimum 5 ans d'expérience (thèse incluse) en conception et développement de produits basés sur le NLP et les LLMs.
SPHÈRE TECHNIQUE
- Expertise en IA générative : maîtrise des LLMs open-source (Llama, Mistral, Falcon.), architectures RAG, prompt engineering, frameworks d'inférence, bases de données vectorielles et techniques de grounding de modèles
- Maitrise des techniques de NLP fondamentales (reconnaissance d'entités nommées, classification de texte, topic modeling, résumé automatique de texte) et des bibliothèques associées (Hugging Face Transformers, SpaCy, NLTK)
- Maitrise de Python, des bibliothèques d'analyse de données (Pandas, NumPy) et des frameworks de Machine Learning / Deep Learning (PyTorch et / ou TensorFlow)
- Compétences solides en développement logiciel appliquées à des projets d'IA (Python, Git, tests.)
SPHERES ORBITALES - bonus
- Une expérience en optimisation de modèles IA pour la performance et la scalabilité, avec une sensibilité aux enjeux de souveraineté numérique est un plus
- Des connaissances en Docker et CI / CD sont un plus
SPHÈRE SOCIALE
- Curiosité technique, rigueur scientifique et autonomie
- Capacité à documenter et à rendre compte de votre travail
- Orientation résultats
- Appétence pour le partage de connaissances, le travail en équipe et le mentoring
INFORMATIONS SATELLITAIRES
- Date de décollage : dès que possible
- Base de lancement : Paris 9ème - 2 jours de télétravail par semaine
- Combustible : à partir de 65 k€ brut annuel, selon profil et expérience
- Poste en CDI
- Processus de recrutement : 1 entretien avec un.e recruteur.se Science me Up + 1 entretien avec le CTO et le CEO + 1 test technique + 1 entretien final pour débriefer du test
Département Data Science Poste Machine learning, Deep learning, IA (#ai) Localisations Paris Statut à distance Hybride Type de contrat CDI Publication date 6 juin 2025
#J-18808-LjbffrData Scientist NLP/GenAI - Catalog
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.
Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.
Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations :
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…
Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.
Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.
A propos du job
Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.
Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
Nous cherchons une personne en CDI, sur Paris, Bordeaux ou en full remote
Sujets catalogue :
- Réécriture automatique du contenu Marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’image et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
Ce qu’il y a pour vous dans ce job :
- Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
- Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
- Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils
Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.
Au quotidien, vous allez :
- Analyser, préparer les données, prototyper des algorithmes
- Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
- Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
- Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
- Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration
Vous aimerez ce job si :
- Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
- Vous avez déjà mis en production des algorithmes de Machine Learning
- Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe
- Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
- Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Envie de nous rejoindre?
- Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
- Un premier échange technique par zoom de 30 minutes avec une personne de l’équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
- Un cas pratique à réaliser à la maison.
- Une restitution et échange technique avec un manager de l’équipe Data Science de 75 minutes.
- Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d’entreprise.
Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
#J-18808-LjbffrSenior Data Scientist NLP/GenAI - Catalog
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Bordeaux, France
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.
Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.
Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations :
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…
Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.
Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.
A propos du job
Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.
Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
Nous cherchons des personnes en CDI sur Paris, Bordeaux ou en full remote
Sujets catalogue :
- Réécriture automatique du contenu Marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’image et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
Ce qu’il y a pour vous dans ce job :
- Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
- Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
- Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils
Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.
Au quotidien, vous allez :
- Analyser, préparer les données, prototyper des algorithmes
- Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
- Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
- Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
- Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration
Vous aimerez ce job si :
- Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
- Vous avez déjà mis en production des algorithmes de Machine Learning
- Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe
- Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
- Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Envie de nous rejoindre?
- Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
- Un premier échange technique par zoom de 30 minutes avec une personne de l’équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
- Un cas pratique à réaliser à la maison.
- Une restitution et échange technique avec un manager de l’équipe Data Science de 75 minutes.
- Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d’entreprise.
Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
Mettre en place une alerte emploi
Vous souhaitez développer votre carrière chez Mirakl - Labs? Demandez à recevoir directement dans votre boîte de messagerie les offres d’emploi à venir.
Postuler à ce posteindique un champ obligatoire
Nom de famille *
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Lettre de motivation
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Est-ce que vous nous avez vu au Devoxx 2025 au Palais des Congrès à Paris ? Select.
#J-18808-LjbffrSoyez le premier informé
À propos du dernier Nlp Emplois dans France !
Senior Data Scientist NLP/GenAI - Catalog
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.
Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.
Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations :
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…
Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.
Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.
A propos du job
Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.
Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
Nous cherchons des personnes en CDI, sur Paris, Bordeaux ou en full remote
Sujets catalogue :
- Réécriture automatique du contenu Marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’image et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
Ce qu’il y a pour vous dans ce job :
- Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
- Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
- Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils
Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.
Au quotidien, vous allez :
- Analyser, préparer les données, prototyper des algorithmes
- Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
- Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
- Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
- Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration
Vous aimerez ce job si :
- Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
- Vous avez déjà mis en production des algorithmes de Machine Learning
- Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe
- Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
- Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Envie de nous rejoindre?
- Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
- Un premier échange technique par zoom de 30 minutes avec une personne de l’équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
- Un cas pratique à réaliser à la maison.
- Une restitution et échange technique avec un manager de l’équipe Data Science de 75 minutes.
- Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d’entreprise.
Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
Mettre en place une alerte emploi
Vous souhaitez développer votre carrière chez Mirakl - Labs? Demandez à recevoir directement dans votre boîte de messagerie les offres d’emploi à venir.
Postuler à ce posteindique un champ obligatoire
Nom de famille *
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Lettre de motivation
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Est-ce que vous nous avez vu au Devoxx 2025 au Palais des Congrès à Paris ? Select.
#J-18808-LjbffrSenior Data Scientist NLP/GenAI - Catalog
Publié il y a 6 jours
Emploi consulté
Description De L'emploi
Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activité digitale afin d'accélérer de façon durable et rentable leur croissance.
Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grâce au retail media.
Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations :
Nos équipes techniques et produits, nommées Mirakl Labs, sont principalement réparties entre nos 2 hubs situés à Paris et à Bordeaux. Elles collaborent au quotidien afin d'adresser les problématiques de nos clients et utilisateurs en répondant à différents challenges liés aux nouvelles fonctionnalités, à la scalabilité, la sécurité et l’ergonomie…
Elles opèrent en mode agile et s'organisent en Squads composées d'un Squad Lead, de 5 développeurs, d'un Product Manager et d'un QA. Chaque Squad est spécialisée sur un scope fonctionnel afin de concevoir et réaliser de nouvelles features, leurs évolutions et des APIs (avec un découpage en micro-services). Nos équipes Infrastructure, Architecture, Sécurité, Documentation, Product Design, Data et Support opèrent en transverse en apportant leur expertise et de la cohérence sur l’ensemble des produits.
Toutes les équipes sont responsables de leur périmètre et chacun des collaborateurs apporte son expérience et ses idées. Innovation, feedback et implication dans les prises de décision sont au cœur de notre philosophie.
Et pour favoriser ce partage avec d’autres passionnés, nous sommes sponsors, speakers, et hôtes de différents événements, meetups, et associations de la scène Tech en France. Au cours des dernières années, nous avons participé à des événements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.
A propos du job
Intégré.e dans notre équipe Data Science, votre principale mission sera de prototyper, itérer, et mettre en production des algorithmes en collaboration avec les équipes Produit, les Data Engineers et les équipes de développement.
Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.
Nous cherchons une personne en CDI, sur Paris, Bordeaux ou en full remote
Sujets catalogue :
- Réécriture automatique du contenu Marketing en fonction des attentes métier
- Extraction d’attributs produit à partir d’image et de texte libre
- Détection de produits variants
- Catégorisation de produits
- Onboarding automatique des produits vendeurs
- Fusion de fiches produits provenant de sources multiples
- Prédiction de produits tendance
Ce qu’il y a pour vous dans ce job :
- Implémenter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumétrie très importantes (millions de produits, de clients, de commandes par an)
- Des techniques de pointe variées (modèles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français à avoir des LLM finetunés en production à grande échelle. Rejoignez-nous pour continuer à cultiver cet esprit pionnier
- Une vraie autonomie et responsabilité dans les projets dont vous avez ownership
Notre stack et nos outils
Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.
Au quotidien, vous allez :
- Analyser, préparer les données, prototyper des algorithmes
- Les mettre en production en collaboration avec les Data Engineers et les équipes de développement
- Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
- Présenter les résultats au weekly data science et participer aux sessions de brainstorming de l’équipe
- Échanger avec les autres équipes pour affiner les cas d’utilisation, l’expérience utilisateur et les modes d’intégration
Vous aimerez ce job si :
- Vous avez 4 ans d'expérience minimum en tant que Data Scientist, avec une expérience significative en NLP et ML appliqué en entreprise
- Vous avez déjà mis en production des algorithmes de Machine Learning
- Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
- Vous avez une expérience en développement Spark
- Vous êtes pragmatique, data-driven et orienté métier
- Vous aimez avoir l’ownership de vos sujets et vous êtes autonome et avez un très bon esprit d’équipe
- Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
- Vous aimez partager votre travail dans le cadre de présentations internes, dans des conférences ou en rédigeant des articles
Envie de nous rejoindre?
- Un échange téléphonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de découvrir ce que Mirakl peut vous offrir en retour.
- Un premier échange technique par zoom de 30 minutes avec une personne de l’équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de découvrir comment vos compétences peuvent s'intégrer à nos projets.
- Un cas pratique à réaliser à la maison.
- Une restitution et échange technique avec un manager de l’équipe Data Science de 75 minutes.
- Un dernier échange de 1H par zoom avec des futurs collègues Mirakl autour de nos valeurs et de notre culture d’entreprise.
Mirakl est engagée en faveur de la diversité, de l’égalité des chances et de l’inclusion. Nous célébrons nos différences car nous sommes convaincus que les qualités visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous étudions toutes les candidatures sans distinction de : genre, ethnicité, religion, orientation sexuelle, handicap, âge ou toute autre caractéristique protégée par la loi.
Mettre en place une alerte emploi
Vous souhaitez développer votre carrière chez Mirakl - Labs? Demandez à recevoir directement dans votre boîte de messagerie les offres d’emploi à venir.
Postuler à ce posteindique un champ obligatoire
Nom de famille *
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Lettre de motivation
Saisir manuellement
Types de fichiers acceptés: pdf, doc, docx, txt, rtf
Est-ce que vous nous avez vu au Devoxx 2025 au Palais des Congrès à Paris ? Select.
#J-18808-Ljbffr