Stage Ingénieur de Recherche en Traitement du Langage Naturel H/F

Dassault Systèmes | 17 Oct 2024


Détail du poste

Rejoignez Dassault Systèmes en tant que Data Scientist au sein d'une nouvelle équipe Science Network faisant partie du département de la Recherche. Cette équipe a pour objectif de créer des outils pour modéliser les réseaux scientifiques dans leur ensemble, ainsi que les écosystèmes d'innovation entourant Dassault Systèmes. Vous interagirez avec les différentes activités de R&D de Dassault Systèmes.

En tant que Stagiaire en Traitement du Langage Naturel (NLP), vous participerez à des recherches et développements de pointe pour améliorer l'identification des entités scientifiques dans les publications académiques. Ce rôle est crucial pour faire progresser la compréhension et l'organisation des informations dans la littérature scientifique.

Votre Rôle

Réaliser un État de l'Art : Effectuer une revue approfondie des méthodes et technologies actuelles pour l'identification et l'extraction d'entités dans la littérature scientifique.

Développer une taxonomie : Créer une taxonomie détaillée et exhaustive des entités scientifiques, incluant les ensembles de données, modèles, algorithmes et autres entités connexes.

Collecte de données : Rassembler et/ou annoter un ensemble substantiel de publications académiques pour soutenir l'entraînement et l'évaluation du modèle.

Développement et entraînement : Concevoir, entraîner et implémenter un modèle de machine Learning adapté à l'identification et à la classification des entités scientifiques.

Évaluation du Modèle : Évaluer les performances du modèle en utilisant diverses métriques et benchmarks pour garantir son efficacité dans des applications réelles.
Vos qualifications

Étudiant(e) en cursus universitaire ou en école d'ingénieurs préparant un diplôme de niveau Bac +5, vous avez des compétences en science des données et apprentissage statistique.

Nous recherchons une personne très motivée avec un fort intérêt pour le Traitement du Langage Naturel et le Machine Learning. Le candidat idéal doit être en cours d'obtention ou avoir récemment obtenu un diplôme en Informatique, Science des Données, Intelligence Artificielle, ou dans un domaine connexe. Les qualifications clés incluent :
- Compétences Techniques : Maîtrise des langages de programmation tels que Python, et expérience avec les bibliothèques et frameworks NLP comme NLTK, SpaCy, ou Pytorch.
- Connaissances en Machine Learning : Familiarité avec les concepts et techniques de machine learning, en particulier dans le contexte du traitement de texte et de la reconnaissance d'entités (transformers, RNN etc.).
- Compétences analytiques : Forte capacité de résolution de problèmes et aptitude à travailler avec des ensembles de données complexes pour en tirer des insights significatifs.
- Compétences en communication : Compétences efficaces en communication écrite et orale pour documenter les résultats de la recherche et présenter les conclusions.
- Esprit d'équipe : Capacité à travailler en collaboration dans un environnement orienté vers le travail d'équipe et à s'adapter à une culture de travail dynamique.

Une expérience antérieure avec les publications académiques ou la recherche universitaire est un atout, mais n'est pas requise. Une passion pour l'innovation et un vif intérêt pour la littérature scientifique vous démarqueront.

Nous rejoindre c'est aussi

Intégrer une entreprise scientifique au coeur de l'innovation technologique, portée par une forte croissance depuis plus de 40 ans avec pour principaux avantages et bénéfices :
- Environnement multiculturel
- Cadre de travail convivial axé sur le bien-être et la santé (salles de sport & de musique, conciergerie...)
- Engagement en faveur de la diversité et de l'inclusion.
- Politique dynamique de développement de carrière : plan de formation, mobilités internes pour n'en citer que quelques exemples.

L'adresse du poste

Localisez l'entreprise et calculez votre temps de trajet en un clic !

Finalisez votre candidature

sur le site du recruteur.