Scientific direction Development of key enabling technologies
Transfer of knowledge to industry

Programme de stages

Sciences de la Terre >> Géochimie
1 proposition(s).

Évaluation et amélioration d’un moteur de recherche sémantique

DIASI/LVIC

Sciences de la Terre - Géochimie

Saclay

Région parisienne (91)

4 à 6 mois

Ingénieur/Master

3340636

Les candidatures doivent être adressées par email et sous forme d'un CV et d'une lettre de motivation détaillant les compétences à :
CEA Grenoble

17 rue des martyrs
38054 Grenoble
e-mail : gael.de-chalendar@cea.fr

Dans le cadre du projet ANR Asfalda, le laboratoire LVIC du CEA LIST étend son moteur de recherche crosslingue AMOSE pour lui donner des capacités d'indexation et de recherche exploitant des informations sémantiques issues d'outils de Semantic Role Labeling. L'objectif premier du stage sera d'évaluer l'impact de l'intégration de la sémantique sur les résultats de recherche. Le second objectif sera d'améliorer le moteur de recherche au vu des premiers résultats d'évaluation. AMOSE est un moteur de recherche crosslingue. Il repose sur l'analyseur linguistique libre Lima [1] qui reconnaît les termes nominaux complexes (Multi Word Expressions ou MWE en anglais). Ces termes complexes repérés dans les documents et les requêtes sont utilisés pour grouper les documents résultats en classes d'équivalence en fonction des termes de la requête qu'ils contiennent. LIMA a récemment été enrichi d'un module effectuant de l'annotation en rôles sémantiques (Semantic Role Labeling) et nous sommes en train de modifier AMOSE pour indexer et utiliser dans la recherche les classes repérées et leurs rôles. Le travail du stagiaire consistera à évaluer la nouvelle version d'AMOSE sur les campagnes d'évaluation classiques (CLEF, TREC) dont le laboratoire possède les données et à rechercher quelles campagnes plus ciblées sur la recherche sémantique pourraient exister et mettre en ouvre AMOSE sur leurs données. Si une telle campagne a lieu durant le stage, le laboratoire y participera. Ces évaluations fourniront des informations permettant de mettre à jour des pistes d'amélioration. Le stagiaire les documentera et en mettra certaines en oeuvre. [1] https://github.com/aymara/lima/wiki

Voir toutes nos offres