Coordonnées :
Bureau C617
Maison de la Recherche Université de Toulouse-Le Mirail 5, allées Antonio Machado 31058 Toulouse Cedex 1 Tél : +33 (0)5 61 50 39 89 Fax : +33 (0)5 61 50 46 77 E-mail : |
![]() |
Recherche | Enseignement | Publications | Activités annexes |
---|
Encadrement Cette thèse s'inscrit dans VOILADIS (VOIsinage Lexical pour l'Analyse du DIScours), un projet du PRES de Toulouse. Elle est co-encadrée par des membres des laboratoires CLLE-ERSS (Cécile Fabre et Marie-Paule Péry-Woodley) et IRIT (Philippe Muller et Nicholas Asher).
Objectifs L'objectif de cette thèse est d'exploiter des indices lexicaux pour la mise au jour automatique de phénomènes discursifs. Si l'importance des indices de cette nature pour la structuration du discours a été reconnue, ils sont encore peu exploités en TAL, car ils sont difficiles à appréhender. En effet, les phénomènes de cohésion lexicale reposent principalement sur des relations dites non-classiques, que ne recensent pas les ressources lexicales traditionnelles. Dans le cadre de cette thèse, la ressource mobilisée est une base de voisins distributionnels.
Voisins distributionnels Les voisins sont rapprochés par l'analyse distributionnelle d'un corpus sur la base des contextes qu'ils partagent. La chaîne de traitement aboutissant à la construction de cette ressource est la chaîne SYNTEX (analyse syntaxique)-UPERY (analyse distributionnelle), développée par Didier Bourigault. La base obtenue par le traitement d'un corpus constitué de l'ensemble des articles du Monde sur une période de 10 ans peut être consultée ici. Dans le cadre de ma thèse, j'utilise une base construite à partir de l'intégralité de l'encyclopédie en ligne Wikipédia.
> La fiche "Ma thèse, facile, je vous explique !" réalisée pour le CIES
> Un poster réalisé pour me présenter dans le cadre d'une formation.