next up previous contents
Next: Regroupement hiérarchique de mots Up: L'organisation structurée des concepts Previous: Un dictionnaire de concepts

Des graphes de co-occurence à ETL

Le Docteur Tanaka-Ishii, du laboratoire ETL à Tsukuba (Electrotechnical Laboratory), a travaillé sur la construction de graphes de co-occurence entre mots, afin d'obtenir une représentation sous forme de graphes des concepts représentés par les mots. Cette approche a été utilisée dans le cadre de l'étude de corpus multi-lingues non alignés. En effet, en utilisant un dictionnaire bilingue, et les graphes de co-occurence obtenus avec deux corpus des deux langues considérées, il est possible de rechercher une fonction reliant les deux graphes; cette fonction peut ensuite être utilisée pour la désambiguation des mots nécessaire à la traduction d'une langue à l'autre.

La structure créée dans ce cadre est de nouveau un graphe, mais construit automatiquement à partir d'un corpus. De même que pour le graphe d'EDR, il est supposé représenter des relations valables quelle que soit la langue étudiée.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998