next up previous contents
Next: Analyse et représentation sémantique Up: Analyses combinées Previous: Analyses combinées

Un analyseur morpho-syntaxique basé sur l'algorithme LR à Tokodai

L'équipe du professeur Tanaka, au Tokyo Institute of Technology, a proposé une méthode d'analyse combinant l'analyse de la morphologie et de la syntaxe en une seule étape, mais en conservant des règles morphologiques et syntaxiques distinctes. Ce point est crucial, tant il est vrai que de nombreuses théories ont déjà été étudiées dans chacun de ces deux domaines.

L'analyse morphologique ``classique'' utilise un dictionnaire, qui spécifie pour chaque mot ou groupe de caractères sa catégorie morphologique mcat, et une matrice de connectivité autorisant ou non une suite de deux mcat. Beaucoup d'ambiguïtés subsistent si cette méthode est utilisée seule.

Pour palier à cet inconvénient, l'équipe du professeur Tanaka a proposé de combiner cette approche pour la morphologie avec la méthode d'analyse syntaxique LR, qui part des règles d'une grammaire CFG pour en déduire une matrice LR permettant à un automate d'analyser la phrase de gauche à droite. Pour cela, les règles de la grammaire CFG (qui concernent des catégories syntaxiques cat), sont augmentées de règles reliant les mcat aux cat, grâce au dictionnaire dans lequel chaque mot possède une cat et une mcat. En général, une cat est associée à plusieurs mcat. Cette grammaire étendue de manière automatique, considérée comme une grammaire CFG, engendre une matrice LR ayant pour base non plus des cat, mais l'ensemble des cat et des mcat.

La matrice de connectivité est ensuite utilisée pour éliminer les actions de réduction illégales de manière automatique, dans la matrice LR généralisée, ce qui engendre une nouvelle table LR modifiée, travaillant sur les mcat et les cat, et contenant les contraintes morphologiques de la matrice de connectivité. Un algorithme LR légèrement modifié, pour travailler sur les caractères et non les mots, permet de construire un arbre résumant la structure morphologique et syntaxique de la phrase.


next up previous contents
Next: Analyse et représentation sémantique Up: Analyses combinées Previous: Analyses combinées

Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998