next up previous contents
Next: Analyses combinées Up: Analyse syntaxique Previous: POWERun analyseur orienté

Un analyseur syntaxique probabilisé a Tokodai

Le laboratoire du professeur Tanaka, au Tokyo Institute of Technology (Tokodai en abrégé), a généralisé la méthode d'analyse syntaxique GLR (Generalized Left-Right) en incluant une estimation de la probabilité des différents arbres obtenus avec cet algorithme. En cas ambiguïté entre plusieurs arbres, le plus probable peut alors être choisi, et une connaissance de la fiabilité d'une analyse pour une phrase donnée est également obtenue. De plus, les arbres trop peu probables peuvent être éliminés en cours de construction, ce qui augmente la vitesse de l'analyse

La méthode est plus précise que l'approche PCFG (Probabilistic Context-Free Grammar), qui consiste à assigner une probabilité à chaque règle de la grammaire. Pour obtenir un modèle légèrement sensible au contexte, les probabilités sont estimées pour les actions de la table LR, utilisée par l'automate pour analyser les phrases et obtenue à partir des règles de la grammaire. La probabilité d'une dérivation est définie comme le produit des probabilités des actions liées à cette dérivation. Les probabilités sont estimées à partir des fréquences des actions effectuées pour analyser un corpus de phrases correctement analysées (en l'occurence un ensemble de 10.000 phrases du corpus d'ATR)



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998