next up previous contents
Next: L'utilisation du formalisme HPSG Up: Analyse syntaxique Previous: KNP : un analyseur

Un analyseur pour l'anglais basé sur des arbres de décision à ATR

Les chercheurs d'ATR ont développé un analyseur syntaxique pour l'anglais, en utilisant la ``ATR English Grammar''. Cette grammaire contient près de 3000 étiquettes possibles pour les mots, et est basée sur environ 1.100 règles. La structure syntaxique d'une phrase apparaît comme un arbre dont chaque noeud contient la règle de grammaire qui l'a généré, s'il est non-terminal, et l'étiquette du mot concerné, s'il est terminal. Un corpus de textes analysés selon cette grammaire, le ``ATR/Lancaster Treebank of General English'' (développé avec Lancaster University, au Royaume-Uni), représente un ensemble permettant l'entraînement d'arbres de décision construisant automatiquement l'arbre associé à une phrase donnée. Les questions utilisées dans l'arbre de décision concernent les valeurs attachées aux feuilles des arbres, qu'elles soient terminales ou non, ainsi que des caractéristiques des mots bruts ou des phrases (ex: taille de la phrase).

Une analyse est le résultat d'une succession d'analyses partielles, représentant des états successifs dans le processus de détermination de l'arbre. Le passage d'un état à un autre se produit quand un nouveau n tex2html_wrap347 oeud est étiqueté ou quand il est décidé qu'un n tex2html_wrap347 oeud est terminal. Ces décisions sont précisément prises grâce à des arbres de décision, qui sont entraînés pour les prendre avec les corpus d'entraînement.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998