next up previous contents
Next: Un analyseur pour l'anglais Up: Analyse syntaxique Previous: Analyse syntaxique

KNP : un analyseur pour les longues phrases, développé à l'université de Kyoto

L'algorithme KNP (Kurohashi-Nagao parser, du nom de ses inventeurs) est un algorithme qui a été développé dans le but d'analyser des longues phrases, tâche traditionnellement très difficile si des relations existent entre des mots éloignés. L'algorithme part de l'hypothèse qu'une longue phrase contient souvent des structures conjonctives reliant des groupes nominaux ou des propositions. Par exemple, dans la phrase "Paul a aimé le livre et adoré le film", la conjonction "et" sert à relier les deux propositions qui sont parallèles. Ce genre de structure est très fréquent dans la langue japonaise, et crée de nombreuses ambiguïtés pour les analyseurs syntaxiques.

Pour découvrir ces structures conjonctives, les membres du laboratoire du professeur Nagao, à l'université de Kyoto, ont proposé l'algorithme KNP qui calcule la similarité entre deux séries arbitraires de mots à gauche et à droite d'une conjonction, et qui sélectionne les deux séries de mots les plus similaires qui peuvent raisonnablement être considérées comme des éléments d'une structure conjonctive. Cette sélection utilise des techniques de programmation dynamique.

Lorsque plusieurs structures conjonctives ont été découvertes, l'algorithme se charge de "démêler" les relations qui se croisent. Enfin, une analyse syntaxique classique est opérée au sein de chaque bloc, et l'analyse de la phrase entière est obtenue en considérant les structures conjonctives comme des n tex2html_wrap347 uds simples.

La mesure de similarité entre deux blocs de mots, qui est la clé de l'algorithme, utilise des comparaisons entre les catégories morphologiques, les caractères (japonais) utilisés, et les catégories sémantiques des éléments des blocs, obtenues grâce à un thésaurus.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998