next up previous contents
Next: Classification automatique de documents Up: Classification de documents Previous: Classification de documents

Recherche de kanjis à l'université de Kyoto

Le laboratoire du docteur Kurohashi, de l'université de Kyoto, a proposé une méthode de classification de documents japonais sans passer par l'analyse morphologique des documents, mais en observant directement les caractères constituant les phrasesgif.

Pour ce faire, une base de données de textes classés par thèmes (philosophie, botanique etc...) est utilisée pour extraire les kanjis caractéristiques de chaque thème par une méthode du tex2html_wrap_inline359 . Ces kanjis caractéristiques sont ensuite utilisés pour classer automatiquement tout nouveau texte en fonction des caractères utilisés.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998