next up previous contents
Next: Extraction d'information utilisant des Up: Recherche et extraction d'information Previous: Organisation géographique des connaissances

Une classification 5W1H à NEC

Le groupe de Pattern Analysis and Human Language Technology de l'entreprise NEC, géant de l'informatique et de la communication, a développé un moteur de navigation dans des bases de données textuelles à partir de requête sous la forme des six questions élémentaires 5W1H (who, when, where, what, why, how). Dans la phase d'organisation de l'information au sein de la base de données, le programme extrait un vecteur à six dimensions, contenant des informations relatives aux six questions 5W1H, pour chaque phrase. Cette extraction d'information utilise des techniques de TALN et de pattern matching, afin d'identifier les informations intéressantes.

La phase de navigation découle naturellement de l'organisation des informations, en ce sens que l'utilisateur doit remplir un ou plusieurs champs du questionnaire 5W1H, puis le navigateur recherche les documents répondant aux critères sélectionnés. Les démonstrations des applications actuelles concernent des dépêches économiques, pour lesquelles le formalisme 5W1H est particulièrement bien adapté.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998