next up previous contents
Next: Les laboratoires Up: Ressources linguistiques Previous: Les ressources d'ATR

Le projet GDA à ETL

Le centre de recherche d'ETL à Tsukuba, qui a développé l'environnement multilingue MULE disponible sur les versions 20 de GNU Emacs, tente de promouvoir un standard d'annotation pour les documents HTML publiés sur Internet : le système Global Document Annotation (GDA). Il permettrait aux machines de reconnaître automatiquement les structures sémantiques et pragmatiques du document. Les initiateurs du projet espèrent qu'une quantité importante de données annotées vont peu à peu apparaître, pouvant en particulier servir de corpus linguistique. Pour promouvoir ce nouveau standard, les initiateurs du projet ont proposé une collection d'annotations permettant aux ordinateurs de deviner les structures du document, et ont développé des applications censées favoriser l'emploi de ce système, comme de la traduction automatique, du data mining, des résumés automatiques ou des présentations automatiques à partir d'un unique document.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998