next up previous contents
Next: Une représentation sémantique utilisant Up: Représentations sémantiques non ordonnées Previous: Une approche vectorielle pour

Des vecteurs sémantiques à l'université de Shinshu

Le laboratoire des professeurs Nakano, Okamoto et Maruyama, de l'université de Shinshu à Nagano, travaille sur des outils de représentation 3D pour la recherche de documents sur Internet. L'approche utilise des vecteurs sémantiques, définis comme des vecteurs normés dont les coordonnées sont les poids des mots-clés associés aux vecteurs de base de l'espace euclidien à grande dimension représentant l'espace sémantique. Ces poids eux-mêmes sont calculés à partir des fréquences absolues et relatives d'apparition des mots-clés dans le document considéré, par rapport aux autres documents de la base de données.

Ces vecteurs sémantiques sont utilisés pour représenter, entre autre:

Ils servent également à définir simplement la similarité entre deux documents, comme le produit scalaire de leurs vecteurs sémantiques.

Encore une fois, le passage par des représentations vectorielles permet l'utilisation de techniques simples (projections, produits scalaires...) auxquelles il est possible de donner un sens sémantique.



Jean-Philippe Vert
Mon Nov 2 11:04:59 MET 1998