Le Docteur Tanaka-Ishii, du laboratoire ETL à Tsukuba (Electrotechnical Laboratory), a travaillé sur la construction de graphes de co-occurence entre mots, afin d'obtenir une représentation sous forme de graphes des concepts représentés par les mots. Cette approche a été utilisée dans le cadre de l'étude de corpus multi-lingues non alignés. En effet, en utilisant un dictionnaire bilingue, et les graphes de co-occurence obtenus avec deux corpus des deux langues considérées, il est possible de rechercher une fonction reliant les deux graphes; cette fonction peut ensuite être utilisée pour la désambiguation des mots nécessaire à la traduction d'une langue à l'autre.
La structure créée dans ce cadre est de nouveau un graphe, mais construit automatiquement à partir d'un corpus. De même que pour le graphe d'EDR, il est supposé représenter des relations valables quelle que soit la langue étudiée.