Publications des agents du Cirad

Cirad

Spatial Textual Representation (STR) ou comment représenter la spatialité des données textuelles

Fize J., Roche M., Teisseire M.. 2017. In : Spatial Analysis and GEOmatics. Rouen : Université de Rouen Normandie, 15 p.. SAGEO 2017, 2017-11-06/2017-11-09, Rouen (France).

DOI: 10.18167/DVN1/JLXBLA

De nos jours, la majorité des systèmes de recherche d'information (RI) basent leurs algorithmes de recherche et d'indexation de document sur leur dimension thématique. Dans le cadre de l'étude de la mise en correspondance de données textuelles hétérogènes, nous proposons une approche permettant d'exploiter la dimension spatiale des données textuelles à travers une structure appelée STR ou Spatial Textual Representation. STR est une structure de graphe qui permet de représenter la configuration spatiale d'un document à l'aide d'informations du texte et de sources externes (gazetier). Pour créer ces graphes, nous extrayons tout d'abord les entités spatiales. Puis, nous relions les entités spatiales selon différentes relations (adjacence, inclusion, .. .). Enfin, nous évaluons plusieurs mesures de similarités, propres aux graphes, sur la structure proposée. Les expérimentations sont menées sur 3 corpus distincts.

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :