Publications des agents du Cirad

Cirad

Exploitation de l'hétérogénéité dans les données textuelles. Utilisation de données produites à Madagascar

Fize J., Roche M., Teisseire M.. 2019. Recherche d'information, Document et Web Sémantique, 2 (1) : 5 p..

Depuis plusieurs décennies, on observe une utilisation croissante des systèmes d'information, ce qui provoque une augmentation exponentielle des données textuelles. Bien que l'aspect volumétrique de ces données textuelles soit résolu, sa dimension hétérogène reste un défi pour la communauté scientifique. La maitrise de ces données hétérogènes offre de nombreuses opportunités par un accès à une information plus riche. Dans nos travaux, nous concevons un processus de mise en correspondance de données textuelles hétérogènes, basé sur leur spatialité. Dans cet article, nous présentons les résultats retournés par ce processus sur des données produites à Madagascar dans le cadre du projet BVLAC, dirigé par le CIRAD. En se basant sur un ensemble de 4 critères de qualité, nous obtenons de bonnes correspondances spatiales entre ces documents.

Mots-clés : informatique; géographie; fouille de données; madagascar; représentation graphique

Thématique : Documentation et information; Géographie

Documents associés

Article de revue

Agents Cirad, auteurs de cette publication :