Publications des agents du Cirad

Cirad

Extraction de connaissances à partir de données textuelles : application à la découverte de règles de changement d'usage des sols

Valentin S., Crespin-Boucaud A., Aramayo G.Q., Peugeot C., Teisseire M.. 2025. Revue des Nouvelles Technologies de l'Information, RNTI-E-41 : p. 263-270. Extraction et Gestion des Connaissances (EGC), 2025-01-27/2025-01-31, Strasbourg (France).

DOI: 10.18167/DVN1/F0HLEH

Dans le cadre de la modélisation de dynamiques spatiales, les connaissances expertes permettent de définir des règles d'état ou de changement d'état. Ces connaissances contribuent à la cohérence des modèles mais sont fastidieuses à obtenir. Ce travail propose une approche d'extraction automatique de connaissances à partir de données textuelles, appliquée aux dynamiques de changement d'occupation et d'usage des sols en Afrique de l'Ouest. L'objectif principal est d'identifier des segments de texte pertinents à partir d'un corpus d'articles scientifiques en anglais, en mobilisant des méthodes de traitement automatique de la langue et d'apprentissage automatique. Nous comparons deux approches de classification supervisée avec une approche non supervisée reposant sur la proximité sémantique et montrons leur capacité à identifier l'information pertinente à partir de données non structurées.

Mots-clés : modélisation; classification; modèle; sol; méthode; afrique

Documents associés

Article (b-revue à comité de lecture)

Agents Cirad, auteurs de cette publication :