Publications des agents du Cirad

Cirad

Processus de veille et classification automatique de données textuelles

Roche M.. 2021. In : Séminaire Text Mining et Veille Sanitaire. s.l. : IMOTEP, 1 p.. Séminaire Text Mining et Veille Sanitaire pour les plateformes d'épidémiosurveillance - IMOTEP, 2021-10-20/2021-10-21, s.l. (France).

L'analyse des masses de données textuelles dans un contexte One Health (une seule santé) nécessite l'utilisation de méthodes mêlant harmonieusement différentes disciplines comme l'informatique, la linguistique ou les statistiques. L'ensemble de ces méthodes utiles pour traiter de telles données, souvent hétérogènes, forme le socle de la Science des Données Textuelles. Dans ce cadre, les approches de fouille de textes permettent de découvrir des connaissances utiles pour des experts en santé animale et végétale. Cet exposé présentera les fondements des approches (méthodes sac-de-mots, analyse morpho-syntaxique, pondérations statistiques, algorithmes de fouille de textes, etc.) et leur mise en oeuvre à travers l'utilisation de différents outils et méthodologies dans un contexte One Health. Cet exposé se concentrera sur les tâches de classification automatique de données textuelles en discutant des avantages, limites et enjeux scientifiques pour des travaux en veille sanitaire.

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :