Publications des agents du Cirad

Cirad

Comment prendre en compte les spécificités de "l'écriture SMS" pour l'analyse de sentiments ?

Khiari W., Bouhafs Hafsia A., Roche M.. 2016. In : Actes des Journées internationales d'Analyse statistique des Données Textuelles JADT 2016. Nice : CNRS, 12 p.. Journées internationales d'Analyse statistique des Données Textuelles (JADT 2016). 13, 2016-06-07/2016-06-10, Nice (France).

Avec la croissance explosive des données textuelles issues des médias sociaux (forums, blogs et réseaux sociaux), l'exploitation de ces nouvelles sources d'information est devenue cruciale. Nos travaux se concentrent sur l'analyse des sentiments dans ce contexte des médias sociaux. Pour identifier des sentiments issus des messages (par exemple, tweets, SMS), des techniques originales de fouille de textes doivent être proposées. Cet article présente une nouvelle méthode qui intègre les connaissances sémantiques et lexicales pour l'analyse des sentiments. L'approche proposée donne un poids important aux "mots de sentiment" pour une tâche de classification. Notre étude compare deux corpus (88milSMS et DEFT'2015) afin de mettre en évidence les caractéristiques spécifiques des données SMS dans le contexte des médias sociaux.

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :