Publications des agents du Cirad

Cirad

De l'huile de palme dans le lait : comment l'Union européenne renforce sa présence sur le marché laitier Ouest africain en vendant un succédané de poudre de lait

Corniaux C., Chatellier V., Dia D., Duteurtre G.. 2020. In : Actes Rencontres Recherches Ruminants 2020. Paris : INRAE, p. 289-293. 3R - Rencontres autour des recherches sur les ruminants. 25, 2020-12-02/2020-12-03, (France).

Le français du Burkina est marqué par le multilinguisme national. Dans l'objectif d'extraire automatiquement des néologismes sur des données textuelles, nous avons développé l'approche Extranéo. Celle-ci intègre des outils de Traitement automatique du langage naturel (TALN) pour détecter les néologismes formels et leurs contextes d'utilisation. Extranéo combine un étiqueteur morphosyntaxique et un lexique flexionnel pour identifier les néologismes candidats, validés ensuite manuellement. L'usage de patrons de glose permet enfin d'accéder aux contextes des néologismes validés. Dans cet article, quatre étiqueteurs morphosyntaxiques, cinq lexiques flexionnels et des marqueurs de glose sont évalués afin de détecter les plus performants. Les résultats montrent que sur les articles de journaux, l'étiqueteur TreeTagger obtient la plus forte F-mesure, 0.86 en matière d'étiquetage. Sur l'identification des néologismes candidats, les lexiques DELA et Morphalou obtiennent la Fmesure la plus élevée, 0.52. La mise en relief des contextes des néologismes validés révèle que le contexte définitoire détient la précision la plus élevée, à savoir 0.49, devant les contextes de dénomination (0.22) et d'équivalence (0.24).

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :