Publications des agents du Cirad

Cirad

Rapport scientifique du Projet ISSA

Toulet A., Michel F., Tchechmedjiev A.. 2022. Montpellier : CIRAD-DG-DIST, 11 p..

Les services d'information scientifique et technique ont toujours été confrontés aux questions de gestion documentaire. Leur mission leur confère une responsabilité dans la conservation, la mise à disposition et la valorisation de ressources culturelles ou issues de la recherche. Dans cette optique, ce projet s'intéresse à l'indexation sémantique des publications dans une archive ouverte et à l'exploitation de cette indexation pour développer des services aux chercheurs et aux documentalistes dans une perspective de science ouverte. La méthodologie mise en oeuvre, adossée aux principes FAIR, se veut résolument générique : elle est exploitable par toute communauté adoptant ces mêmes principes au travers de métadonnées interopérables, en particulier dans le cadre de systèmes de gestion de ressources documentaires. L'objectif du projet est triple : (1) Fournir un pipeline générique, réutilisable et extensible pour l'analyse des documents d'une archive scientifique ouverte ; (2) Traduire les résultats en un index sémantique sous la forme d'un graphe de connaissances RDF ; (3) Développer des services innovants de recherche et de visualisation exploitant cet index. Les traitements font appel à diverses techniques d'intelligence artificielle : TALN, ingénierie des connaissances, web sémantique. Les métadonnées et le texte intégral des publications sont traités afin d'en extraire des descripteurs thématiques et des entités nommées . Pour exploiter au mieux la puissance du web sémantique, les descripteurs thématiques et les entités nommées sont liés à des référentiels sémantiques (bases de connaissance, ontologies, thésaurus) tels que Wikidata, DBpedia et GeoNames. Le graphe de connaissances résultant sert de clé de voûte au développement de services de recherche et de visualisation. Agritrop, l'archive ouverte des publications du Cirad, a servi de cas d'usage et de preuve de concept tout au long du projet.

Documents associés

Document technique

Agents Cirad, auteurs de cette publication :