Publications des agents du Cirad

Cirad

Assembler la diversité des modèles classiques et " deep learning " pour développer un pipeline de calibration SPIR performant et générique

Cornet D., Desfontaines L., Cormier F., Marie-Magdeleine C., Arnau G., Meghar K., Davrieux F., Beurier G.. 2019. In : Livret des résumés des 20èmes Rencontres HélioSPIR. Montpellier : HélioSPIR, p. 15-16. Rencontres HélioSPIR. 20, 2019-10-14/2019-10-15, Montpellier (France).

La calibration d'un nouveau modèle de prédiction basé sur des spectres proche infrarouge, requiert une bonne dose de savoir expert et beaucoup de patience. En effet la grande diversité de prétraitements des spectres et des modèles de calibration offre un nombre très élevé de combinaisons à tester. Et même si le savoir expert peut aider à orienter les choix de combinaisons, l'identification du meilleur modèle reste très empirique et repose sur la comparaison d'un grand nombre de tentative. Traditionnellement, la construction des modèles et leur comparaison est réalisée manuellement par des experts. Cependant, la démocratisation des spectromètres et leur vulgarisation amène un nombre grandissant d'utilisateurs provenant de disciplines souvent éloignée de la chimiométrie (e.g. améliorateur, agronome). Leur objectif n'est pas toujours d'identifier le meilleur modèle mais bien de construire, sans savoir expert et avec un minimum d'investissement en temps, un modèle prédictif remplissant une exigence de performance connue préalablement. Dans ce contexte particulier, et afin de tirer le meilleur parti des avancées récentes en science des données et en capacités de calcul, cette communication présente les arguments théoriques et méthodologiques justifiant la construction d'un pipeline de calibration performant mais surtout suffisamment générique pour s'appliquer à une grande diversité d'analytes, de spectromètres, de taille de jeux de données et de produits. Le pipeline doit permettre de combiner les avantages des approches traditionnelles et les techniques modernes d'apprentissage profond. Ainsi les algorithmes spatio-temporels dédiés à l'analyse de signaux 2D et 3D seront utilisés afin de mieux intégrer les informations de position des spectres. En outre, les améliorations apportées aux algorithmes de recherche heuristique offrent la possibilité d'étudier un plus vaste espace de combinaisons de prétraitements des spectres, de type de modèles et d'hyper-paramètres. Afin de

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :