Publications des agents du Cirad

Cirad

Chado Controller a database monitor for confidentiality, quality and tracking of genomic annotations

Guignon V., Droc G., Poiron C., Lengellé J., Garsmeur O., Baurens F.C., Bocs S.. 2010. In : Journées ouvertes biologie informatique mathématique (JOBIM), Montpellier, France, 07-09 septembre 2010. s.l. : s.n., 1 p.. Journées ouvertes biologie informatique mathématique, 2010-09-07/2010-09-09, Montpellier (France).

Dans le cadre du séquençage des génomes, divers systèmes d'annotation ont été développés tel que celui proposé par le projet international Generic Model Organism Database (GMOD). Le projet GNPAnnot a pour but de développer un système d'annotation communautaire (CAS) pour les plantes, les champignons et les insectes basé sur des composants GMOD. Le Chado Controller fait parti des apports du projet GNPAnnot qui complète le coeur du CAS GMOD: base de données Chado, navigateur de génome GBrowse et éditeur Apollo ou Artemis. Le Chado Controller qui permet de gérer la confidentialité, d'améliorer la qualité des annotations manuelles et de les tracer, comporte trois modules: la restriction des droits d'accès des utilisateurs aux "features", l'inspecteur et l'historique des annotations manuelles. Le module de restriction des droits d'accès permet non seulement de limiter l'accès d'un utilisateur à tout ou partie des données mais également de choisir son niveau d'accès (visualisation seulement ou modification). Pour améliorer la qualité des annotations, l'inspecteur emploie du vocabulaire contrôlé et facilite le travail de l'annotation manuelle en contrôlant le travail du curateur. Il rapporte les incohérence des annotations par rapport à des règles (e.g. structure incorrecte, propriété non ou mal renseignée) et met à jour automatiquement certains champs suite à l'enregistrement des modifications de l'annotateur (e.g. le nom de l'annotateur). Enfin, le module d'historique permet de garder une trace de toutes les modifications apportées aux annotations, quelque soit le type de "feature" (e.g. gène, élément transposable) modifiée et quelque soit l'éditeur utilisé. L'historique des annotations d'une "feature" peut être visualisé à l'aide d'une page Web. Le Chado Controller, destiné aux bases de données Chado (PostgreSQL), est principalement composé de scripts SQL embarqués dans la base, garantissant ainsi son contrôle global des données. Des parties secondaires du Chado Controller ont été intégrées aux outils GBrowse 1.70 (fenêtre de login, page d'historique) et Artemis (utilisation de l'inspecteur d'annotation). L'intégration de l'inspecteur à un logiciel comme Apollo est aussi simple que d'effectuer des requêtes SQL à partir de celui-ci. Enfin, le Chado Controller est rétro-compatible avec les outils existants et ses différents modules peuvent être activés ou désactivés indépendamment. Le Chado Controller du projet GNPAnnot est déjà utilisé sur six CAS installé sur la plate-forme South Green (plate-forme de bioinformatique montpelliéraine): sorgho, bananier, canne à sucre, palmier, cacaoyer et caféier. Il a déjà permis l'annotation manuelle de qualité, confidentiellement via le Web, de 964 gènes et de 479 éléments transposables (TE) qui peuvent être facilement exportée dans divers formats à l'aide d'un extracteur.

Mots-clés : système d'information; banque de données; génome; application des ordinateurs; séquencage

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :