Publications des agents du Cirad

Cirad

Methods of data analysis

Perrier X., Flori A., Bonnot F.. 2003. In : Hamon Perla (ed.), Seguin Marc (ed.), Perrier Xavier (ed.), Glaszmann Jean-Christophe (ed.). Genetic diversity of cultivated tropical plants. Montpellier : CIRAD, p. 31-63.

Pour traiter de l'organisation évolutive, on peut suivre l'approche dite phénétique, qui décrit une organisation à partir de mesures objectives de dissemblance entre les unités et reporte à l'interprétation l'introduction d'hypothèses génétiques. Ces dissimilarités sont estimées globalement sur l'ensemble des caractères, c'est la multiplicité des caractères qui est censée donner une pertinence à ces mesures. L'objet de ce chapitre est de présenter divers aspects méthodologiques relevant de cette approche. Les données de base sont constituées d'un tableau d'unités taxonomiques décrites par les marqueurs de la diversité ou d'un empilement de tableaux lorsqu'un même ensemble d'unités est caractérisé par plusieurs séries de marqueurs de nature différente que l'on ne peut regrouper. Ce chapitre est composé de trois parties. La première concerne l'étape initiale de toute analyse qui est la définition d'une mesure de la ressemblance ou de la dissemblance entre individus. La deuxième partie traite des méthodes factorielles. Une matrice de dissimilarité entre individus deux à deux étant établie, son analyse a pour objet d'en rechercher une représentation simplifiée mais fidèle. Les bases des principales méthodes sont rappelées, en particulier les techniques d'analyse simultanée de plusieurs tableaux. La troisième partie s'intéresse aux représentations arborées. Diverses méthodes de création d'arbres sont présentées, ainsi que celles permettant de construire des arbres synthétiques à partir de plusieurs jeux de marqueurs. Les méthodes factorielles et les méthodes de représentation arborée constituent deux approches différentes de la représentation de la diversité. Les premières recherchent avant tout une représentation globale de la diversité, débarrassée des effets individuels. A l'inverse, les secondes tendent à représenter fidèlement les relations individuelles

Mots-clés : plante de culture tropicale; variation génétique; marqueur génétique; analyse de données; méthode statistique; traitement des données; taxonomie; classification; mathématique; marqueur biochimique

Documents associés

Chapitre d'ouvrage

Agents Cirad, auteurs de cette publication :