Publications des agents du Cirad

Cirad

Identificação e caracterização in silico de SNPs em café

Vidal R., Carazzolle M.F., Pot D., Pereira L.F.P., Mondego J.M.C., Pereira G.A.G.. 2008. In : Resumos do 54e Congresso Brasileiro de Genética, 16 a 19 de setembro de 2008, Brasil. Brasilia : SBG, p. 248-248. Congresso Brasileiro de Genética. 54, 2008-09-16/2008-09-19, Salvador (Brésil).

O sequenciamento do transcriptoma de três species de café: Coffea arabica (tetraploide), Coffea canephora (diploide) e Coffea racemosa (diploide) abriu muitas possibilidades para estudar caracteristicas fenotípicas de interesse agronômico entre as espécies. A espécie C. arabica é a mais cultivada e origina de um cruzamento relativamente recente entre Coffea eugenioides e Coffea canephora. A qualidade da bebida derivada de C. arabica é considerada excelente. A espécie C. canephora é mais bem adaptada ao clima equatorial quente e úmido e é cultivada freqüentemente em baixas ou médias altitudes. C. canephora é também mais resistente a várias doenças e pestes do que C. arabica e a qualidade da bebida é geralmente inferior. C. racemosa não é extensamente cultivada, tendo baixos índices de cafeína, tolerância elevada à seca e resistência a algumas doenças. O maior interesse desta espécie está relacionado ao seu florescimento, que acontece de modo precoce e concentrado em apenas três meses. Um pipeline computacional foi implementado para descoberta e caracterização em larga escala de SNPs utilizando os programas qualitySNP e KaKs_calculator, mysql para armazenamento dos dados e scripts php para a construção de interfaces para recuperação das informações. Primeiro foi feita uma clusterização do total de 275.117 ESTs das três espécies que resultou em 15.885 contigs. Para evitar contigs mal formados (possivelmente agrupamento de paralogos) foram excluidos os que tem quantidade de ESTs menores que 4 e maiores que 100. O qualitySNP utiliza 3 níveis de filtros chegando a encontrar no café um total de 45919 SNPs (0,53/100 bp) verdadeiro positivos. Para identificar os polimorfismos sinônimos ou não-sinônimos o qualitySNP utiliza o fasty para alinhar as sequencias com um banco de dados, corrigir frame-shifts e definir a orf. Os SNPs também são caracterizados como transversões ou transições e suas origens, se são intraespecificos ou interespecificos. Através da separação por haploti

Documents associés

Communication de congrès

Agents Cirad, auteurs de cette publication :