Use of a large-scale Triticeae expressed sequence tag resource to reveal gene expression profiles in hexaploid wheat (Triticum aestivum L.)

    loading  Checking for direct PDF access through Ovid

Abstract

The US Wheat Genome Project, funded by the National Science Foundation, developed the first large public Triticeae expressed sequence tag (EST) resource. Altogether, 116 272 ESTs were produced, comprising 100 674 5′ ESTs and 15 598 3′ ESTs. These ESTs were derived from 42 cDNA libraries, which were created from hexaploid bread wheat (Triticum aestivum L.) and its close relatives, including diploid wheat (T. monococcum L. and Aegilops speltoides L.), tetraploid wheat (T. turgidum L.), and rye (Secale cereale L.), using tissues collected from various stages of plant growth and development and under diverse regimes of abiotic and biotic stress treatments. ESTs were assembled into 18 876 contigs and 23 034 singletons, or 41 910 wheat unigenes. Over 90% of the contigs contained fewer than 10 EST members, implying that the ESTs represented a diverse selection of genes and that genes expressed at low and moderate to high levels were well sampled. Statistical methods were used to study the correlation of gene expression patterns, based on the ESTs clustered in the1536 contigs that contained at least 10 5′ EST members and thus representing the most abundant genes expressed in wheat. Analysis further identified genes in wheat that were significantly upregulated (p < 0.05) in tissues under various abiotic stresses when compared with control tissues. Though the function annotation cannot be assigned for many of these genes, it is likely that they play a role associated with the stress response. This study predicted the possible functionality for 4% of total wheat unigenes, which leaves the remaining 96% with their functional roles and expression patterns largely unknown. Nonetheless, the EST data generated in this project provide a diverse and rich source for gene discovery in wheat.

Le projet américain sur le génome du blé, financé par la « National Science Foundation », a développé la première grande collection publique d'EST chez les hordées. Au total, 116 272 EST ont été produits à partir de 42 banques d'ADNc du blé hexaploïde (Triticum aestivum L.) ou de ses proches parents dont des blés diploïdes (T. monococcum L. et Aegilops speltoides L.), tétraploïdes (T. turgidum L.) et le seigle (Secale cereale L.). Les ADNc étaient issus de tissus prélevés à divers stades de croissance ou de développement et soumis à différents stress biotiques ou abiotiques. Les EST ont été assemblés pour former 18 876 contigs et 23 034 singulons pour un total de 41 910 unigènes. Plus de 90% des contigs comprenaient moins de 10 EST, ce qui implique que les EST représentaient une vaste gamme de gènes et que les gènes modérément ou faiblement exprimés étaient bien échantillonnés. Des analyses statistiques ont été employées pour étudier la corrélation entre les motifs d'expression génique en s'appuyant sur les EST compris au sein des 1 536 contigs qui comptaient au moins 10 EST en 5′ (ceux qui représentent vraisemblablement les gènes le plus fortement exprimés chez le blé). Des analyses ont également permis d'identifier des gènes dont l'expression était significativement plus élevée (p < 0,05) au sein de tissus ayant subi divers stress par rapport aux tissus témoins. Bien qu'on ne puisse assigner aucune fonction à plusieurs de ces gènes, il est probable qu'ils jouent un rôle dans la réponse aux stress. Cette étude a permis de prédire une fonction pour 4% des unigènes chez le blé, ce qui laisse 96% de gènes pour lesquels la fonction demeure largement inconnue. Néanmoins, les données produites sur les EST au cours de ce travail constituent une vaste et riche ressource pour la découverte de gènes chez le blé.

Related Topics

    loading  Loading Related Articles