Exact word matches in rice pseudomolecules

    loading  Checking for direct PDF access through Ovid

Abstract

Using pseudomolecules of assembled genomic sequence, we computed the frequencies of 6 to 24 bp oligonucleotide (oligo) “words” across the genome of rice (Oryza sativa L. subsp. japonica). All oligos of 10 or fewer basepairs were repeated at least 12 times in the genome. The percentage of unique (non-repeated) oligos ranged from 0.1% for 12 bp oligos to 76.0% for 24 bp oligos. For three 200 kb regions, we annotated each nucleotide position with the genome-wide frequency of the 18 bp oligo starting at that position. These frequencies formed landscapes consisting of high- and low-frequency zones. Low-frequency zones contained occasional high-frequency spikes; these may represent footprints of RIM2 transposon activity. BLASTn searches of high-frequency non-SSR (simple sequence repeat) 18 bp oligos returned few sequences from species other than rice. These results demonstrate that, in rice, words are not randomly used between different regions within the same genome, and indicate that words that are frequently repeated within the rice genome tend to be unique to rice.

À l'aide de pseudomolécules de séquences génomiques assemblées, les auteurs ont calculé la fréquence de “mots” oligonucléotidiques de 6 à 24 pb au sein du génome du riz (Oryza sativa L. subsp japonica). Tous les oligos de 10 pb et moins étaient répétés au moins 12 fois dans le génome. La fraction d'oligos uniques (non-répétés) variait entre 0,1% pour les oligos de 12 pb et 76,0% pour les oligos de 24 pb. Au sein de 3 régions de 200 kb, les auteurs ont annoté chaque position nucléotidique avec la fréquence, à la grandeur du génome, de l'oligo de 18 pb débutant à cette position. Ces fréquences ont formé un paysage constitué de zones à haute fréquence et de zones à faible fréquence. Les zones à faible fréquence contenaient d'occasionnels pics à haute fréquence; ceux-ci représentent potentiellement les empreintes résultant de l'activité du transposon RIM2. Des fouilles BLASTn d'oligos à haute fréquence, mais non constitués de microsatellites, ont résulté en l'identification de peu de séquences ailleurs que chez le riz. Ces résultats montrent que, chez le riz, les mots ne sont pas utilisés aléatoirement au sein des différentes régions du génome et indiquent que les mots qui sont fréquemment rencontrés chez le riz sont uniques à ce génome. [Traduit par la Rédaction]

Related Topics

    loading  Loading Related Articles