Indietro

ⓘ Expressed sequence tag




                                     

ⓘ Expressed sequence tag

Le Expressed Sequence Tags sono delle brevi sequenze di DNA che corrispondono alle regioni terminali di sequenze di cDNA più lunghe. Le molecole di cDNA sono ottenute dalla retrotrascrizione della popolazione di mRNA contenuti nelle cellule di un tessuto. In sostanza, le EST rappresentano porzioni di mRNA che permettono di individuare geni espressi tramite unanalisi sistematica del trascrittoma. Negli anni 90 questo approccio è stato utilizzato per scoprire nuovi geni e/o associare la loro espressione a specifici tipi cellulari. Una volta identificati geni di interesse, vengono svolte delle analisi più mirate per ottenere lintera sequenza del relativo cDNA. Questultimo può essere poi utilizzato come sonda in esperimenti come il northern blot o microarray. Il termine EST fu introdotto nel 1991 da Craig Venter.

Le EST non corrispondono necessariamente a frammenti di mRNA, ma possono appartenere anche ad altri RNA non codificanti per alcuna proteina ncRNA, come i miRNA, sebbene presenti in quantità molto basse. Le EST sono sequenze brevi in genere tra le 300 bp le 500 bp e piuttosto inaccurate circa un 2% di errore; ciò è dovuto al fatto che la reazione di sequenziamento viene di solito effettuata automaticamente in una sola direzione o comunque non-overlapping. Le EST sono dunque in genere più corte dei trascritti completi, perché sequenziare un intero mRNA è più costoso: questo però può produrre risultati errati nel caso vi siano forme di splicing alternativo non conosciute.

Le identificazioni di nuove EST procede rapidamente, ed ora le EST pubbliche disponibili ammontano a quasi 75 milioni GenBank, gennaio 2013, di cui oltre 8 milioni derivano da sequenze umane: tra queste sono comprese molte sequenze ridondanti o che mappano in punti diversi dello stesso mRNA, il che spiega lenorme abbondanza di EST in rapporto al numero di geni. In base alle conoscenze attuali 2008 del genoma umano, non vi è alcuna verifica sperimentale dellesistenza di un numero così alto di geni codificanti, infatti si stima che esistano tra 25.000 e 30.000 geni umani. Le banche dati dbEST e Unigene sono state sviluppate per raggruppare tutte le EST appartenenti allo stesso gene.