基因表達(dá)序列標(biāo)簽(ExpressedSequenceTag,EST)是從cDNA文庫中隨機(jī)挑取單克隆進(jìn)行測序,所獲得的序列片段,序列長度一般約為60-500bp。為能較快速地發(fā)現(xiàn)新基因,早在20世紀(jì)80年代,有人曾提出對(duì)cDNA序列進(jìn)行大規(guī)模測序,但對(duì)此想法一直存在爭論...[繼續(xù)閱讀]
海量資源,盡在掌握
基因表達(dá)序列標(biāo)簽(ExpressedSequenceTag,EST)是從cDNA文庫中隨機(jī)挑取單克隆進(jìn)行測序,所獲得的序列片段,序列長度一般約為60-500bp。為能較快速地發(fā)現(xiàn)新基因,早在20世紀(jì)80年代,有人曾提出對(duì)cDNA序列進(jìn)行大規(guī)模測序,但對(duì)此想法一直存在爭論...[繼續(xù)閱讀]
轉(zhuǎn)錄圖譜是指不同基因的轉(zhuǎn)錄產(chǎn)物在基因組上的分布位置。由于EST來源于生物體不同組織或同一組織不同發(fā)育時(shí)期的cDNA文庫,因此,通過對(duì)EST數(shù)據(jù)進(jìn)行分析整理,可以繪制不同的轉(zhuǎn)錄圖譜。通過對(duì)這些轉(zhuǎn)錄圖譜的比較,有可能發(fā)現(xiàn)組織間...[繼續(xù)閱讀]
由于各數(shù)據(jù)庫中EST的數(shù)目遠(yuǎn)比其他的核苷酸序列多,因而利用EST數(shù)據(jù)庫搜尋新基因已成為基因識(shí)別的重要手段。通過在數(shù)據(jù)庫中對(duì)EST序列進(jìn)行比對(duì)(詳見第5章),可以識(shí)別同一物種中基因家族的新成員(paraloggenes),在不同物種間功能相同的...[繼續(xù)閱讀]
獲得全長cDNA克隆(full-lengthcDNA)是進(jìn)行基因表達(dá)和功能研究的前提條件。在cDNA文庫構(gòu)建過程中許多基因(尤其是大基因)cDNA都缺少5′端的序列信息。因此,通過隨機(jī)測序獲得全長cDNA十分費(fèi)時(shí)耗力。EST數(shù)據(jù)庫中存在著大量同一基因的EST序...[繼續(xù)閱讀]
當(dāng)一個(gè)物種的全基因組測序完成后,首要的工作就是對(duì)其基因組中所包含的全部基因進(jìn)行預(yù)測。由于不同物種在堿基組成、重復(fù)序列、基因結(jié)構(gòu)等方面存在較大的差異,迄今的基因預(yù)測軟件不可能對(duì)所有的物種都達(dá)到很高的準(zhǔn)確度。因...[繼續(xù)閱讀]
單核苷酸多態(tài)性(SingleNucleotidePolymorphism,SNP)是基因組變異量最豐富的一種形式,也是對(duì)復(fù)雜遺傳性狀進(jìn)行定位的重要源泉。同一物種不同個(gè)體、不同組織、不同發(fā)育階段和生理狀況下的EST的數(shù)據(jù)來源于全世界各實(shí)驗(yàn)室。通過對(duì)冗余的...[繼續(xù)閱讀]
基因表達(dá)譜是反映生物個(gè)體在特定器官、組織或某一特定發(fā)育、生理階段細(xì)胞中所有基因表達(dá)水平的圖譜,可用來比較不同組織或生理狀況下的基因表達(dá)水平差異,發(fā)現(xiàn)與其特定生理功能相關(guān)的基因,通過表達(dá)聚類推測未知基因功能。...[繼續(xù)閱讀]
cDNA文庫構(gòu)建可選擇非標(biāo)準(zhǔn)化或標(biāo)準(zhǔn)化。非標(biāo)準(zhǔn)化cDNA文庫(unnormalizedcDNAlibrary)是指未對(duì)建庫所用的組織mRNA進(jìn)行任何預(yù)處理而直接構(gòu)建的cDNA文庫,它反映了組織中所有基因的表達(dá)水平,適于基因表達(dá)譜的構(gòu)建;但由于文庫中存在高豐度表達(dá)...[繼續(xù)閱讀]
根據(jù)不同的實(shí)驗(yàn)?zāi)康?可選擇5′端,3′端或兩端測序:1.3.2.15′端測序大部分EST計(jì)劃都是選用5′端進(jìn)行測序的。cDNA的5′端含有編碼區(qū)信息,全長cDNA還含有5′非翻譯區(qū)的調(diào)控信息。用5′端測序的EST在尋找新基因或研究基因差異表達(dá)時(shí)能...[繼續(xù)閱讀]
為了減少EST數(shù)據(jù)中的低質(zhì)量和贗象序列(artifactualsequences),以盡可能避免后續(xù)分析中的錯(cuò)誤。EST序列需作如下前處理:(1)去除測序反應(yīng)不成功的低質(zhì)量序列。(2)屏蔽不屬于表達(dá)基因的贗象序列,如構(gòu)建文庫所使用的載體序列、重復(fù)序列和...[繼續(xù)閱讀]