TigrAssembler是用于將大批量的霰彈DNA片斷組裝成一致性序列的工具,它是由TIGR(TheInstituteofGenomeResearch)中心研發(fā)而成,已成功組裝了HaemophilusinfluenzaeandMycoplasmagenitalium等全基因組序列。TigrAssembler工作步驟如下:(1)對所有的數(shù)據(jù)進(jìn)行快速初步...[繼續(xù)閱讀]
海量資源,盡在掌握
TigrAssembler是用于將大批量的霰彈DNA片斷組裝成一致性序列的工具,它是由TIGR(TheInstituteofGenomeResearch)中心研發(fā)而成,已成功組裝了HaemophilusinfluenzaeandMycoplasmagenitalium等全基因組序列。TigrAssembler工作步驟如下:(1)對所有的數(shù)據(jù)進(jìn)行快速初步...[繼續(xù)閱讀]
StadenPackage是一個用于測序項目管理的整合軟件包,它包括了組裝、突變檢測、序列分析、序列峰圖及對reads文件操縱等功能。軟件包中的gap4是序列組裝的程序,這個程序包括了所有組裝所含有的工具,同時又具有許多自己的特點和友好...[繼續(xù)閱讀]
通過以上的介紹,我們知道各種不同的組裝軟件都有自己的特點,讀者可以根據(jù)自己的條件來做出相應(yīng)的選擇。一般可以先選用幾個軟件分析,再對結(jié)果進(jìn)行比較和檢查,另外,也可以通過注釋結(jié)果來進(jìn)行檢查。表4.1列出了所介紹軟件的比...[繼續(xù)閱讀]
4.3.1.1錯拼錯拼指的是本不該拼接在一起的EST拼接到了一起。造成錯拼的原因主要有:(1)3′端EST序列的polyA的尾巴存在,使本不相關(guān)的EST序列拼接在一起;(2)鑲嵌克隆read的存在,連接了兩條(或多條)本不相關(guān)的EST;(3)基因家族中序列相似性...[繼續(xù)閱讀]
對于上述EST聚類所出現(xiàn)的問題,一般可以通過以下幾種方法來進(jìn)行檢查和處理:(1)調(diào)整拼接參數(shù),如對于錯拼中的polyA的情況,可以將比對參數(shù)調(diào)得更加嚴(yán)格一些,從而區(qū)分開這些polyA的連接;而對于EST末端質(zhì)量較低而造成的漏拼,則需要將參...[繼續(xù)閱讀]
1.AdamsMD,KerlavageAR,FleischmannRDetal.Initialassessmentofhumangenediversityandexpressionpatternsbasedupon83millionnucleotidesofcDNAsequence.Nature,1995,377(6547Suppl):173~1742.HuangX,MadanA.CAP3:ADNAsequenceassemblyprogram.GenomeRes,1999,9(9):868~8773.P...[繼續(xù)閱讀]
對隨機挑選的cDNA文庫克隆進(jìn)行一次性末端測序,得到的EST數(shù)據(jù)經(jīng)過聚類和拼接形成了惟一序列(uniquesequences),它們包括重疊群(contigs)和單一序列(singlets)。根據(jù)同源序列可能具有相似功能,對這些未知的惟一序列進(jìn)行分析,推測它們代表的...[繼續(xù)閱讀]
BLAST家族包含的成員很多,提供各種不同需要的比對分析。這里主要介紹該家族中最重要也是最常用的五個成員blastx、blastn、blastp、tblastn、tblastx,可以進(jìn)行核苷酸和氨基酸序列任意組合的查詢。blastx:核苷酸序列到蛋白質(zhì)數(shù)據(jù)庫中搜索...[繼續(xù)閱讀]
網(wǎng)上運行blastx接受兩種數(shù)據(jù)提交方式,一是序列方式,直接拷貝粘貼純序列或者是FASTA格式的序列,二是直接填入NCBI的GI號或者AC號。這里采用上一章的拼接結(jié)果序列Contig17為例介紹運行步驟。首先訪問NCBI的BLAST主界面,點擊blastx,進(jìn)入序列...[繼續(xù)閱讀]
blastx搜索結(jié)果中閾值較低的或者沒能找到同源蛋白序列的惟一序列,可以進(jìn)一步利用blastn比較核苷酸序列和核苷酸數(shù)據(jù)庫,在核苷酸水平上搜索同源的序列。blastn的步驟與blastx的步驟基本一致,參數(shù)選擇也基本類似,不同之處是前者搜索...[繼續(xù)閱讀]