[轉錄] 生物資訊分析
《生物資訊》
生物資訊(Bioinformatics)概論(七)
莊順淑
(文續第1925期第196頁)
(二) 生物資訊工具
EBI的工具箱提供生物資訊領域的各種工具。在此將工具依功能分類,分別介紹於
下:
1.相似度比對與相似性搜尋
序列同質性與相似度比對工具Fasta(網址
http://www.ebi.ac.uk/fasta/index.html)、
Blast(網址http://www.ebi.ac.uk/blast/index.html)、MPsrch
(網址http://www.ebi.ac.uk/MPsrch)與Scanps(網址
http://www.ebi.ac.uk/scanps/)常用來做序列資料庫的比對。
以下為目前EBI所提供的工具:
(1) DNA與蛋白質搜尋
Fasta:使用Fasta比對核酸與蛋白質資料庫的序列相似度與同
質性搜尋,網址http://www.ebi.ac.uk/fasta33。
‧WU-Blast2:Washington University blast2(blast 2.0有
間斷(Gap)),網址http://www.ebi.ac.uk/blast2。
‧NCBI-Blast2:NCBI blast2(blastall)程式,網址
http://www.ebi.ac.uk/blastall。
‧Blast2 EVEC:European blast2 Vector Searches,確認序
列是否有載體(Vector)的污染,網址
http://www.ebi.ac.uk/blastall/vectors.html。
‧Genome and Proteome Fasta server:完整基因體與蛋白質
體Fasta伺服器,網址http://www.ebi.ac.uk/fasta33/genomes.html。
(2) 精確的蛋白質搜尋
‧MPsrch:網址http://www.ebi.ac.uk/MPsrch。
‧Anedabio:為以前的Edinburgh生物計算系統,執行Smith and
Waterman演算法,網址http://www.anedabio.com/index.html。
‧Scanps2.3:新工具,Scanps 2.3版,執行Smith & Waterman
演算法搜尋蛋白質資料庫,網址http://www.ebi.ac.uk/scanps/。
‧Blitz:是一個以email為基礎的資料庫搜尋服務,使用兩種
方法MPsrch與Scanps,網址http://www.ebi.ac.uk/searches/blitz.html。
(3) 特殊DNA搜尋
‧Parasites blast:寄生蟲基因體
(http://www.ebi.ac.uk/parasites/parasite-genome.html)
Blast伺服器,網址http://www.ebi.ac.uk/blast2/parasites.html。
‧EGI blast:以EuroGeneIndexes為基礎之EST叢集與比對的
Blast伺服器,網址http://www.ebi.ac.uk/EGIblast2/。
‧SNP-Fasta server:歐洲SNP資料庫HGBASE(網址
http://hgvbase.cgb.ki.se/)的Fasta搜尋,網址
http://www.ebi.ac.uk/snpfasta3。
2. 蛋白質功能分析
這部分提供使用各種方法與資料庫決定蛋白質功能的工具。其中
最重要的是InterProscan(http://www.ebi.ac.uk/interpro/scan.html),
它使用單一介面對照各種搜尋方法。以下提供蛋白質功能分析工
具的連結與簡介:
‧CluSTr Search:用Accession numbers搜尋Swiss-Prot與TrEMBL
資料庫,網址http://www.ebi.ac.uk/clustr/search.html。
‧InterProScan:InterPro資料庫的蛋白質序列搜尋,網址
http://www.ebi.ac.uk/interpro/scan.html。
‧FingerPRINTScan:蛋白質指紋搜尋,網址
http://www.ebi.ac.uk/printsscan/。
‧ppsearch:蛋白質Motifs搜尋,網址
http://www.ebi.ac.uk/ppsearch/。
‧GeneQuiz:生物序列的高度自動化分析,網址
http://jura.ebi.ac.uk:8765/ext-genequiz/。
‧Pratt:發掘蛋白質Motif,網址
http://www.ebi.ac.uk/pratt/。
‧Radar:蛋白質重覆(Repeat)序列偵測,網址
http://www.ebi.ac.uk/Radar/index.html。
‧InterProScan:使用蛋白質序列查詢InterPro資料庫,並且預
測蛋白質功能,網址http://www.ebi.ac.uk/interpro/scan.html。
3. 結構分析
決定蛋白質的二級與三級結構對於研究蛋白質功能是有決定性的
影響。使用者將可在這裡找到各種結構分析工具,例如DALI(網
址http://www.ebi.ac.uk/dali)。以下面列出目前EBI提供的結
構分析工具:
‧SRS3D:序列結構、從蛋白質一級/二級/三級資料庫所獲得的
特性資料之取得與視覺化工具,網址http://srs3d.ebi.ac.uk/。
‧DALI:比較蛋白質3-D結構,網址http://www.ebi.ac.uk/dali。
‧FSSP:摺疊分類與結構比對,網址http://www.ebi.ac.uk/dali/fssp。
‧MaxSprout:從C(alpha)軌跡重組3-D座標,網址
http://www.ebi.ac.uk/maxsprout。
‧PQS:查詢蛋白質四級結構,網址http://pqs.ebi.ac.uk/。
‧PQS-Quick:從PDB ID快速取得蛋白質四級結構資訊,網址
http://pqs.ebi.ac.uk/pqs-quick.html。
‧MSDchem:配位體(Ligand)資料庫,在PDB中所有化學組成的
完整化學描述,網址http://www.ebi.ac.uk/msd-srv/chempdb。
‧MSDfold:二級結構配對,比較蛋白質鏈/結構,並且尋找PDB
檔案或SCOP Domain中相似的結構,網址
http://www.ebi.ac.uk/msd-srv/ssm。
‧MSDlite:提供查詢PDB的簡易方法,網址
http://www.ebi.ac.uk/msd-srv/msdlite/index.html。
‧MSDpro:為Java applet工具,使使用者可建構MSD複雜的相關
查詢,而不需瞭解資料庫中資料的配置方式或語言。這些查詢
是用SQL語法寫成,網址http://www.ebi.ac.uk/msd-srv/msdpro/index.html。
‧EMsearch:查詢電子顯微鏡位置的查詢工具,網址
http://www.ebi.ac.uk/msd-srv/emsearch/index.html)
‧MSDsite:以配位基(Ligand)(例如:ATP)或活性區(例如:
CYS CYS CYS CYS)資訊查詢活性區資料庫的工具,網址
http://www.ebi.ac.uk/msd-srv/msdsite/index.jsp。
‧MSDtarget:目標資訊伺服器為一個搜尋與追蹤結構基因體目
標的搜尋工具。可用來搜尋公開的與未公開的SG與PDB資料庫,
網址http://www.ebi.ac.uk/msd-srv/msdtarget/SGT_index.html。
‧NMR Representatives:搜尋PDB中NMR解出的結構,網址
http://pqs.ebi.ac.uk/pqs-nmr.html。
‧Unpublished Reference Server:現存PDB的許多檔案包含許
多尚未發表的參考文獻。有時,PDB檔案已經過時(文獻已經
被發表),但是標題“To Be Published”仍然存在。PDB
Clean Up的部分目標就是更新這些參考文獻,並且達成這樣目
標的第一步就是將尚未發表的文獻移出至已發表文獻,網址
http://www.ebi.ac.uk/msd/services/unpubref.html。
‧Biotech:蛋白質結構的Biotech鑑定軟體,網址
http://biotech.ebi.ac.uk:8400/。
4.序列分析
序列分析包括使用各種生物資訊方法用以鑑定基因與轉譯成蛋白
質的生物功能與/或結構。這些工具之一Transeq(網址
http://www.ebi.ac.uk/emboss/transeq)可幫助決定DNA序列的
蛋白質轉譯區。ClustalW(網址http://www.ebi.ac.uk/clustalw)
被用來比對DNA與蛋白質序列,以解釋他們的關係與演化來源。以
下列出各種EBI目前提供的結構分析工具:
‧ClustalW:多重序列比對,網址http://www.ebi.ac.uk/clustalw。
‧Align:兩條序列Global與Local比對工具,網址
http://www.ebi.ac.uk/emboss/align(EMBOSS網址
http://www.emboss.org/)。
‧GeneMark:基因預測服務,網址http://www.ebi.ac.uk/genemark/。
‧GeneWise:蛋白質序列或蛋白質HMM與DNA序列比對,網址
http://www.ebi.ac.uk/Wise2/index.html。
‧Dna Block Aligner Form:假定在同一直線上時,兩條DNA序列
的比較,網址http://www.ebi.ac.uk/Wise2/dbaform.html。
‧PromoterWise:比對兩條DNA序列,允許倒置(Inversion)與
移位(Translocation),網址
http://www.ebi.ac.uk/Wise2/protmoterwise.html。
‧Mutation Checker:序列認可工具,網址
http://www.ebi.ac.uk/cgi-bin/mutations/check.cgi。
‧Genetic Code Viewer:觀察遺傳密碼相異性,網址
http://www.ebi.ac.uk/cgi-bin/mutations/trtables.cgi。
‧CpG Plot/CpGreport:找尋CpG Island與繪圖的工具,網址
http://www.ebi.ac.uk/emboss/cpgplot)(EMBOSS網址
http://www.emboss.org/)。
‧Transeq:DNA序列轉譯工具,網址http://www.ebi.ac.uk/emboss/transeq)
(EMBOSS網址:http://www.emboss.org/)
‧Reverse Translator:反向互補確認工具,網址
http://www.ebi.ac.uk/cgi-bin/mutations/tevtransl.cgi。
‧Pepstats/Pepwindow/Pepinfo:基本蛋白質序列分析的EMBOSS
程式,網址http://www.ebi.ac.uk/emboss/pepinfo(EMBOSS
網址:http://www.emboss.org/)。
‧SAPS:蛋白質序列統計工具,網址http://www.ebi.ac.uk/saps。
‧EMBOSS:針對分子生物社群需要所發展的免費公開分析軟體。
此軟體可允許各種格式的資料,並且可從網站取得序列資料,
網址http://www.ebi.ac.uk/emboss/index.html。EMBOSS官方
網址http://www.emboss.org。
5.各式工具
EBI已經發展許多有用的生物資訊相關工具,例如SRS(Sequence
Retreival System),可以用來瀏覽EBI各種生物序列與文獻資料
庫。以下所列為目EBI提供的各種工具:
‧SRS:Sequence Retrieval System為資料庫搜尋工具,網址
http://srs.ebi.ac.uk/。
‧Webin:提交與註解核酸序列至EMBL資料庫的工具,網址
http://www3.ebi.ac.uk/Services/webin/Sbm.cgi。
‧Webin-Align:提交與註解核酸及胺基酸多重序列比對至
EMBL資料庫的工具,網址
http://www.ebi.ac.uk/embl/Submission/alignment.html。
‧QuickGO:QuickGO為快速的Gene Ontology資料網路觀察工具,
網址http://www.ebi.ac.uk/ego/index.html。
‧Expression Profiler:群集、分析與視覺化基因表現與基因體
資料的工具,網址
http://www.ebi.ac.uk/microarray/ExpressionProfiler/ep.html。
‧Query ArrayExpress:搜尋ArrayExpress微陣列資料庫,網址
http://www.ebi.ac.uk/microarray/ArrayExpress/Queries/queries.html。
‧Protein Annotation Assistant:蛋白質註解工具,網址
http://www.ebi.ac.uk/paa。
‧Protein Colourer:將胺基酸序列加入色彩,網址
http://www.ebi.ac.uk/proteincol/index.html。
‧AppLab v1.0:CORBA-Java為基礎的應用程式Wrapper,網址
http://industry.ebi.ac.uk/applab/。
‧XEMBL:BSML或AGAVE XML格式的EMBL紀錄,網址
http://www.ebi.ac.uk/xembl。
‧Readseq:序列格式轉換工具,網址
http://www.ebi.ac.uk/cgi-bin/readseq.cgi。
‧WSDbfetch:WSDbfetch為執行Dbfetch的網路服務工具,為一個
一般資料庫檢索系統,目標是提供可用程式取得的序列檢索方
式。此涉及在SOAP伺服器上執行的服務,反應遠端使用者的需
求,網址http://www.ebi.ac.uk/Tools/webservices/index.html。
6.資料庫瀏覽與檢索
EBI提供許多瀏覽與檢索生物相關序列與文獻資料的工具。SRS
(Sequence Retrieval System)是其中最強大的資料瀏覽/檢索工
具之一。SRS提供快速、簡單、使用者易於學習使用的工具,可從
超過400種內部或公開資料庫取得大量不同的與不同性質的生命科
學資料。以下提供各種EBI提供的資料庫瀏覽與檢索工具:
‧SRS:序列檢索系統,可用來瀏覽EBI各種生物序列與文獻資料庫
的工具,網址http://srs.ebi.ac.uk。
‧SRS3D:SRS3D是一個使使用者快速且簡單的檢索/視覺化序列結
構與一級/二級/三級蛋白質資料庫特徵資料的整合環境,網址
http://srs3d.ebi.ac.uk/。
‧EMBL-SVA:MBL Sequence Version Archive伺服器是一個儲存
EMBL資料庫公開資料的儲存區,網址http://www.ebi.ac.uk/embl/sva/。
‧dbfetch:同時可檢索超過50個以上的現存生物資料庫工具,網
址http://www.ebi.ac.uk/cgi-bin/dbfetch。
‧emblfetch:同時可檢索超過50個以上的現存生物資料庫工具,
網址http://www.ebi.ac.uk/cgi-bin/emblfetch。
‧medlinefetch:可檢索MEDLINE文獻資料庫工具,網址
http://www.ebi.ac.uk/cgi-bin/medlinefetch。
‧WSDbfetch:WSDbfetch為執行Dbfetch的網路服務工具,為一個
一般資料庫檢索系統。目標是提供可用程式取得的序列檢索方式。
此涉及在SOAP伺服器上執行的服務,反應遠端使用者的需求,網
址http://www.ebi.ac.uk/Tools/webservices/index.html。
7.提交
提交新資料與更新資訊至公開資料庫,是建立與維持完整與最新
資料集的唯一與必須的必備要件,這使科學社群可以執行搜尋與
分析最新核酸與蛋白質序列、蛋白質結構座標與微陣列資料。下
面所列為提交資料至資料庫的一些提交工具。
(1)核酸與蛋白質序列提交
‧EMBL Nucleotide Sequences via WEBIN:提交DNA序列至
EMBL/GenBank/DDBJ的互動系統,網址
http://www.ebi.ac.uk/ebml/Submission/webin.html。
【Help - http://www.ebi.ac.uk/webin/webin_help.html】
‧EMBL Nucleotide Sequence Update Form:報告EMBL核酸序列
的更新與更正資訊,網址http://www.ebi.ac.uk/embl/webin/update.html。
【Help - http://www.ebi.ac.uk/embl/webin/update_help.html】
‧Information for submitters to EMBL Nucleotide Sequence
Database: EMBL-Bank的一般資訊,網址
http://www.ebi.ac.uk/embl/Documentation/information_for_submitters.html。
‧Swiss-Prot:提交資料至Swiss-Prot資料庫,網址
http://www.ebi.ac.uk/swissprot/Submissions/submission.html
‧Swiss-Prot Protein Sequence Update Form:更新或更正Swiss-Prot
資料的報告格式,網址http://www.expasy.org/sprot/sp_update_form.html。
‧Alignments via Webin-Align:序列比對的互動式提交工具,網址
http://www.ebi.ac.uk/embl/Submission/align_top.html。
【Help - http://www.ebi.ac.uk/webin-align/webinalign_help.html】
‧Sequin Software:Sequin資訊與求助,網址
http://www.ebi.ac.uk/Sequin/。
‧IMGT/HLA:IMGT/HLA資料提交,網址
http://www.ebi.ac.uk/imgt/hla/subs/submit.html。
【Help - http://www.ebi.ac.uk/imgt/hla/subs/sub_guide.html】
‧IMGT/LIGM:經由WEBIN提交IMGT/LIGM資料,網址
http://www.ebi.ac.uk/embl/Submission/webin.html。
【Help - http://scooby.dhcp.ebi.ac.uk/LOCAL_DEV/webin/webin_help.html】
‧Alternative Exon Database:提交資料至AEdb目前只提供給ASD-EC
協會會員,網址http://www.ebi.ac.uk/msd/Deposition/Autodep.html。
EBI希望在2003下半年可以公開給所有使用者使用。
(2) 結構資料提交
‧PDB-AutoDep:提交3-D結構至PDB,網址
http://www.ebi.ac.uk/msd/Deposition/Autodep.html;更多資
訊請參考網址http://www.ebi.ac.uk/msd/。
(3) 微陣列資料提交
‧MIAMExpress:提交微陣列資料至ArrayExpress資料庫,網址
http://www.ebi.ac.uk/miamexpress/。
【Help - http://www.ebi.ac.uk/miamexpress/help/index.html】
結論
EBI從1992年發展至今已經歷11年了,它所建立的生物資訊資料庫
與強大的生物資訊工具的確對於生物社群資料探索與分析有極大的
貢獻。然而,EBI今天的成就並不是僅僅由一個國家就可以達成的,
而是由歐洲許多國家共同努力的成果。他們無國界的合作模式與共
同為生物資訊領域貢獻的偉大理想,正是跨國合作的良好典範。
(註:本文資料參考來源為EBI(The European Bioinformatics
Institute)所提供之網站資料所整理而成,網址http://www.ebi.ac.uk/)。
出處:http://www.ascc.sinica.edu.tw/nl/92/1926/02.txt
----
小弟最近為分析所苦!
從辜狗大神那搜尋到此文章~應該對板上各位大哥大姐有所幫助!!^^
感謝這位作者辛苦整理
在此獻上最大的敬意!!
如果PO在此處不妥~再請告知!馬上砍文~
歡迎大家一同討論^^~
--
▃◣
◢ ◣ 吼~
◢ ◣
◢ ◣◣ ◣
◥ ▉≡ ◥▆◢
▄ ▄ ▃▄▂
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.127.29.80