[問題] DNA 問題

看板Python作者 (這個帳號是掛網用)時間7年前 (2016/06/26 14:49), 編輯推噓1(106)
留言7則, 2人參與, 最新討論串1/1
我只有一個很簡單的問題想請教 XD 但我不知 python 有什麼 library 好用, 一直不想自己寫, 因為覺得會有 library 可以直接做掉 . 如果我有 1,2,3,4…9 , 把他想成 TGAC 的排序組合, 然後有多串 TGGAGGCAATGGCGGCCAGCA, GACTCCTCCTCCTCCTGCTCA... 那我要怎麼比出二串中所有一樣的 sequence 感謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.192.94.174 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1466923798.A.2DA.html

06/26 16:01, , 1F
seqeunce alignment 不簡單啊…我不懂是兩串還是多串
06/26 16:01, 1F

06/26 16:09, , 2F
就兩串而言,global 或 local alignment 用不同演算法
06/26 16:09, 2F

06/26 16:10, , 3F
分別是 Needleman-Wunsch 及 Smith–Waterman
06/26 16:10, 3F

06/26 16:17, , 4F
Python 的話可以用 skbio.alignment 底下的功能
06/26 16:17, 4F

06/26 16:27, , 5F
不考慮 gap 的話,內建 difflib.SequenceMatcher 即可
06/26 16:27, 5F

06/26 19:20, , 6F
如果有很多序列,跑 BLAST 比較快,然後再慢慢過濾
06/26 19:20, 6F

06/26 19:21, , 7F
BLAST 可以下載程式,在本地端跑
06/26 19:21, 7F
文章代碼(AID): #1NRtiMBQ (Python)