[求救] 4C-sequencing 的定序資料如何處理?

看板Biotech作者 (翼天)時間8年前 (2016/07/07 17:01), 8年前編輯推噓8(8011)
留言19則, 4人參與, 最新討論串1/1
大家好, 請問版上有沒有做過 4C-seq 或其他高通量定序的前輩? 我手上有一筆 4C-seq 的數據, 它是原始的定序資料 (fastq), 我要怎麼把這筆資料和 genome 的序列做 alignment? 我上網搜尋軟體但是找到的軟體都不知道要怎麼使用, 我的作業系統是 Windows 7 x64, 希望版上有做過高通量定序資料分析的前輩能教我 要用什麼軟體分析定序的原始資料, 或是在 Wondows 作業系統下那些軟體要怎麼使用? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 120.126.39.94 ※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1467882065.A.1C4.html

07/07 17:13, , 1F
4C的重點不是alignment,要找到酵素切位和對應的序列
07/07 17:13, 1F
這個 4C 的實驗是我自己設計的, 所以我知道 viewpoint (VP)用的酵素和 primer 序列, 只是我現在要用 sequencing 的 raw data 去找 VP 跟哪些地方有 interaction, 所以我要把去掉 primer 序列後的 reads 序列去跟 genome 做 alignment, 找出有 interaction 的區域。 所以我想請問有沒有軟體能夠讓我把 genome 序列和 4C-seq 資列丟進去後, 自動幫我把 reads 放到 genome 上並做出在 paper 看到的那種圖。 像這種的: http://goo.gl/HpkZyl http://goo.gl/q2jJFL 感激不盡! ※ 編輯: xxtomnyxx (120.126.39.94), 07/07/2016 17:26:25

07/07 19:29, , 2F
所以你應該是先跑alignment 接下來才用另外的program
07/07 19:29, 2F

07/07 19:29, , 3F
來visualise
07/07 19:29, 3F

07/07 19:30, , 4F
paper應該有寫用什麼程式跑吧 一般都要用cluster跑
07/07 19:30, 4F

07/07 19:30, , 5F
用pc大概一個run要跑兩個禮拜
07/07 19:30, 5F

07/07 19:33, , 6F
版上esh前輩有出一本入門書不貴 值得投資
07/07 19:33, 6F

07/07 22:50, , 7F
一個run兩個禮拜 debug完再兩個禮拜... 超棒Q口Q
07/07 22:50, 7F
哇哩咧!為什麼會需要兩個星期啊 QAQ 難到要我自己用組合語言寫一個程式來 alignment 嗎...... ※ 編輯: xxtomnyxx (111.80.92.137), 07/07/2016 23:04:46

07/07 23:05, , 8F
上galaxy 找tool 幫你做
07/07 23:05, 8F

07/08 00:09, , 9F
看運氣囉 我上一批raw要給美國合作單位用 掛ftp給他們載了
07/08 00:09, 9F

07/08 00:09, , 10F
半天..囧
07/08 00:09, 10F

07/09 16:56, , 11F
你如果可以用assembly寫出打敗各家高階的程式還真是
07/09 16:56, 11F

07/09 16:56, , 12F
造福大家!!!
07/09 16:56, 12F

07/09 16:57, , 13F
總之也就是把每一條read拿去blast整個genome嘛
07/09 16:57, 13F
所以在 PC 上真的沒救了嘛 QAQ 個人是覺得這種分析軟體真的得用組語寫, 看過 C++ 或其它物件導向語言編譯成組語後的樣子, 也難怪 PC 上的程式有夠沒效率.... 只是不管我怎麼算, 這程式都會把記憶體塞爆啊! 光 mouse genome 塞進去就快 3G 了...... ※ 編輯: xxtomnyxx (114.44.24.77), 07/10/2016 00:19:05

07/10 02:26, , 14F
上amazon 上面找個aligner instance,要不去找galaxy
07/10 02:26, 14F

07/10 02:29, , 15F
很多aligner早已用過assembly最佳化過,要做分析就先看看
07/10 02:29, 15F

07/10 02:30, , 16F
領域裡面有什麼工具早可以用了,不需要重新發明輪胎
07/10 02:30, 16F

07/10 02:32, , 17F
也不想PC在分析基因體序列資料能有多大的用途
07/10 02:32, 17F

07/10 02:49, , 18F
如果不是de novo 有模板的還有救...不過你ˊ作4c
07/10 02:49, 18F

07/14 04:43, , 19F
所以我們都借cluster其實是借記憶體啊XD
07/14 04:43, 19F
文章代碼(AID): #1NVXfH74 (Biotech)