[問題] NCBI中human genome的資料

看板Biotech作者時間16年前 (2009/05/01 19:20), 編輯推噓1(101)
留言2則, 2人參與, 最新討論串1/1
有兩個問題想請教版友 雖然說已經把人類genome解開了,不過我看ncbi的資料庫中還是有很多gap http://0rz.tw/PBdEq (chr1) 如果我要下載chr1的genome資料,是否把這邊所有的都下載再拼在一起就好了? 還有個疑問點是,好多的gap都是50,000的長度,不知為何會這樣(怎麼做出來的)? 另外一個問題是,人類genome大約有多少是coding,多少是noncoding的部分 我用很保守的估算 30000條基因*長的嚇死人的每條2k 所以30k*2k/3*10^9 人類coding的部分最多佔20% 請問這樣合理嗎? PS:有看到佔1~1.5%的說法, 不過不知道這個估計值有沒有包含非a.a但有function的序列 以及有沒有把還沒有定序的gap考慮進去 請版友們指教^^ -- 37m﹡ -- ※ 發信站: 批踢踢實業坊(ptt.cc) -- ※ 編輯: adu 來自: 59.104.5.233 (05/01 19:21)

05/01 20:32, , 1F
30k*2k=2*3*10^7.....÷3*10^9= 2*10^-2= 2%
05/01 20:32, 1F

05/01 23:53, , 2F
?! 我算錯了 謝謝指正XD
05/01 23:53, 2F
文章代碼(AID): #19-jhW0W (Biotech)