Re: [求救] 關於minor-allele frequency (MAF)
※ 引述《x9060000456》之銘言:
: [2,] 2 1 0 0 1 0
: [3,] 2 2 0 0 2 0
: [4,] 1 2 0 0 2 0
: [5,] 2 1 0 0 2 0
: [6,] 2 2 0 0 2 0
: gene資料形式是以copy number呈現,
: 想請問各位大大,分析的軟體是R software,
: 為什麼在很多packages裡MAF的計算,是colMeans(genodata)/2 來計算MAF?
: 也就是對每一個column做平均在除二,google找不到相關解釋,謝謝各位大能大神!
HI 我拿rs671 南方華人獨有的酒精代謝缺失作為例子
參考資料:dbSNP
http://imgur.com/a/a1sRB
參考資料:Taiwan biobank
http://imgur.com/a/KwUMn
簡單來說: 人有兩個allel 所以除二
這邊以Taiwan bank為例
Ref:G, Alt:A
總共987個台灣人,帶G/A的人數384, 帶A/A的人數有76
A allel 出現的次數是384+76*2=536
987台灣人有987*2個allel
所以A出現的比例是536/(987*2)[ 536/987<-colMeans(genodata) ]
照你的公式算 就會得到上面的結果
所以看台灣biobank整理的資料就清楚了
小知識: 台灣人的A MAF達兩成
很多人喝酒會臉紅是因為很多人先天代謝甲醛[毒]的能力差
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.146.53.14
※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1475511542.A.2B7.html
※ 編輯: lelojack (122.146.53.14), 10/04/2016 00:28:02
推
10/04 08:54, , 1F
10/04 08:54, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):