[問題] 相關係數與Fisher transformation

看板Statistics作者 (TOMCHC)時間12年前 (2014/01/02 21:08), 編輯推噓0(007)
留言7則, 1人參與, 最新討論串1/1
如果是跟統計軟體有關請重發文章 如果跟論文有關也煩請您重發文章 文章類別是為了幫助大家搜尋資料與解答,造成不便之處請見諒 不好意思 小弟我在做研究分析資料的時候遇到了一些問題 想了幾個方法都覺得有點怪怪的 現在我有一個二維的資料表 是人(N)--各基因表現量(G) 接著我把人分成兩組N1,N2 每一組當中分別去計算相關係數 計算方式是 取出k個g-g'(基因表現量pair)的pair在N1和N2中 分別計算出相關係數 也就是說 每一個相關係數是N1或N2個樣本對的相關係數,總共各有k個 然後對這k*2個相關係數做Fisher transformation ln((1+r)/(1-r)) 可以得到兩組常態分佈 N1~(μ1,δ1), N2~(μ2,δ2) 希望可以比較這兩組人當中是不是相關係數的分佈有差異 但是問題來了 這個過程當中牽涉到兩個參數 一個是N的大小,跟所取相關係數樣本有關 一個是k的大小,跟最後比較的樣本有關 要怎麼樣處理才對呢? 自己想過如下 1.直接做t-test,這樣子就無法把N弄進來 2.Fisher transformation告訴我們 做Fisher transformation後他的標準差是1/sqrt(N-3) 不過這裡做了k次 原本想針對他的標準差伸縮*sqrt(N-3) 但是這樣反而樣本多的標準差變大 好像又以點怪怪的 請問到底要怎麼做才有對呢? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 124.11.139.229

01/05 10:51, , 1F
k 個表現量是相同基因樣本的, 因此你所得到的這些樣本相關係
01/05 10:51, 1F

01/05 10:52, , 2F
數不能假設是獨立的. 但又難以估算它們的相關係數, 因此可能
01/05 10:52, 2F

01/05 10:53, , 3F
只好每一種表現量分別去做兩樣本 t 比較. 另外, 或許需要考
01/05 10:53, 3F

01/05 10:53, , 4F
慮 "整體誤差率" 的問題...
01/05 10:53, 4F

01/05 10:54, , 5F
兩獨立樣本相關係數之比較, 在群體是常態, 並且兩樣本數都
01/05 10:54, 5F

01/05 10:54, , 6F
夠大的情況下, 用 Fisher 的 z 轉換, 統計量是:
01/05 10:54, 6F

01/05 10:55, , 7F
z = (z1-z2)/√{1/(n1-3)+1/(n2-3)}
01/05 10:55, 7F
文章代碼(AID): #1InMInvz (Statistics)