[問題] 請教 SAM 的計算過程

看板BioMedInfo作者gsuper (綠色蘇打心)時間16年前 (2010/01/05 21:16)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/1

自問自答好了算是對板上的貢獻有錯請鞭 ------------------------- Q1. So的計算 (就是那個 shrinkage 的 constant) paper上說是用 "window slide" 的方式讓 d(i) 的變異係數最小化我是看到有個說法是 "variance of 90th percentage" 不知道對不對? ----------------------------------------------------- A1 : 約 85~95th percentage 的 probeset 之變異數 R 的 package "siggenes" 有時候是定 0 然後把變異數太低的 probeset刪除 (in my case , 3千 / 5萬) -------------------------------------------------------- 2. permutation 假設是 control 3片 , 實驗組 3片究竟是下列何者? A. 整個資料矩陣隨機取6個數字 (可重覆取用) B. 整個資料矩陣隨機取6個數字 (不可重覆) C. 在特定的基因向量 i , 隨機取6個數字 (可重覆取用) #每個向量i內都有6個 D. 在特定的基因向量 i , 隨機取6個數字 (不可重覆) 數字 ------------------------------------------------------ A2 : 假設實驗控制各4組 sample column 共 8 條以 columns 為單位做 permutation 理想次數 , C8取4 , 定為 A 次此處雖然已滿足做 permutation 檢定的基礎但無法估計 est-FDR 所以 1. permutation 矩陣 , 每條 db(i) column 都 Rank 2. d(i) 本身 Rank 以上兩件事合稱為 ordered statistic 之後就是 d(i) - de(i) = delta 在滿足以上條件後 A 可下修為 B B 我認為大約要取 0.75*A 原始 paper 用較精細的 balance permutation, 取36次 , 約為70的一半所以正常的 permutation , 我認為取 0.75A 是比較可行然而若電腦夠好 , 取 B = 10000次無妨 ------------------------------------------------------------------- 3. 還有 B (permutation次數) SAM 的 paper 在 4片 V.S. 4片的實驗取 36 次我猜是 C4取2 * C4取2 所以 6片 V.S. 6片應該是 C6取3 * C6取3 嗎? -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.239.247 ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:20) ※ 編輯: gsuper 來自: 140.113.239.247 (01/16 20:05)

‣ 返回看板[ BioMedInfo ] BIO

‣ 更多 gsuper 的文章

文章代碼(AID): #1BGpkvzX (BioMedInfo)