[問題] 請教 SAM 的計算過程

看板BioMedInfo作者 (綠色蘇打心)時間14年前 (2010/01/05 21:16), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
自問自答好了 算是對板上的貢獻 有錯請鞭 ------------------------- Q1. So的計算 (就是那個 shrinkage 的 constant) paper上說是用 "window slide" 的方式 讓 d(i) 的變異係數最小化 我是看到有個說法是 "variance of 90th percentage" 不知道對不對? ----------------------------------------------------- A1 : 約 85~95th percentage 的 probeset 之變異數 R 的 package "siggenes" 有時候是定 0 然後把變異數太低的 probeset刪除 (in my case , 3千 / 5萬) -------------------------------------------------------- 2. permutation 假設是 control 3片 , 實驗組 3片 究竟是下列何者? A. 整個資料矩陣隨機取6個數字 (可重覆取用) B. 整個資料矩陣隨機取6個數字 (不可重覆) C. 在特定的基因向量 i , 隨機取6個數字 (可重覆取用) #每個向量i內都有6個 D. 在特定的基因向量 i , 隨機取6個數字 (不可重覆) 數字 ------------------------------------------------------ A2 : 假設實驗控制各4組 sample column 共 8 條 以 columns 為單位做 permutation 理想次數 , C8取4 , 定為 A 次 此處雖然已滿足做 permutation 檢定的基礎 但無法估計 est-FDR 所以 1. permutation 矩陣 , 每條 db(i) column 都 Rank 2. d(i) 本身 Rank 以上兩件事合稱為 ordered statistic 之後就是 d(i) - de(i) = delta 在滿足以上條件後 A 可下修為 B B 我認為大約要取 0.75*A 原始 paper 用較精細的 balance permutation, 取36次 , 約為70的一半 所以正常的 permutation , 我認為取 0.75A 是比較可行 然而若電腦夠好 , 取 B = 10000次 無妨 ------------------------------------------------------------------- 3. 還有 B (permutation次數) SAM 的 paper 在 4片 V.S. 4片 的實驗 取 36 次 我猜是 C4取2 * C4取2 所以 6片 V.S. 6片 應該是 C6取3 * C6取3 嗎? -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.239.247 ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:18) ※ 編輯: gsuper 來自: 140.113.239.247 (01/05 21:20) ※ 編輯: gsuper 來自: 140.113.239.247 (01/16 20:05)
文章代碼(AID): #1BGpkvzX (BioMedInfo)