Re: [問題] 晶片分析的小問題

看板BioMedInfo作者 (阿一)時間14年前 (2009/12/27 14:01), 編輯推噓1(101)
留言2則, 1人參與, 最新討論串4/4 (看更多)
※ 引述《gsuper (綠色蘇打心)》之銘言: : 在 affy 的 u133plus2 晶片 : 有 130 萬個 probe cells : 經過 preprocessing : 剩下 54675 個 probesets ^^^^^^^^^^^^^^^^^^^^^^^^^^恩... 這邊我不太清楚你的preprocessing 因為我平常在做的時候...只有import data -> normalization (RMA)就有54675個probe 然後probe QC以MAS5 generate出來的detection call當filter 取A/P+M+A <= 50% 大約剩個 23,XXX左右吧 : 平均每個基因有 2 個 probesets : 大致看了一下 range 為 1~7 個 probesets per gene : 如果 probesets 的結果衝突怎麼辦? : 用投票決定好像不是好方法 : 必竟每個 probeset 的份量都很重 , : 1:2 為顯著 , 2:1 為不顯著 : 實在太武斷了 probe跟gene之間的關係可以affy官方那邊看到 http://www.affymetrix.com/support/help/IVT_glossary/index.affx 另外我記得probe seq也可以查的到 如果有怪怪的 可以回去看一下那個probe是detect哪 : ---------------------------------------- : Q二 : : 我是用 double filter 做 Inference : FC > 1.5 , paired t < 0.05*2 / 54675 (不知道為什麼 , 不取FDR就有數百個顯著) : 因為我是 pair data : 且實驗目的只要找顯著大的 : : 請問 paired data 有必要做 SAM 或 Bayesian inference 嗎? : 我想 paired t 的有效性應該很不錯 : 用上述兩種可能會拿牛刀殺雞 : 不知道這樣想對不對? 一般來說paired data用paired T是比較好的呀 恩...看到這邊 不知道你們lab(或老闆的意見) 只想要挑幾個可以validation的來做? 因為...你FDR設得還蠻嚴的 像我做比較large-scale的network modeling 數百個significant genes我有點嫌太少耶 : --------------------------------------- : Q3 : : 在 R 的 packages "siggenes" 中 : d.stat() 的結果每次都不同 (這是一個t.test的函式 , 可 pair or unpair) : 我猜是因為加入了 permutation 的概念 : 但結果也差太多了 : 我選了 2600 個 receptors 來分析 : 有時後有 500 個顯著 : 有時後有 300 個顯著 : 請問有辦法解決嗎? : 還是我該跑一萬次取平均 P-value??? permutation我的習慣大概做個1,000次啦 可是我一直不是很喜歡permuatation因為這個概念 是符合統計 但真的符合生物嘛? 這我很保留 : : ------------------------------------- : 不好意思專問些難題..... -- ★ミ ζ _. /(╯ 【今晚的天空有一顆流星劃過 在預言著什麼】|> -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.167.201.87

12/29 01:37, , 1F
Quote from George Box: "All models are wrong, but some
12/29 01:37, 1F

12/29 01:37, , 2F
are useful"
12/29 01:37, 2F
文章代碼(AID): #1BDlWegS (BioMedInfo)
文章代碼(AID): #1BDlWegS (BioMedInfo)