[求救] 有關public mRNA data數值表示和FC計算

看板Biotech作者 (熱騰騰的泡麵)時間4年前 (2020/02/18 00:06), 編輯推噓2(2027)
留言29則, 4人參與, 4年前最新討論串1/1
各位好 因最近利用public mRNA microarray 和 sequencing進行 gene expression分析 如fold change 下載 後打開檔案發現均為patient sample, 並無normal group 基因表現為: 樣本一 gene 0.5 樣本二 -0.2 之類 (有300多個樣本) 查了一下應該由log2轉換 想請問如果要計算gene 在tumor 和 normal的 fold change 是不是無法透過log2 轉換後的數值計算出來呢? 還是必須要有normal data才可計算 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.120.133 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1581955583.A.ED8.html

02/18 02:53, 4年前 , 1F
你這個是 microarray 還是 seq 的資料?如果是 micro,
02/18 02:53, 1F

02/18 02:53, 4年前 , 2F
那就已經 normalized 過了,如果是 seq,我還真沒看過
02/18 02:53, 2F

02/18 02:54, 4年前 , 3F
基因表現量會出現負值的 seq data
02/18 02:54, 3F

02/18 02:56, 4年前 , 4F
seq 的 data 基因表現量會用 RPKM 或 FPKM,這只會是
02/18 02:56, 4F

02/18 02:56, 4年前 , 5F
正值,所以我假設你那個是 microarray,基於 micro 的
02/18 02:56, 5F

02/18 02:57, 4年前 , 6F
原理,表現量一定是 sample 和另外一個基準樣品比較得
02/18 02:57, 6F

02/18 02:58, 4年前 , 7F
到的結果,可能要找找 database 資料提供者的論文看他
02/18 02:58, 7F

02/18 02:58, 4年前 , 8F
當時是拿什麼樣本當基準
02/18 02:58, 8F

02/18 03:01, 4年前 , 9F
log(patient) - log(normal) = log(patient/normal)
02/18 03:01, 9F

02/18 03:01, 4年前 , 10F
不過要注意 normalize 的方式跟 transform 的方式必須
02/18 03:01, 10F

02/18 03:02, 4年前 , 11F
一致。直接 log tranform expression value 的狀況要
02/18 03:02, 11F

02/18 03:02, 4年前 , 12F
確認底數是否相同。
02/18 03:02, 12F

02/18 03:02, 4年前 , 13F
可以拿同一個 batch/study 的 data 就盡量拿同一個,因
02/18 03:02, 13F

02/18 03:03, 4年前 , 14F
為 batch effect 很難校正。
02/18 03:03, 14F

02/18 03:04, 4年前 , 15F
如果是 seq 的話注意是 log FC 還是 logTPM/RPKM/FPKM
02/18 03:04, 15F

02/18 20:16, 4年前 , 16F
謝謝兩位, 目前我查到作者對於data的描述為:Data were
02/18 20:16, 16F

02/18 20:16, 4年前 , 17F
acquired using the Agilent G2565BA Microarray Scanner
02/18 20:16, 17F

02/18 20:17, 4年前 , 18F
Probe intensities were normalized using GeneSpring GX
02/18 20:17, 18F

02/18 20:18, 4年前 , 19F
應該是將tumor sample的mRNA測量值以probe測定, 再和
02/18 20:18, 19F

02/18 20:19, 4年前 , 20F
reference gene相除得到ratio再取log2值, 負值代表下調,
02/18 20:19, 20F

02/18 20:19, 4年前 , 21F
正值代表上調。以上是我的理解不知觀念正不正確。
02/18 20:19, 21F

02/18 20:20, 4年前 , 22F
但因為data並無normal brain組(無control),故即使知道
02/18 20:20, 22F

02/18 20:21, 4年前 , 23F
A gene上調, 但沒有control可以計算fold change,這樣講對
02/18 20:21, 23F

02/18 20:21, 4年前 , 24F
嗎?
02/18 20:21, 24F

02/21 08:59, 4年前 , 25F
可以提供GSE的連結嗎? 我以前有那過這樣的資料分析。
02/21 08:59, 25F

02/21 08:59, 4年前 , 26F
當時會有區分adjencent and tumor樣本。不過極少,大部
02/21 08:59, 26F

02/21 08:59, 4年前 , 27F
分可行的是在來源網站中提供生存分析或Grade樣本
02/21 08:59, 27F

02/21 09:00, 4年前 , 28F
你可以這樣理解,臨床樣本原則上不會有正常人組織,因
02/21 09:00, 28F

02/21 09:00, 4年前 , 29F
為沒有取樣理由
02/21 09:00, 29F
文章代碼(AID): #1UIhd_xO (Biotech)