[問題] EM演算法,填補缺失值
大家好,最近在讀EM(expectation maximization) algorithm,卡關了...QQ 在網路上
搜尋了一番,苦惱了兩天也找不到答案
卡關的部分主要在於,不太懂如何用EM去填補缺失值 (missing values imputation)
先說我對於EM本身的了解程度:
我對於EM的理解來自於這篇文:https://reurl.cc/Y9NRL
文中提到的算法推導過程我大概可以懂,對於文中提到的EM其中一種使用方法我也可以懂
。(文中提到可以使用EM去把200個人(有男有女)分成兩群,男&女,並且分別估計這兩群
的分佈的參數)
但是我想不通如何用EM去填補缺失值,網上也找不到實例說明。
我的猜想是.. 參考文中提到的notation,我們把x另為observed, 那z就是missing value
s
我們最主要目的是要最大化 L(x,z | θ ),然後透過EM的不斷迭代去不斷估計z,最後收
斂,填補缺失值?
如果我的這個猜想是對的,那麼有兩個問題:
1, 文中的p,也就是機率密度函數,要如何設定。
另外我看到有人用SPSS,https://reurl.cc/dXkvk,選擇normal!這個也很讓人困惑。
這是代表一個datasets裏頭,所有的variables都分別是normal distribution,然後最大
概似估計的p是所有的normal混在一起嗎?
1, 文中提到的E-step,僅得出z的posterior probability,可以用這個資訊來得到z的估
計值嗎? 如果missing values有5個,那估計出來的是對應到5個中哪一個?
如果我上面兩個問題很不清楚,甚至是根本問錯問題...真的很抱歉。
覺得現在一片混亂..QQ 可能處在一個連問問題都不太知道該怎麼問的狀態
謝謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.125.22
※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1544341983.A.94C.html
→
12/09 18:16,
7年前
, 1F
12/09 18:16, 1F
→
12/09 18:17,
7年前
, 2F
12/09 18:17, 2F
→
12/09 19:25,
7年前
, 3F
12/09 19:25, 3F
→
12/09 19:25,
7年前
, 4F
12/09 19:25, 4F
→
12/09 19:25,
7年前
, 5F
12/09 19:25, 5F
→
12/10 03:44,
7年前
, 6F
12/10 03:44, 6F
→
12/10 19:02,
7年前
, 7F
12/10 19:02, 7F
推
12/10 20:09,
7年前
, 8F
12/10 20:09, 8F
推
12/10 20:09,
7年前
, 9F
12/10 20:09, 9F
推
12/10 20:09,
7年前
, 10F
12/10 20:09, 10F
推
12/10 20:14,
7年前
, 11F
12/10 20:14, 11F
推
12/10 20:14,
7年前
, 12F
12/10 20:14, 12F
推
12/10 20:14,
7年前
, 13F
12/10 20:14, 13F
推
12/10 20:14,
7年前
, 14F
12/10 20:14, 14F
推
12/10 20:14,
7年前
, 15F
12/10 20:14, 15F
→
12/10 21:37,
7年前
, 16F
12/10 21:37, 16F
→
12/10 21:37,
7年前
, 17F
12/10 21:37, 17F
→
12/10 21:37,
7年前
, 18F
12/10 21:37, 18F
→
12/10 21:37,
7年前
, 19F
12/10 21:37, 19F
→
12/10 21:38,
7年前
, 20F
12/10 21:38, 20F
→
12/10 21:38,
7年前
, 21F
12/10 21:38, 21F
→
12/10 21:38,
7年前
, 22F
12/10 21:38, 22F
→
12/10 21:38,
7年前
, 23F
12/10 21:38, 23F
→
12/10 21:38,
7年前
, 24F
12/10 21:38, 24F
→
12/10 21:38,
7年前
, 25F
12/10 21:38, 25F
→
12/10 21:38,
7年前
, 26F
12/10 21:38, 26F
→
12/10 21:38,
7年前
, 27F
12/10 21:38, 27F
→
12/10 21:38,
7年前
, 28F
12/10 21:38, 28F
→
12/10 21:38,
7年前
, 29F
12/10 21:38, 29F
→
12/10 21:38,
7年前
, 30F
12/10 21:38, 30F
→
12/10 21:38,
7年前
, 31F
12/10 21:38, 31F
→
12/10 22:41,
7年前
, 32F
12/10 22:41, 32F
→
12/10 22:41,
7年前
, 33F
12/10 22:41, 33F
→
12/10 22:43,
7年前
, 34F
12/10 22:43, 34F
→
12/10 22:44,
7年前
, 35F
12/10 22:44, 35F
→
12/10 22:45,
7年前
, 36F
12/10 22:45, 36F
→
12/10 22:45,
7年前
, 37F
12/10 22:45, 37F
→
12/10 22:45,
7年前
, 38F
12/10 22:45, 38F
→
12/11 00:21,
7年前
, 39F
12/11 00:21, 39F
→
12/11 00:21,
7年前
, 40F
12/11 00:21, 40F
→
12/11 00:21,
7年前
, 41F
12/11 00:21, 41F
→
12/11 00:21,
7年前
, 42F
12/11 00:21, 42F
→
12/11 00:21,
7年前
, 43F
12/11 00:21, 43F
→
12/11 00:21,
7年前
, 44F
12/11 00:21, 44F
→
12/11 00:21,
7年前
, 45F
12/11 00:21, 45F
→
12/11 20:07,
7年前
, 46F
12/11 20:07, 46F
→
12/11 20:07,
7年前
, 47F
12/11 20:07, 47F
→
12/11 20:08,
7年前
, 48F
12/11 20:08, 48F
→
12/11 20:08,
7年前
, 49F
12/11 20:08, 49F
→
12/11 20:08,
7年前
, 50F
12/11 20:08, 50F
→
12/11 20:10,
7年前
, 51F
12/11 20:10, 51F
→
12/11 20:10,
7年前
, 52F
12/11 20:10, 52F
→
12/11 22:56,
7年前
, 53F
12/11 22:56, 53F
→
12/11 22:56,
7年前
, 54F
12/11 22:56, 54F
→
12/12 08:54,
7年前
, 55F
12/12 08:54, 55F
→
12/12 08:55,
7年前
, 56F
12/12 08:55, 56F
→
12/12 08:56,
7年前
, 57F
12/12 08:56, 57F
→
12/12 08:58,
7年前
, 58F
12/12 08:58, 58F
→
12/12 09:00,
7年前
, 59F
12/12 09:00, 59F
→
12/12 09:00,
7年前
, 60F
12/12 09:00, 60F
→
12/15 21:55,
7年前
, 61F
12/15 21:55, 61F