Re: [機統] 基於某分布的期望值"定義"(1000p)
: 這麼說好了 嚴格的照定義來看(要看paper的證明過程)
:
: Wiki上是:
:
: (Ω,Σ,P) , w€Ω, X:Ω→Real numbers
:
:
: 則 E[X] := ∫ X(w)dP(w)
: Ω
:
: (定義)
:
: ∞
: = ∫ x dF(x) , where F(x) = P({w€Ω:X(w)≦x}) 簡寫為P(X≦x)
: -∞
: (定理)
: ∞ x
: = ∫ x*f(x) dx , where F(x) = ∫ f(t)dt
: -∞ -∞
: (定理)
:
: 再強調一次, w€Ω, x€Real numbers, X is a random variable
:
: =======================================================
: 再來看今天paper是:
:
: E_{x~p(x)}[g(x)] = ∫ p(x)*g(x) dx
: x
:
: 問題來了:
:
: (1) Ω是啥?R^n嗎?x的樣本空間?
:
: 也就是說(Ω,Σ,P)各是?
:
: (2) x是啥?x的樣本空間嗎?x€R^1?x€R^n?
:
: (3) g(x)是啥?隨機變數?那x就是w?
:
: (4) p(x)是啥?分布函數?分布密度函數?變數是x€R^1還是w€Ω?
: (可是我學的單一隨機變量的分布函數變數是擺x€R^1並非p(w))
:
: 總之,若是相同定義必定可以證明等價
: ※ 編輯: znmkhxrw (220.128.169.29), 01/23/2018 18:06:42
paper: https://arxiv.org/abs/1406.2661
看paper的意思,可以確定的是paper中的x是data
我的猜測是paper中的x是random variable或random vector或random matrix
看data的形式是長什麼樣子,例如:
paper中Figure 1的圖看起來是random variable
paper中Figure 2則是random matrix, 圖片實際上都有像素尺寸例如n*m,
灰階基本上是一個變數在控制,例如0可能是黑,255也許是白
這樣應該回答了問題(2)。
在寫法上
用原po Wiki的寫法,X是random variable, x是X的range的元素
如同原po前面講的,distribution function不管是cdf還是pdf或pmf一般都是吃x而不是X
我猜測paper為了方便(?),把x和X混在一起,造成原po的混亂。
基本上,在積分內的應該是x, 在期望值[]內的應該是r.v. X
至於期望值下標的寫法,例如paper中的(1)式,就不要管它了(逃
看看paper中的(4)式,應該不會有理解上的問題。
我想這樣應該回答了問題(4)。
回答問題(3)的部分我重寫一段在推文下面
至於g(x),應該就是一般的函數,無關原po Wiki寫法的x和X
在paper裡可以看到出現這種東西:
p_{data}(x)
E_{x~p_{data}}[log D^{*}_{G}(x)], D^{*}_{G}(x) = ──────────
p_{data}(x)+p_{g}(x)
這邊,p_{data}(x)和p_{g}(x)猜測都是看成一般的函數
也就是說,g(x)=log D^{*}_{G}(x) 是一般的函數
而期望值[]內的是r.v., 用原po Wiki寫法是E[g(X)]
至於怎麼算或者定義,我想前面y大應該都講完了。
這樣大概回答了問題(3)。
用原po Wiki寫法,有了random variable X 和其distribution function
就算沒有特別講X的定義域,大概基本上還是有probability space
把X的range當成是sample space, 事件的集合應該自然也就有了。
最後,distribution function 就是在刻劃 probability measure function
這樣大概回答了問題(1)。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.233.93.197
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1516724463.A.971.html
推
01/24 00:30,
8年前
, 1F
01/24 00:30, 1F
→
01/24 00:30,
8年前
, 2F
01/24 00:30, 2F
E[g(X)],[]內的X是r.v.,而g(X)是一個X的轉換,仍然是一個r.v.
看起來好像是我沒講清楚有點誤導到原po
我說 g(x),應該就是一般的函數,無關原po Wiki寫法的x和X(也許只寫g會比較好)
就像g(x)=x^2 一樣,至少我們早就知道g是某個已知的函數
然後對於原po Wiki寫法的r.v. X, 我們也可以算expectation of transformation
也就是說令Y=g(X)這個新的r.v.,知道X的分佈就可以算E[Y],可以不用知道Y的分佈
最後提一下Y=g(X)
如果X:Ω→R 的話,那麼Y:Ω→R
w→a w→g(a)
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
我重打一段回答問題(3)
在原po提及paper裡的式子
E_{x~p(x)}[g(x)] = ∫ p(x)*g(x) dx,
x
g(x)是什麼?
首先,只看g本身,它是一般的函數
就像g(x)=x^2 一樣,至少我們早就知道g是某個已知的函數
在paper裡可以看到出現這種東西:
p_{data}(x)
E_{x~p_{data}}[log D^{*}_{G}(x)], D^{*}_{G}(x) = ──────────
p_{data}(x)+p_{g}(x)
這邊,p_{data}和p_{g}猜測都是看成一般的函數
也就是說,只看函數本身log D^{*}_{G},它是一般的函數。
再來,式子裡出現兩次g(x),一個在期望值[]內,一個在積分內
如同前面我說的,用原po Wiki寫法,
在期望值[]內的是X,在積分內的是x,積分的範圍是X的值域。
那g(X)是什麼?
它是一個新的r.v.,是r.v. X的一個轉換
如果我們令Y=g(X),X:Ω→R 的話,
w→a
那麼Y:Ω→R 就是這樣的函數。
w→g(a)
推
01/24 04:58,
8年前
, 3F
01/24 04:58, 3F
→
01/24 04:58,
8年前
, 4F
01/24 04:58, 4F
推
01/24 05:02,
8年前
, 5F
01/24 05:02, 5F
→
01/24 05:02,
8年前
, 6F
01/24 05:02, 6F
→
01/24 05:02,
8年前
, 7F
01/24 05:02, 7F
推
01/24 05:05,
8年前
, 8F
01/24 05:05, 8F
→
01/24 05:05,
8年前
, 9F
01/24 05:05, 9F
→
01/24 05:05,
8年前
, 10F
01/24 05:05, 10F
→
01/24 05:05,
8年前
, 11F
01/24 05:05, 11F
→
01/24 05:05,
8年前
, 12F
01/24 05:05, 12F
推
01/24 05:08,
8年前
, 13F
01/24 05:08, 13F
→
01/24 05:08,
8年前
, 14F
01/24 05:08, 14F
推
01/24 09:21,
8年前
, 15F
01/24 09:21, 15F
→
01/24 09:21,
8年前
, 16F
01/24 09:21, 16F
→
01/24 09:22,
8年前
, 17F
01/24 09:22, 17F
→
01/24 09:22,
8年前
, 18F
01/24 09:22, 18F
→
01/24 09:23,
8年前
, 19F
01/24 09:23, 19F
→
01/24 09:23,
8年前
, 20F
01/24 09:23, 20F
→
01/24 09:23,
8年前
, 21F
01/24 09:23, 21F
→
01/24 09:24,
8年前
, 22F
01/24 09:24, 22F
→
01/24 09:24,
8年前
, 23F
01/24 09:24, 23F
※ 編輯: PPguest (118.233.93.197), 01/24/2018 09:50:12
@z大:我在前面推文下面重打一段回答問題(3)
我預期回答了問題(1)~(4)應該是釐清了paper的notation
基本上notation應該都是機率裡面我們想的那樣
推
01/24 09:57,
8年前
, 24F
01/24 09:57, 24F
→
01/24 09:57,
8年前
, 25F
01/24 09:57, 25F
※ 編輯: PPguest (118.233.93.197), 01/24/2018 11:19:54
推
01/24 12:05,
8年前
, 26F
01/24 12:05, 26F
※ 編輯: PPguest (118.233.93.197), 01/24/2018 13:39:11
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):