[問題] 關於 A/B Test 觀察指標討論

看板Statistics作者bruce3557 (bruce)時間6年前 (2020/01/19 23:04)推噓3(3推 0噓 32→)

留言35則, 4人參與討論串1/1

Hi 大家好，最近小弟在工作上討論 A/B Test 遇到了一些卡住的地方想看看有沒有人可以幫助解惑 XD 也想了解一下大家都怎麼理解這些問題～我們最近在討論的問題是關於使用時長的 A/B Test 在 A/B Test 裡我們做的步驟是這樣: 1. 關於實驗的步驟我們的假說是隨機抽取兩組人 (根據隨機試驗，我們相信足夠多人就可以代表母體) 2. 對他們過去幾天的使用時長做檢測，分佈一致才進行 3，否則回 1 重抽 3. 開始實驗然而現在有一個爭論點是這樣的我們要比較使用時長，我們應該看的指標是下列二者哪一種 1. 時長平均數 or 整體時長 2. 時長中位數使用 1 的原因是我們的總體指標想看的是整體時長所以用平均數或是直接用整體時長都可以有很好的 align 商業指標另外因為平均 or 總體時長做出來會符合中央極限定理所以很自然的可以使用 normal distribution 的 test 來做檢測跟 confidence interval 的推估市面上蠻多關於 skew dataset 的檢測也是類似的 (像是電商的 order revenue，做實驗有沒有平均 order revenue 成長，也是觀測這類型 skew dataset 的變化) 這個的理論基礎大概是: https://www.mdrc.org/sites/default/files/full_533.pdf 使用 2 目前的狀況是因為 a. 平均時長很容易被時長很高的人拉走 b. 原本使用者的時長分佈並非 normal，所以不該用平均數所以有部分的人認為應該是要觀測中位數的變化這個的缺點大概是不一定能夠反映我們整體的指標變化不確定這樣描述夠不夠清楚 QQ 想說看看板上各位大師的意見，小弟也算是半路出家 K 這些資料，不確定到底哪種描述 + 實驗方式比較正確 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.135.132.139 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1579446250.A.34C.html

→

andrew43

01/19 23:11, 6年前 , 1^F

01/19 23:11, 1^F

→

andrew43

01/19 23:13, 6年前 , 2^F

01/19 23:13, 2^F

→

andrew43

01/19 23:14, 6年前 , 3^F

01/19 23:14, 3^F