Re: [請益] 又要來請教生統博班的強者了~乾溫~
嘉芸在推文中有問到什麼是SVM
簡單的說SVM是一種可以將資料進行分群的理論
可以先想像在一個XY平面座標上,有兩群點點,分別是黑點以及白點
我要怎麼把他們分開?
如果黑點白點本來就各自為政,井水不犯河水
那是不是用一條簡單的直線可以把他們分開了?
但如果黑點白點的分佈並不那麼明確、甚至黑點白點分成四五群
那SVM的優點就展現出來了
給大家一個網站: http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html
這是台大資工林智仁老師的網站,點開以後拉到中間
看到一個黑色的視窗,就可以玩玩SVM囉~
附贈小小的佛心教學文:
笨蛋也可以用的libsvm
http://www.cmlab.csie.ntu.edu.tw/~cyy/learning/tutorials/libsvm.pdf
※ 引述《xavier0613 (xavier)》之銘言:
: ROC(Receiver operating characteristic) Curves
基本上我不太清楚嘉芸的資料是什麼型態,所以ROC curve到底適不適合
妳可能得跟老師討論囉!
學妹的圖咧?
: 我先承認我是來賺p幣的....
: 因為之前NBA總冠軍第三場我梭超賽隊輸光光了
: 這個彥修的老闆因該很會畫 因為我是修他老闆課的時候學的
我再找找上課的投影片 (之前硬碟被搞掛,所以有點難度... 囧> )
: 簡而言之 這玩意常拿來用的地方有兩點
: 1.就是那來決定cut-off值
: 2.比較曲線下的面積看誰大 愈大愈屌
我想米老鼠小姐大概不知到屌在哪裡... XDDDDDDD
定遠大神在這邊 "屌" 意思應該是說:
在各個不同的實驗條件下,所畫出來的ROC curve
當曲度越高,與X軸圍出的面積就會越大
表示這個實驗條件在FPR很低的情況下,即可達到很高的TPR
有點酵素動力學的感覺吼...(超低反應濃度,超高反應速率)
只不過ROC畫出來不是sigmoid的曲線
給個範例圖參考 http://upload.wikimedia.org/wikipedia/en/0/00/Roc.png
(用IE開吧~)
ROC curve常常被拿來測parameter就是如此.......
: ==========以上是口齒清晰的分隔線==========
: 恩 所以重點在於要怎麼把他畫出來
: 有兩種, 一種是連續的 一種是不連續的
: 我碩二都快畢業了 我也只會畫不連續的 不連續的很簡單 但畫出來比較醜
 ̄ ̄ ̄ ̄ ̄ ̄ ̄ ̄
馬的,什麼都是假的,畢業才是真的,先恭喜定遠大神!!!!!!!!!!
: Well, 你可以畫得很好看 但你要取到接近無限個點
: 所以假設你不太在意美觀度 今天你對你設計好的系統(或是模型, 或是其他的東東)
: 你這個系統有個參數 你今天很煩惱這個參數的cut-off值
: 所以你今天就取了10個點 可能用指數型的成長來測這個參數
: e.g., 0.001, 0.01, 0.1, 1, 10, 100....
: 所以我們就針對這10種情形去測是我們手上系統的performance
: 通常X軸是Sensitivity(True positive rate)
: Y軸是1 - Specificity(False positive rate)
這邊好像寫反了,X軸應該是"1-specificity(FPR)",Y軸是"sensitivity(TPR)"
FPR = FP/P = FP/(FP+TN)
TPR = TP/P = TP/(TP+FN)
: 藉由這兩個決定performance的指標 你可以針對那一個參數得到10組數對
: 然後再把這10個點連起來
: YA~ 醜醜的ROC就畫好了
: 那要怎麼選哪個點最好呢
: 最靠近左上角的那個點就是最好的點了
: 所以一般人就會選那個點所用的參數的值來當作該參數的cut-off
解釋一下,會選左上角是因為通常這個點都是在 TP & RP 之間取的一個最佳平衡點
: 恩 這麼麻煩 所以我們都丟給package去畫
: 在這邊推薦用R來畫 因為高手都用R來畫
: 而我只會用excel呆呆的畫....
: 接下來就交給彥修了 科科....
這......我也是呆呆的畫耶 XD
MatLAB好像也可以畫: http://theoval.sys.uea.ac.uk/~gcc/matlab/default.html#roc
-----
題外話:
剛剛才聽完我們家碩二的兩位學長口試...
真的很恐怖!
每個口委都會質疑你的每一的小細節
而且還請了五個.....(爆)
問題直達核心
如果自己沒有真正了解實驗為什麼要這樣設計
會 很 慘................囧rz
祝福各位即將上場的同學
你們一定行的!
加油!
--
◤═════◥
║ ║
║ / ║
║★ ║
║ ╲○║
◣══ ︿∕>
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.239.68
※ 編輯: NomadShu 來自: 140.113.239.68 (07/02 17:57)
推
07/02 20:17, , 1F
07/02 20:17, 1F
推
07/02 23:17, , 2F
07/02 23:17, 2F
推
07/02 23:36, , 3F
07/02 23:36, 3F
推
07/03 00:03, , 4F
07/03 00:03, 4F
推
07/03 16:50, , 5F
07/03 16:50, 5F
→
07/03 21:46, , 6F
07/03 21:46, 6F
→
07/04 19:17, , 7F
07/04 19:17, 7F
討論串 (同標題文章)