Re: [問題] 請問Fully convolutional networks輸入

看板DataScience作者 (LawTea)時間5年前 (2018/09/11 00:21), 編輯推噓4(400)
留言4則, 4人參與, 5年前最新討論串3/3 (看更多)
※ 引述《ChenXY (不差不歪 一插就歪)》之銘言: : 藉著這篇標題想請問CNN與FCNN的比較 : http://mnist-demo.herokuapp.com/ : 上方連結是分別用上述兩種網路分辨手寫數字0~9的試驗 : 網頁中提到CNN的準確率達99.2% 而FCNN只有91.8% : 實際測試雖然辨識度都不到9成 但CNN確實比較準 : 兩者差別在CNN只有最後一層才fully connected : 查了一些資訊提到當圖像尺寸較大時 : FCNN會有過多的完全連接浪費掉 : 而且快速累積的大量參數也會很快就導致過度配適 : 對於上述解釋其實我不太有感受 : 想請教有沒有比較直觀的說法 : 可以解釋為何CNN的辨識率會比FCNN還高呢?謝謝! 原原po問的應該是Fully Convolutional Neural Network 而不是Fully Connected Neural Network 通常前者會簡寫為FCN,後者會簡寫為FNN FCN是拿來做pixel-wise classification用的,也就是segmentation 至於你說的問題,為何CNN在影像辨識會比FNN好 我給一點定性的說法: 人眼決定一個物體看起來像什麼是由物體的各個局部特徵決定 影像中的局部特徵如邊、角、形狀等等都是只由局部的像素構成 比如兩個相鄰的像素一個灰階值255一個是0,那你就知道中間很可能有個edge 而相隔很遠的兩個像素通常不會給你什麼關鍵的資訊 CNN這種sliding window的方式正好給Network一個機會去學習怎麼提取影像的局部特徵 傳統的影像處理上也常利用各種kernal function去對影像做Convolution 所以與FNN強迫把整張圖的像素的聯繫在一起比較起來,CNN是更自然的作法 至於過度配適指的應該是over-fitting吧? 這個比較一下FNN跟CNN的參數就知道了 MNIST是32*32=1024 假設第一層hidden-layer有100個neuron,這樣光第一層就有102400個參數了 而CNN就算來100個3*3的的kernel也才900個參數 自然就不容易over-fitting了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.212.150 ※ 文章網址: https://www.ptt.cc/bbs/DataScience/M.1536596485.A.F63.html

09/11 10:40, 5年前 , 1F
說的ㄅ錯
09/11 10:40, 1F

09/11 11:05, 5年前 , 2F
推推 講到連我都懂了 不簡單
09/11 11:05, 2F

09/11 22:36, 5年前 , 3F
感謝您精闢的解說
09/11 22:36, 3F

09/14 11:21, 5年前 , 4F
推推
09/14 11:21, 4F
文章代碼(AID): #1Rbfe5zZ (DataScience)
文章代碼(AID): #1Rbfe5zZ (DataScience)