Re: [閒聊] えなこ跟國昌真的相似嗎?人臉辨識告

看板C_Chat作者 (Okami)時間3年前 (2020/07/09 19:28), 編輯推噓16(19352)
留言74則, 22人參與, 3年前最新討論串1/7 (看更多)
※ 引述《can18 (18號)》之銘言: : 我覺得原 Po 犯了幾點錯誤 : 1. 人臉識別的技術 : 人臉識別最主要的目的是將相同的人視為相同的人 不同的人視為不同的人 : 數值代表的是為同一個人的機率 並不是兩個人的相似程度 : 人臉識別不會保證相似的人的分數一定會比不相似的人高 : (當然實務上相似的人分數很可能比不相似的高 但不是必然 : 事實上 有一篇論文叫做 : Measuring Face Similarity Rather than Face Identity : (CVPR 2018 頂級的電腦視覺會議論文) : 如果可以直接用人臉識別的分數推論相似 這篇論文根本不會存在 : 2. 相似的定義 : 假設你真的得到機器的相似分數 : 大家說的像 相似 : 通常指的是人類知覺上的相似 : 因此若兩個相似的人 : 機器如果判斷為相似 : 也只能說 人覺得相似 機器也覺得相似 : 機器如果判斷為不相似 : 也只能說 人覺得相似 但機器覺得不像 : 而不是可以用機器判斷來推論人的知覺 : 機器判斷的邏輯跟人類是差非常多 : 結論 : 1. 根本用錯方法 不能用人臉識別分數推論人臉相似程度 : 2. 就算用對方法 機器覺得像不像不能推論人覺得像不像 我不是機器學習相關領域的,不過我對下面那個confidence score有點興趣, 這東西翻譯好幾種,信心指數,信賴分數,可信度 etc, 但照我的理解,應該是程式對這次判斷結果的自信度, 那意思似乎就會完全顛倒呢... 用第一張圖來看,程式判斷這兩人不同人,但信心指數只有0.1xxx... 那代表程式其實非常不確定,幹意思就是這兩張照片超像的阿!像到程式根本無法確定! 有沒有機器學習領域的版友出來打我臉,解釋一下confidence score真正的涵義, 順便幫大家漲點知識吧。 -- 如果一個人不會好好組織他的思想,也不會通順的把想法寫下, 又不能給讀者提供更多樂趣,而竟將之寫在紙上, 那他就是在輕率濫用他的閒暇和他的紙張 --羅馬共和末期演說家 西賽羅 (Marcus Tullius Cicero , 西元前106~西元前43) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.47.181.200 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1594294106.A.38D.html

07/09 19:30, 3年前 , 1F
意思是程式判斷兩人是同一人的信心指數0.1xxx
07/09 19:30, 1F

07/09 19:32, 3年前 , 2F
笑死
07/09 19:32, 2F

07/09 19:37, 3年前 , 3F
幫高調這篇
07/09 19:37, 3F

07/09 19:37, 3年前 , 4F
拿同一張照片是結果會是1
07/09 19:37, 4F

07/09 19:41, 3年前 , 5F

07/09 19:41, 3年前 , 6F
意思應該是:AI認為兩人不同,但沒什麼信心
07/09 19:41, 6F

07/09 19:43, 3年前 , 7F
預防性 國
07/09 19:43, 7F

07/09 19:44, 3年前 , 8F
比較正確的理解法應該是 信心指數0.1xxx 所以程式表示
07/09 19:44, 8F

07/09 19:44, 3年前 , 9F

07/09 19:44, 3年前 , 10F
兩人應該是不同人
07/09 19:44, 10F

07/09 19:45, 3年前 , 11F
下面的前綴字會改
07/09 19:45, 11F

07/09 19:45, 3年前 , 12F
一樣的話(Same person),可信度100%
07/09 19:45, 12F

07/09 19:45, 3年前 , 13F
兩張國昌那張是same person
07/09 19:45, 13F

07/09 19:46, 3年前 , 14F
他後面的可信度看起來是依前面的那句話來判定可信度
07/09 19:46, 14F

07/09 19:46, 3年前 , 15F
笑死,都不曉得該說什麼才好
07/09 19:46, 15F

07/09 19:46, 3年前 , 16F
所以代表兩個人很像,AI不確定
07/09 19:46, 16F

07/09 19:46, 3年前 , 17F
實際上看那個值就好了
07/09 19:46, 17F

07/09 19:47, 3年前 , 18F
不能只看值了 前面那句話有不同
07/09 19:47, 18F

07/09 19:47, 3年前 , 19F
大概就那個值高於某個程度就會被判定說是同一人
07/09 19:47, 19F

07/09 19:47, 3年前 , 20F
如果是diffent 值1,代表AI 100%肯定兩人不同
07/09 19:47, 20F

07/09 19:48, 3年前 , 21F
如果是same 值1,代表AI 100%肯定兩人相同
07/09 19:48, 21F

07/09 19:48, 3年前 , 22F
前綴不同,不能只看值
07/09 19:48, 22F

07/09 19:48, 3年前 , 23F
這種東西如果有第二個判斷值會打出來給你看啦
07/09 19:48, 23F

07/09 19:49, 3年前 , 24F
他那個值不是「相似度」,是「可信度」
07/09 19:49, 24F

07/09 19:49, 3年前 , 25F
不然就是前面是結果,後面是數值,兩個分開看
07/09 19:49, 25F

07/09 19:50, 3年前 , 26F
應該說數值是結果 前面字句是根據結果做出的解釋
07/09 19:50, 26F

07/09 19:52, 3年前 , 27F

07/09 19:54, 3年前 , 28F
我猜大概是>0.8或是0.7就說same person
07/09 19:54, 28F

07/09 19:55, 3年前 , 29F
對於這種工程師寫的字句不要想太多 解釋都是很直接的
07/09 19:55, 29F

07/09 19:59, 3年前 , 30F
前面結論會有肯定或否定 後面只是秀數值給你看
07/09 19:59, 30F

07/09 20:12, 3年前 , 31F
那下面就直接寫Similarity就好啦,為什麼要寫confidenc
07/09 20:12, 31F

07/09 20:12, 3年前 , 32F
e 呢?
07/09 20:12, 32F

07/09 20:14, 3年前 , 33F
因為不是相似度
07/09 20:14, 33F

07/09 20:17, 3年前 , 34F
統計…
07/09 20:17, 34F

07/09 20:18, 3年前 , 35F
電腦的辨識就是抓幾個地方做特徵比對 那個相似度其實不過
07/09 20:18, 35F

07/09 20:18, 3年前 , 36F
只是代表電腦覺得有幾個地方一樣而已
07/09 20:18, 36F

07/09 20:19, 3年前 , 37F
所以結論就是國爆了 AI不確定是不是不同人
07/09 20:19, 37F

07/09 20:21, 3年前 , 38F
實際上來說 所謂的大數據分析也就是統計的延伸
07/09 20:21, 38F

07/09 20:21, 3年前 , 39F
經由大量的資料計算後 所分析出可能性的高與低
07/09 20:21, 39F

07/09 20:21, 3年前 , 40F
但本質上依舊是機率統計的概念 機率高不代表就是正確 只是
07/09 20:21, 40F

07/09 20:21, 3年前 , 41F
正確的可能性高 反之亦然
07/09 20:21, 41F

07/09 20:23, 3年前 , 42F
辣個 有沒有比較完整的結論惹
07/09 20:23, 42F

07/09 20:26, 3年前 , 43F
但就算樣本(資料量)再大也不能夠完全體現母體 所以他不是
07/09 20:26, 43F

07/09 20:26, 3年前 , 44F
實際發生的機率而是 我們推測他符合正確的機率
07/09 20:26, 44F

07/09 20:26, 3年前 , 45F
所以不能夠用相似度準確率 而是有多少信心認為符合真實情
07/09 20:26, 45F

07/09 20:26, 3年前 , 46F
07/09 20:26, 46F

07/09 20:39, 3年前 , 47F

07/09 20:41, 3年前 , 48F
這樣算是幫三胖驗明正身了嗎?
07/09 20:41, 48F

07/09 20:41, 3年前 , 49F
其實原本想比看看槍間老母的但不給辨識
07/09 20:41, 49F

07/09 21:05, 3年前 , 50F
所以為什麼不去看微軟提供的定義,自己在那邊猜
07/09 21:05, 50F

07/09 21:06, 3年前 , 51F
以這個例子如果題目改成從數個目標中選一個 那儘管目標中沒
07/09 21:06, 51F

07/09 21:06, 3年前 , 52F
有正確答案 還是有可能出現很高的信心值 因為最後他所有選
07/09 21:06, 52F

07/09 21:06, 3年前 , 53F
項的加總會是1
07/09 21:06, 53F

07/09 21:07, 3年前 , 54F
給的這個已經是信心值最高的結果了 換句話說 判斷是同個
07/09 21:07, 54F

07/09 21:08, 3年前 , 55F
人的信心指數比0.1xxx還更低
07/09 21:08, 55F

07/09 21:08, 3年前 , 56F
文組?
07/09 21:08, 56F

07/09 21:11, 3年前 , 57F
再換句話 也就是兩張照片擷取的特徵比對有大多數都沒辦
07/09 21:11, 57F

07/09 21:12, 3年前 , 58F
法給出高信心的"是"或"不是" 那就跟兩張照片很像沒什麼
07/09 21:12, 58F

07/09 21:12, 3年前 , 59F
兩樣
07/09 21:12, 59F

07/09 21:51, 3年前 , 60F
為什麼不看文件... https://tinyurl.com/yakj2sb6
07/09 21:51, 60F

07/09 21:52, 3年前 , 61F
tinyurl 縮不好... https://bit.ly/2Dnc3Vr
07/09 21:52, 61F

07/10 03:31, 3年前 , 62F
通常這種類似分類的神經網路最後一層都是接Softmax,把神
07/10 03:31, 62F

07/10 03:32, 3年前 , 63F
經網路的輸出轉成機率,就會變成[0.9,0.1]這種的輸出,可
07/10 03:32, 63F

07/10 03:32, 3年前 , 64F
能前面的值為這兩個人是同一人的可能性,然後後者相反(這
07/10 03:32, 64F

07/10 03:32, 3年前 , 65F
看你怎麼label資料),所以這裡confidence應該是指神經網
07/10 03:32, 65F

07/10 03:32, 3年前 , 66F
路認為這兩個人是同一人的可能性的意思。
07/10 03:32, 66F

07/10 11:54, 3年前 , 67F
樓上 很明顯不是softmax啊 否則怎麼會有判斷是一樣但是scor
07/10 11:54, 67F

07/10 11:54, 3年前 , 68F
e < 0.5的啊
07/10 11:54, 68F

07/10 13:57, 3年前 , 69F
文件不是寫大於等於 0.5 判斷為同一人嗎XD
07/10 13:57, 69F

07/10 14:26, 3年前 , 70F
一樓就你啦,看文件好嗎?
07/10 14:26, 70F

07/10 15:36, 3年前 , 71F
看文件說>0.5是認定同一個人,那應該是softmax沒錯?雖然
07/10 15:36, 71F

07/10 15:37, 3年前 , 72F
沒真的去看它的架構也不能確定
07/10 15:37, 72F

07/10 15:40, 3年前 , 73F
但是我看到前面有同一張照片給出的score是1,應該是機率沒
07/10 15:40, 73F

07/10 15:40, 3年前 , 74F
錯吧?
07/10 15:40, 74F
文章代碼(AID): #1V1lzQED (C_Chat)
討論串 (同標題文章)
文章代碼(AID): #1V1lzQED (C_Chat)