Re: [新聞] 蘋果將偵測兒童色情影像 用戶上傳iCloud就舉報

看板MobileComm作者 (Vi)時間2年前 (2021/08/08 01:31), 編輯推噓3(3041)
留言44則, 5人參與, 2年前最新討論串6/8 (看更多)
我只能說不管怎樣 他們一定會侵犯隱私 人工審核照片的 如果是我來設計抓未成年影像的AI 我會先判斷年齡,用臉或是體形,判斷是否為未成年 再判斷圖片是否有裸露,性行為 當符合的特徵越多,就越有可能是未成年色情 你用hash抓到,當然毫無疑問,不需人工審核就知道是犯罪圖片 但未成年色情不只有那些已存在的,可以用hash辨識 還有新拍攝的,需要靠AI找出來的 像我上面講的,越多符合特徵的圖片篩出來, 再經由人工審核才有辨法判斷是否違法 hash是一種低效率手段,光是整理資料庫就是大工程 更別說數千萬計的圖片都要一張一張掃過,這個只能偶爾排程跑一次 或是先用AI抓出可疑圖片,再用hash掃過, 掃不到再交給人工審核 這樣才能縮小範圍,快速抓到違法圖片 我只能說雲端相簿都是沒隱私的 會怕的人可以把照片zip起來再丟雲端 或是自架NAS,自己的資料自己管 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 110.26.40.120 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1628357507.A.C90.html

08/08 01:39, 2年前 , 1F
你在上傳圖片的時候就會算 hash 值記在資料庫了...
08/08 01:39, 1F

08/08 01:40, 2年前 , 2F
你傳上去的圖片hash值又不會變 = =
08/08 01:40, 2F

08/08 01:42, 2年前 , 3F
如果你有看過大公司 Storage System 的 paper 的話
08/08 01:42, 3F

08/08 01:42, 2年前 , 4F
基本上都會存 data 的 sha-1
08/08 01:42, 4F

08/08 01:55, 2年前 , 5F
我說的是色情圖片的資料庫 每張圖都要loop這資料庫
08/08 01:55, 5F

08/08 01:56, 2年前 , 6F
一次吧
08/08 01:56, 6F

08/08 01:57, 2年前 , 7F
Apple 現在的作法就是在你手機丟個 hash 資料庫
08/08 01:57, 7F

08/08 01:57, 2年前 , 8F
你手機晶片都能運算的檢查 你覺得這樣會沒效率嗎
08/08 01:57, 8F

08/08 02:00, 2年前 , 9F
現代資料庫也不會用 loop 一個一個比對
08/08 02:00, 9F

08/08 02:00, 2年前 , 10F
你的想法是 hash 比對這件事情是 O(N) N=資料筆數
08/08 02:00, 10F

08/08 02:00, 2年前 , 11F
可是實際上資料庫不是這樣運作的
08/08 02:00, 11F

08/08 02:02, 2年前 , 12F
資料庫不要太大的話 比對的效率可以趨近於 O(1)
08/08 02:02, 12F

08/08 02:03, 2年前 , 13F
你如果有興趣可以看一下 HashMap 跟 B-Tree
08/08 02:03, 13F

08/08 02:03, 2年前 , 14F
PS B-Tree 不是 O(1)
08/08 02:03, 14F

08/08 02:05, 2年前 , 15F
這也不算現代了 幾乎都是二三十年前就有的東西
08/08 02:05, 15F

08/08 02:05, 2年前 , 16F
現在都是在這上面做優化 所以肯定查的速度更快
08/08 02:05, 16F

08/08 02:06, 2年前 , 17F
可是根據我逛過暗網看過的東西 應該不會是O(1)
08/08 02:06, 17F

08/08 02:08, 2年前 , 18F
這不用暗網啊 資工大二的資料結構就有教了 = =
08/08 02:08, 18F

08/08 02:09, 2年前 , 19F
資料結構是必修課 算是資工系的常識吧
08/08 02:09, 19F

08/08 02:13, 2年前 , 20F

08/08 02:13, 2年前 , 21F
你可以不信我 但你要信一下 Google
08/08 02:13, 21F

08/08 02:14, 2年前 , 22F
其實我覺得非蘋果員工在那邊幫蘋果擔心運算資源不足
08/08 02:14, 22F

08/08 02:14, 2年前 , 23F
還蠻有趣的
08/08 02:14, 23F

08/08 21:11, 2年前 , 24F
抓有兩種方式,兩種都對,一種的確是FBI資料庫,但
08/08 21:11, 24F

08/08 21:12, 2年前 , 25F
另一種就是FB那種方式,偵測後自動判斷,連泳裝都能
08/08 21:12, 25F

08/08 21:12, 2年前 , 26F
被當猥褻照片,只要多加幾個參數,就是原PO講的人工
08/08 21:12, 26F

08/08 21:13, 2年前 , 27F
審核,至於蘋果要用哪種沒講,也應該不會講。所以考
08/08 21:13, 27F

08/08 21:13, 2年前 , 28F
慮隱私,兩種加總才是答案,這也就是為什麼說,別用
08/08 21:13, 28F

08/08 21:14, 2年前 , 29F
手機拍小孩,這也不是危言聳聽,想拍小孩記得買相機
08/08 21:14, 29F

08/08 21:15, 2年前 , 30F
另外運算資源?FB雖很不穩,但有聽過是因為運算太兇
08/08 21:15, 30F

08/08 21:15, 2年前 , 31F
出包嗎?中國那種審更兇地也都沒問題,不用你擔心啦
08/08 21:15, 31F

08/08 21:25, 2年前 , 32F
喔,原文有講犯罪資料庫喔。但還是老話,別太相信那
08/08 21:25, 32F

08/08 21:25, 2年前 , 33F
些人講法,今天他們不注重隱私,未來也不可能注重,
08/08 21:25, 33F

08/08 21:26, 2年前 , 34F
像google已經好幾起抓好幾年前的人了,他們改變政策
08/08 21:26, 34F

08/08 21:27, 2年前 , 35F
的話,被抓也不意外,雲端基本上沒隱私可言,不管哪
08/08 21:27, 35F

08/08 21:27, 2年前 , 36F
個國家都一樣,而且別以為只有這類犯罪,版權物也一
08/08 21:27, 36F

08/08 21:28, 2年前 , 37F
樣,放上雲端最好還是加密,不然你用10幾年帳號被凍
08/08 21:28, 37F

08/08 21:28, 2年前 , 38F
就欲哭無淚了。
08/08 21:28, 38F

08/09 11:42, 2年前 , 39F
相似度搜尋並不是純hashmap的O(1)複雜度喔。詳情可
08/09 11:42, 39F

08/09 11:42, 2年前 , 40F
以搜An optimal Algorithm for Approximate Nearest
08/09 11:42, 40F

08/09 11:42, 2年前 , 41F
Neighbor Searching in Fixed Dimensions這篇論文
08/09 11:42, 41F

08/09 11:43, 2年前 , 42F
hashmap適用的條件是找物件“本身“ 但這裡的功能是
08/09 11:43, 42F

08/09 11:43, 2年前 , 43F
在做相似度的尋找
08/09 11:43, 43F

08/09 11:50, 2年前 , 44F
使用k-d樹的話找相似度的複雜度是O(log N)
08/09 11:50, 44F
文章代碼(AID): #1X3iE3oG (MobileComm)
討論串 (同標題文章)
文章代碼(AID): #1X3iE3oG (MobileComm)