[討論] 認證圖集中解碼

看板HOT_Game作者時間17年前 (2007/06/24 00:33), 編輯推噓7(702)
留言9則, 9人參與, 最新討論串1/4 (看更多)
因為被 ban 很久了, 所以也無法真正上戰場感受一下現在認證圖到底改成怎樣.. @@ 不過看了一下板上的討論串後, 大致歸納如下: 現在認證圖即使可能是用一定規則生成的,(前景 + 背景?) 但總數量太多,照原先建資料庫的方式的話 流量太大 server 會負荷不了; 又想要寫出圖片自動辨識的程式的話, 技術層級高到幾乎遙不可及。 我有個不知道可不可行的想法: 在推廣版的程式(例如α系列)中設定 每遇到認證圖的話就將整張圖片檔傳到一個 server 上, 然後寫個簡單的 PHP 介面, 讓閒閒沒事做的人來此瘋狂解碼, (有心一點的話可以設計成緊張刺激的打字遊戲) 然後再將解答傳回推廣版程式的用戶端。 幾個執行要點是: 1. 不要再建立圖片資料庫, 因為數量太多資料庫傳遞困難。 如果圖片的重複率還有一定的水準的話 可以考慮僅將資料庫建立在 server 端就好, 當推廣版程式將圖片傳回此 server 時先行比對資料庫, 如果已有答案就直接回傳不要送入打字遊戲。 2. 推廣版程式端不要再略過圖片, 將認證圖傳到 server 後等待至有答案傳回再送出到 click^3 網頁, 或許可以減少被 ban 的風險? 會有此想法主要因為很多人還是想要掛著自動點擊程式就不理它了, 尤其是睡覺或外出的時候, 但同樣的也會又另一群人閒閒沒事可以一直手動輸入認證圖, 但每認證通過一次後點幾百下要幾分鐘的時間都浪費掉了, 我猜測應該會有足夠的人力來完成集中解碼的工作。 另外,這個方法最擔心的應該還是 最重要的那台 server 撐不撐的住的問題, 我想其實一個認證碼的小圖不過幾 KB(?),(被 ban 看不到 ><) 比起幾個 MB 的「愛台灣.txt」應該算是還好的, 或許可請高手稍微仔細的估計一下流量, 如果覺得可行的話再進一步的實行。 (而回傳的認證碼只有 3~5 個位元組應該是不成問題。) 又推廣版程式端亦可將認證圖以更高的壓縮率 (JPEG 的壓縮率或 GIF 的顏色數) 進一步壓縮後再傳上 server , 可以再減少些流量, 但前提是更高的壓縮率不可到妨礙判讀的地步, 只是現在很多圖都已經很難判讀了, 再壓縮可能會更糟, 因此這方面的成效可能有限。 不好意思光說不練說了一大堆, 如果有熱心的程式強者看到的話可以提供給你們參考一下, 如果沒有就當作我整篇在廢話吧...... @@" 謝謝大家看完。 :) -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.243.130

06/24 00:34, , 1F
壓縮hash會一樣嗎?
06/24 00:34, 1F

06/24 00:34, , 2F
剛剛算了一下 如果只有1組組合 最少有40萬筆資料= =
06/24 00:34, 2F

06/24 00:34, , 3F
原圖已經像被狗咬過的...在壓縮的話...(默
06/24 00:34, 3F

06/24 00:35, , 4F
這樣做那台server真的很操....
06/24 00:35, 4F

06/24 00:36, , 5F
總覺得和4010篇日本提出的方法有異曲同工之妙 XD
06/24 00:36, 5F

06/24 00:36, , 6F
新碗糕會把看過的認證圖都存到硬碟裡 XD
06/24 00:36, 6F

06/24 00:37, , 7F
阿髮在辨識的時候會比對taiwan.txt裡的資料嗎?
06/24 00:37, 7F

06/24 00:40, , 8F
說不定透過適當的圖片修改,圖片會更容易辨別呢..
06/24 00:40, 8F

06/24 01:07, , 9F
這個概念很棒呀 可以充分利用人力 又節省大部分人的時間
06/24 01:07, 9F
文章代碼(AID): #16VKjKUF (HOT_Game)
文章代碼(AID): #16VKjKUF (HOT_Game)