Re: [新聞] 搶太妍門票僅須4秒!警破獲首宗AI搶票黃牛 逮30歲台大畢

看板Gossiping作者 (charlesgg)時間8月前 (2023/09/08 07:46), 8月前編輯推噓9(10110)
留言21則, 9人參與, 8月前最新討論串2/2 (看更多)
阿肥外商碼農阿肥啦! 其實就是使用langchain加上類GPT 3.5-4(當前很多開源的,一張4090就可以運行起來), 透過模型輔助加上langchain可以直接接上Google等搜索引擎或特定網站解鎖語言模型讀 取最新資訊的能力,這樣就可以規避掉官方要識別人類(粉絲?)的特殊問題。 然後圖片驗證識別這個目前就被玩爛開源Acc都可以到99%以上了,基本上你想用CNN或swi n transformer來做效果都非常好。 至於自動爬蟲程式,阿肥最近也再跟公司的爬蟲同事一起研究有打算搜集一些人類點擊速 度跟滑動速度的資訊讓模型學習一些策略做反防爬蟲,這個我印象中也是有幾篇論文在研 究只是不多,主要是搜集人類瀏覽軌跡的資料比較困難,而且要搜集這東西要做也只能暗 著做。 差不多4醬 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 49.216.90.41 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1694130400.A.749.html

09/08 07:49, 8月前 , 1F
可是他五年前就開始了耶
09/08 07:49, 1F
五年前圖片驗證技術就很成熟了,中間也可能優化他的爬蟲程式啊

09/08 07:49, 8月前 , 2F
問題是賣黃牛有罪....
09/08 07:49, 2F
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:51:36

09/08 07:50, 8月前 , 3F
那如果用程式自己搶會有罪嗎
09/08 07:50, 3F

09/08 07:51, 8月前 , 4F
不是你搞這個能賺嗎 拿去弄量化模型不是比
09/08 07:51, 4F

09/08 07:51, 8月前 , 5F
較好?
09/08 07:51, 5F

09/08 07:51, 8月前 , 6F
量化交易
09/08 07:51, 6F
搶票這個我不知道,不過反防爬蟲公司一直有這個需求啊,反反防爬蟲也是一個剛需。 ※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 07:55:11

09/08 07:56, 8月前 , 7F
反爬蟲又能兼顧使用者體驗搞 爆賺吧
09/08 07:56, 7F

09/08 07:58, 8月前 , 8F
這個窪地網站最擅長了 各種奇葩反爬蟲
09/08 07:58, 8F

09/08 07:59, 8月前 , 9F
不過我猜都會搞到使用者不爽
09/08 07:59, 9F

09/08 08:00, 8月前 , 10F
以前google打一大串文字最不爽 現在好多了
09/08 08:00, 10F

09/08 08:02, 8月前 , 11F
Selenium 就行了。為什麼要用到AI?
09/08 08:02, 11F
主要是Selenium的點擊模式很好識別啊,就算是你設定一個亂數隨機也很好抓,抓到就直 接band掉ip,又不是每個人都有幾萬組IP可以使用的。 ※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:08:11

09/08 08:07, 8月前 , 12F
好奇圖形驗證碼需求單純用CNN現成package
09/08 08:07, 12F

09/08 08:07, 8月前 , 13F
能不能做到 還是需要自己蒐集圖形資料貼
09/08 08:07, 13F

09/08 08:07, 8月前 , 14F
標籤train
09/08 08:07, 14F
可以直接用市面開源框架的OCR模型,連gpu 不用可以直接用cpu推理不用1秒就有結果, 實測直接拿他們官網提供的模型跟常見的圖形驗證就有9成命中率了,我推測他們也是有 拿那些數據加上大量其他的圖片文件去練蠱,所以效果連微調都不用。

09/08 08:13, 8月前 , 15F
自己搶沒問題 加價賣有罪
09/08 08:13, 15F
※ 編輯: sxy67230 (49.216.90.41 臺灣), 09/08/2023 08:17:06

09/08 08:23, 8月前 , 16F
自己搶一樣有罪,文創法10-1
09/08 08:23, 16F

09/08 08:36, 8月前 , 17F
了解 感謝大大解答!
09/08 08:36, 17F

09/08 09:15, 8月前 , 18F
好奇javascript腳本的點擊模式也很好
09/08 09:15, 18F

09/08 09:15, 8月前 , 19F
抓嗎?搭配chrome的擴充功能也能做出i
09/08 09:15, 19F

09/08 09:15, 8月前 , 20F
sTrusted = true的click,應該不好抓
09/08 09:15, 20F

09/08 09:15, 8月前 , 21F
嗎?
09/08 09:15, 21F
文章代碼(AID): #1a-c3WT9 (Gossiping)
文章代碼(AID): #1a-c3WT9 (Gossiping)