Re: [爆卦] 異常爆文分析器V1.0已回收

看板Gossiping作者 (吱吱拉屎生蛆蛆)時間5年前 (2018/11/06 18:27), 編輯推噓6(825)
留言15則, 14人參與, 5年前最新討論串2/4 (看更多)
我直接說結論 韓國人大量運用網軍 國民黨好可惡 我們含淚投給民進黨吧 ※ 引述《clothg34569 (提拉米蘇冰淇淋)》之銘言: : 大家安安,八卦板首PO,如果有違反板規麻煩告知一下,我再修改 : 0.前言: : 就,最近想說拿八卦版來玩玩爬蟲,又看到一堆人說八卦有異常爆文的情形 : 所以就寫了個異常爆文分析器來當練習 : 1.介紹: : 先上GIT,Code和Readme都放在這了 : https://github.com/Daniel34569/PTTCrawler : 首先我們先定義一下異常爆文 : 我先定義為:在短時間內有不合常理大量推文的就算 : 至於時間多短,大量是多大量就因人而異,因此都當作輸入的參數 : 2.使用套件: : 我是使用Python以及PTTLibrary為主來進行爬蟲 : 如果要使用的話需要安裝Python及使用的套件(git上有列出) : 沒有製作成EXE檔是因為我這版本Python製作EXE剛好會報錯,我又懶得解決 : 而且我也懶得找免空來存 : 3.執行過程: : 在settings中輸入好參數之後 : 會開始列出範圍中符合自定義的異常爆文的標題、編號 : 以及第25/50/75則推文與發文時間之間的差距 : ...其實應該要把結果存起來或者是把檔案存起來省時間啦 : 如果有需求我在改版好了:) : 4.執行結果: : 這是試著跑八卦版第770000到780000這一萬則文章中 : 第25個推文與發文時間的間隔小於5分鐘的結果 : 其中Error是發文者不小心改到時間或者因為其他原因讓格式跑掉 : https://i.imgur.com/x7USUcU.png
: https://i.imgur.com/SNFZOh2.png
: https://i.imgur.com/vMrSGbr.png
: https://i.imgur.com/mSvjwzC.png
: https://i.imgur.com/o00pnww.png
: https://i.imgur.com/Dvv2mOD.png
: 5.後記: : 不用Z過濾出目標推文數之後再分析的原因是避免有人故意歸零 : 另外,這只是整理出符合這些條件的文章,要怎麼解讀就...我對統計比較不熟啦 : 有任何可以改進的地方希望可以推文/箭頭提出,包括程式設計上可以改善的部分XD : 謝謝大家:) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.34.51 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1541500044.A.03D.html

11/06 18:28, 5年前 , 1F
你說反了
11/06 18:28, 1F

11/06 18:29, 5年前 , 2F
真是可憐
11/06 18:29, 2F

11/06 18:30, 5年前 , 3F
哈哈 怕囉??
11/06 18:30, 3F

11/06 18:30, 5年前 , 4F
XD民進黨果然都是雜碎
11/06 18:30, 4F

11/06 18:30, 5年前 , 5F
別崩潰好嗎
11/06 18:30, 5F

11/06 18:30, 5年前 , 6F
連這樣都要酸一篇,可憐。
11/06 18:30, 6F

11/06 18:31, 5年前 , 7F
哈!笑死
11/06 18:31, 7F

11/06 18:33, 5年前 , 8F
這樣反串自介不行喔
11/06 18:33, 8F

11/06 18:34, 5年前 , 9F
韓粉崩潰QQ
11/06 18:34, 9F

11/06 18:35, 5年前 , 10F
你是韓導派來反串的吧~我廠有那麼弱?
11/06 18:35, 10F

11/06 18:37, 5年前 , 11F
同意
11/06 18:37, 11F

11/06 18:38, 5年前 , 12F
被異常推暴的,幾乎都跟韓導有關
11/06 18:38, 12F

11/06 18:38, 5年前 , 13F
可撥 你反串吧
11/06 18:38, 13F

11/06 19:07, 5年前 , 14F
廠廠萬歲
11/06 19:07, 14F

11/06 19:36, 5年前 , 15F
罵韓的文都馬上就爆啊
11/06 19:36, 15F
文章代碼(AID): #1RuMoC0z (Gossiping)
文章代碼(AID): #1RuMoC0z (Gossiping)