Re: [爆卦] 異常爆文分析器V1.0已回收

看板Gossiping作者 (專業單身G_SHIPPING1產出)時間5年前 (2018/11/06 19:07), 5年前編輯推噓8(11318)
留言32則, 18人參與, 5年前最新討論串4/4 (看更多)
https://i.imgur.com/eLywJyS.jpg
我猜應該很快就會有人分析soyud12吧 11/4的前25推 https://i.imgur.com/PbEd8iW.jpg
https://i.imgur.com/lEBfDab.jpg
11/6的前25推 https://i.imgur.com/fAX2cXG.jpg
https://i.imgur.com/8f2dkDa.jpg
其實5分鐘內25推不太難吧 我看到爆掛被噓到xx也會先進去看看內容是啥 ※ 引述《clothg34569 (提拉米蘇冰淇淋)》之銘言: : 大家安安,八卦板首PO,如果有違反板規麻煩告知一下,我再修改 : 0.前言: : 就,最近想說拿八卦版來玩玩爬蟲,又看到一堆人說八卦有異常爆文的情形 : 所以就寫了個異常爆文分析器來當練習 : 1.介紹: : 先上GIT,Code和Readme都放在這了 : https://github.com/Daniel34569/PTTCrawler : 首先我們先定義一下異常爆文 : 我先定義為:在短時間內有不合常理大量推文的就算 : 至於時間多短,大量是多大量就因人而異,因此都當作輸入的參數 : 2.使用套件: : 我是使用Python以及PTTLibrary為主來進行爬蟲 : 如果要使用的話需要安裝Python及使用的套件(git上有列出) : 沒有製作成EXE檔是因為我這版本Python製作EXE剛好會報錯,我又懶得解決 : 而且我也懶得找免空來存 : 3.執行過程: : 在settings中輸入好參數之後 : 會開始列出範圍中符合自定義的異常爆文的標題、編號 : 以及第25/50/75則推文與發文時間之間的差距 : ...其實應該要把結果存起來或者是把檔案存起來省時間啦 : 如果有需求我在改版好了:) : 4.執行結果: : 這是試著跑八卦版第770000到780000這一萬則文章中 : 第25個推文與發文時間的間隔小於5分鐘的結果 : 其中Error是發文者不小心改到時間或者因為其他原因讓格式跑掉 : https://i.imgur.com/x7USUcU.png
: https://i.imgur.com/SNFZOh2.png
: https://i.imgur.com/vMrSGbr.png
: https://i.imgur.com/mSvjwzC.png
: https://i.imgur.com/o00pnww.png
: https://i.imgur.com/Dvv2mOD.png
: 5.後記: : 不用Z過濾出目標推文數之後再分析的原因是避免有人故意歸零 : 另外,這只是整理出符合這些條件的文章,要怎麼解讀就...我對統計比較不熟啦 : 有任何可以改進的地方希望可以推文/箭頭提出,包括程式設計上可以改善的部分XD : 謝謝大家:) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.120.9.160 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1541502471.A.14E.html

11/06 19:08, 5年前 , 1F
事實
11/06 19:08, 1F

11/06 19:10, 5年前 , 2F
ㄏ公
11/06 19:10, 2F

11/06 19:10, 5年前 , 3F
兩分鍾內25推 廠工完全不想掩飾了
11/06 19:10, 3F

11/06 19:11, 5年前 , 4F
都不一樣的人不是嗎? 而且裡面好幾個都
11/06 19:11, 4F

11/06 19:11, 5年前 , 5F
最近白天這種文,不論藍綠都會爆
11/06 19:11, 5F

11/06 19:11, 5年前 , 6F
認識的
11/06 19:11, 6F
我先說我沒有說這兩篇的前25推這些人 肯定是網軍

11/06 19:11, 5年前 , 7F
沒在跟你演了
11/06 19:11, 7F

11/06 19:11, 5年前 , 8F
賄選王跟龍虎王 不要跟我說不認識
11/06 19:11, 8F

11/06 19:12, 5年前 , 9F
給力==跟他們認真你就輸了
11/06 19:12, 9F

11/06 19:12, 5年前 , 10F
不認識那兩個的我反而才懷疑是黨工
11/06 19:12, 10F

11/06 19:12, 5年前 , 11F
一群人還在政黑 自慰
11/06 19:12, 11F

11/06 19:12, 5年前 , 12F
好啦 哼 去隔壁臭版看六花尻 掰掰
11/06 19:12, 12F

11/06 19:13, 5年前 , 13F
他應該是網軍沒錯 只是他的文都很精準
11/06 19:13, 13F
PO文的應該是網軍沒錯 推文的很難抓

11/06 19:13, 5年前 , 14F
soyud12可是連jacklyl都認為是網軍耶XDDD
11/06 19:13, 14F
※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:15:13

11/06 19:14, 5年前 , 15F
這就黨工沒什麼好猜了吧
11/06 19:14, 15F

11/06 19:14, 5年前 , 16F
應該說不是網軍的話 資料也看得太廣
11/06 19:14, 16F

11/06 19:16, 5年前 , 17F
整天在抓五毛 但是看到綠營黨工卻好歡
11/06 19:16, 17F

11/06 19:16, 5年前 , 18F
迎 唉
11/06 19:16, 18F

11/06 19:20, 5年前 , 19F
打預防針喔? 照出來大家看看就知道
11/06 19:20, 19F
啥預防針??? soyud12他的文很明顯阿 要打預防針不是該抓那些還沒被找到的嗎XD

11/06 19:20, 5年前 , 20F
看前面數字點文的人+1
11/06 19:20, 20F
※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:22:25

11/06 19:23, 5年前 , 21F
廠工的ID整個八卦版抽問大家都背得出來
11/06 19:23, 21F

11/06 19:23, 5年前 , 22F
哈哈 抓到
11/06 19:23, 22F

11/06 19:24, 5年前 , 23F
一個一個都別想跑
11/06 19:24, 23F
導工的ID我也覺得很多阿~ 不會以為只有民進黨有網軍吧? 國民黨最好是有那麼溫順良淑~ ※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:25:45

11/06 19:26, 5年前 , 24F
沒抓到Cindy嘛
11/06 19:26, 24F
他都姍姍來遲 但很有毅力XD 11/2 原本那篇208噓 後來有人朝聖推了之後 他補噓到11/3的晚上11點 噓了快兩天~ 實際應該230~250噓之間吧 https://i.imgur.com/ZV4tccz.jpg
※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:28:07

11/06 19:27, 5年前 , 25F
五毛網軍才是重點抓的
11/06 19:27, 25F
※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:31:33

11/06 19:29, 5年前 , 26F
和藍或綠網軍不同 紅網軍是名副其實的敵
11/06 19:29, 26F

11/06 19:30, 5年前 , 27F
人啊 而且並沒有確實抓起來
11/06 19:30, 27F

11/06 19:38, 5年前 , 28F
罵韓的文都馬上就爆啊,民進黨最讓人
11/06 19:38, 28F

11/06 19:39, 5年前 , 29F
討厭的就是做賊喊捉賊,兩套標準
11/06 19:39, 29F

11/06 19:41, 5年前 , 30F
奇怪前25推有韓粉欸
11/06 19:41, 30F

11/06 19:45, 5年前 , 31F
很明顯啊 廠公急了
11/06 19:45, 31F
韓粉不急嗎XD 當真所有韓粉都是義勇軍? ※ 編輯: Saber92 (59.120.9.160), 11/06/2018 19:48:06

11/06 22:33, 5年前 , 32F
廠公出征
11/06 22:33, 32F
文章代碼(AID): #1RuNO75E (Gossiping)
文章代碼(AID): #1RuNO75E (Gossiping)