Re: [爆卦] i'Analyseur 新工具 爆文警示器已回收

看板Gossiping作者 (orz)時間7年前 (2018/11/15 20:49), 7年前編輯推噓4(513)
留言9則, 6人參與, 7年前最新討論串2/18 (看更多)
※ 引述《ckckcck5577 (一堆神經病)》之銘言: : ※ [本文轉錄自 HatePolitics 看板 #1RxKzk1K ] : 作者: pohor (pohor) 看板: HatePolitics : 標題: [爆卦] i'Analyseur 新工具 爆文警示器 : 時間: Thu Nov 15 18:50:18 2018 : 安 打給後 : 阿肥我又來了 這次帶來新的分析工具 : ★㊣↙ i'Analyseur a 爆文警示器 ↗㊣☆ : https://www.ianalyseur.org/trend/ : 阿肥一直在想,從推文有沒有辦法系統化的找出帶風向的端倪呢? : 經過7749天的辛苦研發,終於讓阿肥頓悟啦 : 直接講案例 : 請看 http://bit.ly/2A3ZwRJ : 如果你不想開google drive 以下是部分截圖 : https://i.imgur.com/MYVObpe.png
: 簡單說,這裡列出四篇文章 : 裡面有超過10個帳號,在發文的20分鐘之內,用幾乎一樣的順序推文 : 要知道八卦版這一年內有發文推噓文的帳號共有約12萬個 : 要出現相同10個帳號用一樣的順序推文的機率約是12萬的10次方,比中100次大樂透還難 : 更何況是有超過4篇的文章有這種現象 ( 有興趣的網友可以自己查查看,遠超過四篇) 幫補充下...這邊機率錯蠻大的 推文順序一樣的機率會跟總文章數有關 國中應該都算過班上人數超過多少時,有50%機率至少有兩人生日一樣 隨便抓10個帳號,他們在N篇文章中至少兩篇文章中推文順序相同的機率 P(在N篇文章中至少有兩篇文章中推文順序相同) = 1-P(在N篇文章中所有推文順序相異) 10個帳號有3628800種排列組合方式 = 1-(1 * 3628799/3628800 * 3628798/3628800......(3628800-(N-1)/3628800) ) = 1-( (3628800!/(3628800-N)!/3628800N) 假設N=2000 = 1-0.5767 = 0.42 特定10個ID,在2000篇文章中42%機率順序會一樣 不過大前提是他們都有在這2000篇中出現 光是會出現推文就是一個重大意義,就算某C開頭的柯黑也沒有每篇都出現 時間鄰近程度、議題接近才是最重要的指標 : 還是在發文20分鐘之內 : 以機率來說這非常不合理 : 在google drive的那個sheet共列出4篇文章 : 我保留了該段區間的其他推文者,避免又被說阿肥我造假了 : 如果原文被砍,別擔心還有備份站都幫您準備好了 : 異常的推文用橘色標注,並標上編號 : 以第一篇來說 : 編號 1 是 kopak0910,下一個推的是 k418026 但是他是插花的,所以沒有標橘色 : 再往下編號 2 是 lim15015,... 依此類推 總共有 13個標橘色的可疑帳號參與 : 第二篇也可以看到 kopak0910 -> lim15015 -> jason31831… : 同樣的順序只是中間插花的人不同 : 第三篇也維持一樣的順序,但是編號8的 B0091309 這次沒有參與 : 第四篇編號4, 6 的順序稍微有點亂,其餘則維持原來的順序 : 這麼低的機率,都發生在某個特定的議題上 : 這不是帶風向,那什麼才是帶風向呢? 其實這個問題網軍以後只要增加殭屍帳號數量就好 ex: 網軍數量增加5倍 C(100,10) -> C(500,10) 重複機率就從等比級數下降了 直接實名制,ban掉非台灣使用者就好 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.135.14.139 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1542286184.A.8F1.html ※ 編輯: orze04 (220.135.14.139), 11/15/2018 20:52:07

11/15 20:50, 7年前 , 1F
先抓出狀況 然後回去看raw data吧
11/15 20:50, 1F
異常爆文檢測是一個快速篩選,最後資料還是得要人工判讀 ※ 編輯: orze04 (220.135.14.139), 11/15/2018 20:54:05

11/15 20:52, 7年前 , 2F
成本太高吧 養不了那麼多八卦帳號
11/15 20:52, 2F

11/15 21:11, 7年前 , 3F
現在是欺負我高中機率沒有聽嗎
11/15 21:11, 3F

11/15 21:50, 7年前 , 4F
專業
11/15 21:50, 4F

11/15 21:51, 7年前 , 5F
時間鄰近、議題相近,使用者又剛好在線上
11/15 21:51, 5F

11/15 21:51, 7年前 , 6F
那很有很高機率會有同樣帳號的相同推文順序
11/15 21:51, 6F

11/15 22:56, 7年前 , 7F
推實名制~
11/15 22:56, 7F

11/16 11:39, 7年前 , 8F
改用自然人憑證才能發文好了,保證本國
11/16 11:39, 8F

11/16 13:08, 7年前 , 9F
你是不是以為台灣人就不會帶風向?
11/16 13:08, 9F
文章代碼(AID): #1RxMjeZn (Gossiping)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 18 篇):
文章代碼(AID): #1RxMjeZn (Gossiping)