Re: [FB] 創世神ptt:鄉民自製五毛大數據分析已回收

看板Gossiping作者 (勝者的迷思)時間5年前 (2018/10/15 01:06), 編輯推噓27(28130)
留言59則, 34人參與, 5年前最新討論串6/10 (看更多)
最近有些網路安全廠商在推一種人工智能的「寫作風格分析」。 買帳號不難,要雇用少數人去操作幾千上萬的帳號,甚至是二十四小 時輪班駐點玩輿論轟炸都不難。 但是有一個東西是幾乎無法被複製的,那就是寫作風格。 我記得這幾天有些耐人尋味的新聞。一個是參議員馬侃過世時,紐約 時報上發表了一篇紀念馬侃、批評川普的匿名投書。結果有研究者把 這篇投書丟去做寫作風格分析,發現這篇文章的寫作風格竟然跟副總 統彭斯(或是他的文膽,whatever)非常相似。一時引發喧然大波。 另一個比較沒那麼新的新聞是,中國有人把《紅樓夢》一百二十回丟 下去做一個簡單的詞語頻率分析。結果得出了前八十回和後四十回確 實是不同人的寫作風格,從旁佐證了「前八十回出自曹雪芹、後四十 回是高鶚所續」的假說。 我不是機器學習專家,但上述的分析技巧並不難,而且日益精進。如 果我們用爬文機器人,把批踢、臉書和水管上面數以萬計的推文丟進 去分析,說不定會有一些有趣的發現呢? 把新聞轉貼或「1124滅東廠」這種已經成為複製貼上的口號先剃 除掉不管,專挑長度夠長的推文來看,我們會不會發現,同一個帳號 底下出現好幾個不同的寫作風格(意味著這個帳號有好幾個人在輪班 使用),或是成千上萬個帳號連結到同一個寫作風格(意味著一個寫 手操作好多個帳號),甚至是公關公司的暗稿呢? 如果版上有擅長機器學習且願意投入時間的朋友,說不定可以往這個 方向去探索看看。 ※ 引述《Forthelife (我認為暱稱一定要全填滿)》之銘言: : ※ 引述《AKIRATOYA (OOOO)》之銘言: : : FB卦點說明:(繁體中文 20 個字) : : 創世神開示了 : : 可能最近五毛入侵狀況太嚴重 : : 連創世神都看不下去了 : : 分享五毛大數據分析 : : FB連結: : : https://www.facebook.com/PTT.TU : : FB內容: : : 鄉民自製五毛大數據分析 : : https://www.ptt.cc/bbs/Gossiping/M.1539511358.A.6F0.html : 這挺厲害 : 結果我的圖長這樣 : http://i.imgur.com/y4WEE1B.jpg
: 所以我是異於常人? : 我用手機操作很方便啊 : 點進去屁個幾句再退出程式輕輕鬆鬆 : 我覺得是網軍的重點有兩個 : 1.作息異常規律 : 上班到下班清清楚楚 : 像有一張就是7點到12點吃飯 : 1開工到9點 : 而且每一天都這樣 : 誰上PTT會這麼有規律? : 強迫症嗎? : 2.以前發文或關注的板或推文異於「現在」 : 像是有個綠黨工出來爆料,結果用的前任使用者是藍營持者什麼的,挺好笑 : 重點是熱衷八卦版不好嗎? : 一定要「這個人上線好少,而且只回應貓貓圖,沒有碰觸髒髒的政治,真是個乖寶寶」 : 這種才有資格在這裡? : 我並未否定這程式的偉大或鄉民的熱心及能力 : 更不可能質疑「創世神」的意見 : 但我不免擔心在不斷剷除「異類」時,八卦版也漸漸的和對岸的論壇一樣了 : 那種,嗯,你好我好大家好,大家都是乖寶寶 : 的思想和言論 : 在一定的時間發固定的文章,文章內容「適宜詼諧有趣而不過激引人反感」才是八卦板的模範之類的 : 我擔心真要認真搞「秩序」及「條規」那一套,勢必就會像對岸國家一樣 : 要不以後發言先調查IP再檢測推文時間次數 : 下次再搞點言論審查?嗯,挺完美 : 我誠摯希望八卦版充滿混亂,因為流動的水最難添上顏色,就算一時紅起來也註定退去 : 但如果有人把水龍頭關了,努力的想「淨化」這攤死水,那除了拖延污染的時間外沒有半點用處 : 我懇切的希望八卦版充滿黑暗自私及醜惡,即使是最可笑荒謬毫無用處及邏輯的言論我也希望它存在,因為那告訴我這裡是多麼真實 : 我不會用手機發錢,但我仍然希望這份讓八卦板變「好」的心情能傳播給每一位 : ———————————————— : http://i.imgur.com/sdlnmsj.jpg
: http://i.imgur.com/BJKSnJR.jpg
: http://i.imgur.com/NTRw09D.jpg
: ----- : Sent from JPTT on my Samsung SM-G955F. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.103.130.219 ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1539536803.A.A44.html

10/15 01:08, 5年前 , 1F
有喔有喔 有人就是喜歡推文回一拖拉庫
10/15 01:08, 1F

10/15 01:08, 5年前 , 2F
不是自開篇新的
10/15 01:08, 2F

10/15 01:09, 5年前 , 3F
那不就是廠工體嗎
10/15 01:09, 3F

10/15 01:09, 5年前 , 4F
你不知道的xxx ,xxx不讓你知道的xxx,
10/15 01:09, 4F

10/15 01:09, 5年前 , 5F
xxx沒告訴你的事
10/15 01:09, 5F

10/15 01:09, 5年前 , 6F
脈絡都差不多 然後用不同帳號發
10/15 01:09, 6F

10/15 01:09, 5年前 , 7F
古龍體 XD
10/15 01:09, 7F

10/15 01:11, 5年前 , 8F
直接機器人發文推文風格就可以做到一致了
10/15 01:11, 8F

10/15 01:11, 5年前 , 9F
AI帶風向革命
10/15 01:11, 9F

10/15 01:11, 5年前 , 10F
Ptt紅了之後就被搞爛了 各方網軍都進來
10/15 01:11, 10F

10/15 01:12, 5年前 , 11F
帶風向 還不只八卦板
10/15 01:12, 11F

10/15 01:12, 5年前 , 12F
AI風向革命!!
10/15 01:12, 12F

10/15 01:12, 5年前 , 13F
厲害了 你的綠
10/15 01:12, 13F

10/15 01:13, 5年前 , 14F
慘惹 以後沒500可以領惹
10/15 01:13, 14F

10/15 01:13, 5年前 , 15F
哈哈,會不會以後雙方都用AI筆戰啊
10/15 01:13, 15F

10/15 01:13, 5年前 , 16F
有的人都一個版一個人格惹 有差逆
10/15 01:13, 16F

10/15 01:13, 5年前 , 17F
同學會22人體啊 不管22個人誰發都長一樣
10/15 01:13, 17F

10/15 01:15, 5年前 , 18F
而且還有一些文風是有人在模仿的
10/15 01:15, 18F

10/15 01:16, 5年前 , 19F
還有反串仔體 9.2科粉的強項
10/15 01:16, 19F

10/15 01:16, 5年前 , 20F
再不抓多重分身 PTT遲早會被搞爛
10/15 01:16, 20F

10/15 01:17, 5年前 , 21F
反串 反反串 反反反串 QQ
10/15 01:17, 21F

10/15 01:20, 5年前 , 22F
不同ID但文章風格一樣比較好抓
10/15 01:20, 22F

10/15 01:21, 5年前 , 23F
彭斯那根本抹黑,他一向是比川皇更硬
10/15 01:21, 23F

10/15 01:21, 5年前 , 24F
的新教基督徒,是最挺川的人了
10/15 01:21, 24F

10/15 01:22, 5年前 , 25F
反甲連很明顯,少人控制一大群id
10/15 01:22, 25F

10/15 01:23, 5年前 , 26F
講廢話膩 顯卡先贊助一張辣
10/15 01:23, 26F

10/15 01:24, 5年前 , 27F
1124滅東廠
10/15 01:24, 27F

10/15 01:25, 5年前 , 28F
那個CxxxC就很明顯是多人持有
10/15 01:25, 28F

10/15 01:26, 5年前 , 29F
10/15 01:26, 29F

10/15 01:27, 5年前 , 30F
可以
10/15 01:27, 30F

10/15 01:27, 5年前 , 31F
那個正黑板友做的好處 就是把不同時候
10/15 01:27, 31F

10/15 01:27, 5年前 , 32F
持有同IP這種傳統上不算分身的東西看見了
10/15 01:27, 32F

10/15 01:28, 5年前 , 33F
所以一抓包反而是藍色狂勝綠色
10/15 01:28, 33F

10/15 01:28, 5年前 , 34F
很好奇這種「文章風格」的判斷依據跟準
10/15 01:28, 34F

10/15 01:29, 5年前 , 35F
這反而證明綠營沒錢(或是說光頭根本沒想
10/15 01:29, 35F

10/15 01:29, 5年前 , 36F
過要贏)
10/15 01:29, 36F

10/15 01:30, 5年前 , 37F
包含用語習慣 分段 上色這些吧
10/15 01:30, 37F

10/15 01:34, 5年前 , 38F
中文不太可能做到風格分析 很多反諷句不
10/15 01:34, 38F

10/15 01:34, 5年前 , 39F
好判斷是真讚美還是反諷
10/15 01:34, 39F

10/15 01:39, 5年前 , 40F
樓上你覺得紅樓夢是不是中文?
10/15 01:39, 40F

10/15 01:39, 5年前 , 41F
誰說的? 你以為只有中文有這種語意跟文
10/15 01:39, 41F

10/15 01:39, 5年前 , 42F
體? 是不是又在自嗨中文很艱深?
10/15 01:39, 42F

10/15 01:40, 5年前 , 43F
這也要吵 詞語頻率分析 是不是很難懂?
10/15 01:40, 43F

10/15 01:40, 5年前 , 44F
真正不能分析的是用翻譯過的文章然後找
10/15 01:40, 44F

10/15 01:40, 5年前 , 45F
中文應該做不到ai分析
10/15 01:40, 45F

10/15 01:40, 5年前 , 46F
原文的寫作風格吧?
10/15 01:40, 46F

10/15 01:41, 5年前 , 47F
數據又沒法讀中文 要另外寫
10/15 01:41, 47F

10/15 01:41, 5年前 , 48F
太龐大了 有些還沒電子化會亂碼
10/15 01:41, 48F

10/15 01:43, 5年前 , 49F
現在就純粹停留在找單詞
10/15 01:43, 49F

10/15 01:48, 5年前 , 50F
用ai筆戰的時代來臨了
10/15 01:48, 50F

10/15 01:56, 5年前 , 51F
這個難度比做這個工具高太多了 XD
10/15 01:56, 51F

10/15 02:04, 5年前 , 52F
馬政府時代 不是出過龍應台體讀者投書
10/15 02:04, 52F

10/15 03:23, 5年前 , 53F
趕快把那堆DPP黨工帳號抓出來退註
10/15 03:23, 53F

10/15 04:09, 5年前 , 54F
== 不要阿 這樣無腦仇同的就無法生存了 ==
10/15 04:09, 54F

10/15 11:48, 5年前 , 55F
這篇好
10/15 11:48, 55F

10/15 11:49, 5年前 , 56F
這類意見是每個陣營都會受到檢視,
10/15 11:49, 56F

10/15 11:49, 5年前 , 57F
而不是一直有無腦黨工一直在抹柯粉
10/15 11:49, 57F

10/15 11:49, 5年前 , 58F
通通親中共。
10/15 11:49, 58F

10/15 12:11, 5年前 , 59F
中文做不到AI分析= =? 一堆人在做啊
10/15 12:11, 59F
文章代碼(AID): #1RmtUZf4 (Gossiping)
討論串 (同標題文章)
本文引述了以下文章的的內容:
以下文章回應了本文
完整討論串 (本文為第 6 之 10 篇):
文章代碼(AID): #1RmtUZf4 (Gossiping)