Re: [爆卦] Redmango已經卸任

看板Gossiping作者 (摸魚中)時間4年前 (2019/09/18 19:16), 4年前編輯推噓15(16144)
留言61則, 20人參與, 4年前最新討論串74/82 (看更多)
※ 引述《pponywong (pony)》之銘言: : 這篇吵到現在 稍微給大家科普一下 : 要怎麼做人工AI篩選演算法 : 要把大量數據歸納成 簡單的指標 有幾個方法 : 一個是 PCA (principal component analysis) 主成分分析 : 一個是 FA (factor analysis) 因素分析 : 兩個方法很類似 一個是歸納(PCA) 一個是推導(FA) : PCA 數學上來講就是 找出資料(關聯矩陣)的本徵值 本徵向量(eigenvalue, eigenvector) 對AI不熟,不過你講的內容應該只是資料分析 還是你指的是人工(Manual) AI(Artificial Intelligence)? 另外eigenvalue我們一般翻譯成特徵值 基本上如果要用AI來抓網軍 除了用爬蟲程式把ptt的文抓下來分析特徵(關鍵字,推發文時間等等) 標記(label)發推文特徵,還有紀錄登入ip、時間等等外 還有一個很重要的工作: 標註網軍(或是疑似網軍) 抓文爬蟲可以用程式,但是 標記(label)文章特徵則需要人去閱讀標記 不是少數一兩個人可以完成的工作 另一方面,如果是用檢查登入ip時間來找網軍作為訓練data還好 如果紅芒果是用人工來選出網軍(或是疑似網軍)的訓練data 那他們訓練出來的AI也不過是紅芒果二號罷了 -- The whole problem with the world is that fools and fanatics are always so certain of themselves, but wiser people so full of doubts. – Bertrand Russell -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.116.21.9 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1568805388.A.466.html

09/18 19:18, 4年前 , 1F
有疑問怎麼不自己做一隻來掃
09/18 19:18, 1F

09/18 19:18, 4年前 , 2F
就是人工標記啊
09/18 19:18, 2F

09/18 19:19, 4年前 , 3F
factor analysis的分群定義是人為的
09/18 19:19, 3F

09/18 19:19, 4年前 , 4F
我們做不到阿,紅芒果用的事什麼黑科技?
09/18 19:19, 4F

09/18 19:19, 4年前 , 5F
開放程式碼讓高手檢定一下阿
09/18 19:19, 5F

09/18 19:19, 4年前 , 6F
工人演算法,真人工、智慧
09/18 19:19, 6F

09/18 19:19, 4年前 , 7F
資料分析只是分群 但群的命名時人工
09/18 19:19, 7F

09/18 19:20, 4年前 , 8F
09/18 19:20, 8F

09/18 19:20, 4年前 , 9F
標記也自動化就好 只有一開始要人工分
09/18 19:20, 9F

09/18 19:20, 4年前 , 10F
析出幾個確定異常的ID然後以這些ID為種
09/18 19:20, 10F

09/18 19:21, 4年前 , 11F
另一邊是科技被耽誤了二十年嗎?=_=
09/18 19:21, 11F

09/18 19:21, 4年前 , 12F
子找出有相同特徵的一整串出來
09/18 19:21, 12F

09/18 19:21, 4年前 , 13F
標記都是事後的 PCA FA只能進行分群
09/18 19:21, 13F

09/18 19:21, 4年前 , 14F
他又不是真的要抓,只是當作鬥爭工具
09/18 19:21, 14F

09/18 19:21, 4年前 , 15F
事後針對群的特質再下分組
09/18 19:21, 15F

09/18 19:22, 4年前 , 16F
當然要訓練紅芒果二號,不然抓到自己
09/18 19:22, 16F

09/18 19:22, 4年前 , 17F
沒辦法解釋相同條件為什麼我標誌它沒有標誌
09/18 19:22, 17F

09/18 19:22, 4年前 , 18F
人怎麼玩
09/18 19:22, 18F

09/18 19:22, 4年前 , 19F
命名群也沒有一定標準
09/18 19:22, 19F

09/18 19:22, 4年前 , 20F
不同人去命名 會有不同得結論
09/18 19:22, 20F

09/18 19:23, 4年前 , 21F
紅芒果1號就是沒有任何規律的標誌
09/18 19:23, 21F

09/18 19:23, 4年前 , 22F
有種把標籤的都送檢舉
09/18 19:23, 22F

09/18 19:23, 4年前 , 23F
這不就是類似美國的自動指標分享系統的
09/18 19:23, 23F

09/18 19:23, 4年前 , 24F
低階版?
09/18 19:23, 24F

09/18 19:23, 4年前 , 25F
代PO那邊有講了
09/18 19:23, 25F
看起來的演算法就是人工(Manual) AI 找幾個"自認為重要的特徵",然後造一個函數產生一個數值(社會信用評分?) 權重調整到可以抓到我認為的網軍就 PERFECT 如果發現某個id網軍分數高,但是掃ip記錄抓不到把柄不能處理 就是因為這些網軍很狡猾,列入神奇id

09/18 19:23, 4年前 , 26F
這不是說明用人工嗎? 還扯什麼文字雲
09/18 19:23, 26F

09/18 19:24, 4年前 , 27F
有學過多變量的 都知道這種分析不適
09/18 19:24, 27F

09/18 19:24, 4年前 , 28F
合當黃金標準 只能進行有限度的歸納
09/18 19:24, 28F

09/18 19:25, 4年前 , 29F
特徵值 資料是人工餵的
09/18 19:25, 29F

09/18 19:25, 4年前 , 30F
a板説他用文字雲 R自己說他用算的
09/18 19:25, 30F

09/18 19:26, 4年前 , 31F
資料處理出來的還是資料 還是看人怎麼解讀/
09/18 19:26, 31F

09/18 19:26, 4年前 , 32F
利用
09/18 19:26, 32F

09/18 19:26, 4年前 , 33F
要不特徵是選過的 要不程式有bug 老實說
09/18 19:26, 33F

09/18 19:26, 4年前 , 34F
有bug機率實在不低
09/18 19:26, 34F

09/18 19:28, 4年前 , 35F
而且特徵分析有誤判也是常見 把抓出來的
09/18 19:28, 35F

09/18 19:28, 4年前 , 36F
資料是保守推論用的 不是拿來鬥人的
09/18 19:28, 36F

09/18 19:28, 4年前 , 37F
我出差或出國玩罵柯文哲就變跳板幫了 白癡
09/18 19:28, 37F

09/18 19:28, 4年前 , 38F
然後這種沒公開的程式又有輸入帳密的 要小
09/18 19:28, 38F

09/18 19:29, 4年前 , 39F
心使用 更尤其不是從原作者地方下載的 說不
09/18 19:29, 39F

09/18 19:29, 4年前 , 40F
定你的帳號不知不覺也幫忙做了資料蒐集
09/18 19:29, 40F

09/18 19:29, 4年前 , 41F
回國後罵就變成"發現被盯上後改用台灣IP"
09/18 19:29, 41F

09/18 19:30, 4年前 , 42F
而且特徵分析有誤判也是常見 把抓出來的
09/18 19:30, 42F

09/18 19:30, 4年前 , 43F
ID定罪真的很有腦
09/18 19:30, 43F

09/18 19:31, 4年前 , 44F
很明顯就人工作業
09/18 19:31, 44F
※ 編輯: perceval (140.116.21.9 臺灣), 09/18/2019 19:41:10

09/18 19:42, 4年前 , 45F
所以才要整套公布啊
09/18 19:42, 45F

09/18 19:46, 4年前 , 46F
對 所以有反應過以大量分身為主 其他取消
09/18 19:46, 46F

09/18 19:47, 4年前 , 47F
但他可能認為把難堪字眼帳號列入影響視覺
09/18 19:47, 47F

09/18 19:47, 4年前 , 48F
這就不夠中立 本身準確性就會被打入問號
09/18 19:47, 48F

09/18 19:58, 4年前 , 49F
我的話應該沒有使用過什難聽的字眼
09/18 19:58, 49F

09/18 19:58, 4年前 , 50F
但是還被列入
09/18 19:58, 50F

09/18 19:59, 4年前 , 51F
個人認為是比較針對性的像柯學啦
09/18 19:59, 51F

09/18 20:15, 4年前 , 52F
已經先入為主認為反柯的都是網軍才這樣搞
09/18 20:15, 52F

09/18 20:15, 4年前 , 53F
我自己避免啥屎尿糞的字眼 他們大概手動
09/18 20:15, 53F

09/18 20:15, 4年前 , 54F
放我 或是那奇怪的刪舊文搜尋吧
09/18 20:15, 54F

09/18 20:22, 4年前 , 55F
要中立就raw data train個幾次來看
09/18 20:22, 55F

09/18 20:23, 4年前 , 56F
罵綠營的文字雲都是難聽子眼還重複IP倒
09/18 20:23, 56F

09/18 20:23, 4年前 , 57F
是連一點標記都沒有
09/18 20:23, 57F

09/18 20:43, 4年前 , 58F
手動的啦 在手機板惹到他就被標智障了
09/18 20:43, 58F

09/18 23:23, 4年前 , 59F
我覺得alans說的u可能
09/18 23:23, 59F

09/18 23:24, 4年前 , 60F
因為帳號頻繁去Q別人會被踢下線Ban IP
09/18 23:24, 60F

09/19 03:17, 4年前 , 61F
拜託各位去抓網軍 不要讓紅芒果獨領風騷
09/19 03:17, 61F
我們現在就在抓紅芒果這個網軍啊 你為甚麼要坦護他,你是不是他團隊的一個 ※ 編輯: perceval (140.116.21.9 臺灣), 09/19/2019 03:25:24
文章代碼(AID): #1TWX8CHc (Gossiping)
討論串 (同標題文章)
文章代碼(AID): #1TWX8CHc (Gossiping)