Re: [統計] 十月份西洽統計文已回收
: 先定義什麼是廢文, 程式才可以遵循定義去判斷
定義廢文需要人工智慧,這太難了,
不過或許可以用一些間接指標。
間接指標並不等於廢文,但理論上應該有較大的機率可以篩選出發廢文傾向者。
我個人想到的一個指標:平均每篇文章的字數。
定義上,就扣除超連結及符號標點,算剩下的中英文字元數和,再除以發文數。
如果怕取平均數會誤導,或許可取中位數?
當然要在此重申,文字少並不等於廢文,只是要讓程式做簡單條件判斷,
一時之間也想不到什麼更簡單的指標了。
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.118.139
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1477979233.A.9DE.html
推
11/01 13:47, , 1F
11/01 13:47, 1F
推
11/01 13:48, , 2F
11/01 13:48, 2F
推
11/01 13:48, , 3F
11/01 13:48, 3F
→
11/01 13:48, , 4F
11/01 13:48, 4F
→
11/01 13:49, , 5F
11/01 13:49, 5F
→
11/01 13:49, , 6F
11/01 13:49, 6F
推
11/01 13:49, , 7F
11/01 13:49, 7F
推
11/01 13:49, , 8F
11/01 13:49, 8F
→
11/01 13:49, , 9F
11/01 13:49, 9F
推
11/01 13:50, , 10F
11/01 13:50, 10F
→
11/01 13:50, , 11F
11/01 13:50, 11F
→
11/01 13:50, , 12F
11/01 13:50, 12F
推
11/01 13:50, , 13F
11/01 13:50, 13F
→
11/01 13:51, , 14F
11/01 13:51, 14F
→
11/01 13:51, , 15F
11/01 13:51, 15F
推
11/01 13:56, , 16F
11/01 13:56, 16F
推
11/01 14:00, , 17F
11/01 14:00, 17F
→
11/01 14:06, , 18F
11/01 14:06, 18F
→
11/01 14:07, , 19F
11/01 14:07, 19F
推
11/01 14:08, , 20F
11/01 14:08, 20F
推
11/01 14:08, , 21F
11/01 14:08, 21F
推
11/01 14:14, , 22F
11/01 14:14, 22F
推
11/01 14:16, , 23F
11/01 14:16, 23F
→
11/01 14:18, , 24F
11/01 14:18, 24F
→
11/01 14:18, , 25F
11/01 14:18, 25F
推
11/01 15:20, , 26F
11/01 15:20, 26F
推
11/01 15:38, , 27F
11/01 15:38, 27F
推
11/01 16:15, , 28F
11/01 16:15, 28F
討論串 (同標題文章)
本文引述了以下文章的的內容:
統計
63
131
以下文章回應了本文:
完整討論串 (本文為第 3 之 11 篇):
統計
12
47
統計
79
121
統計
53
78
統計
14
50
統計
16
28