[請問] 關於語言 為什麼英文字母有相同頻率啊?

看板ask作者 (煞克(╬⊙д⊙)賣地殼)時間4年前 (2020/01/03 16:58), 編輯推噓2(202)
留言4則, 2人參與, 4年前最新討論串1/1
如題 英文中用的最多的是e 再來是t a這些排下去 照理說每個作家風格不同 寫的文章領域不一樣 內容手法不同 而且文章體裁那麼多 劇本 或 法律條文等等 我網路上自己找英文文章 去算字母出現頻率 發現資料跟跟維基對比 幾乎不超過1% 還是以字母頻率來說 統計上1%其實算很多? 不然這也太神奇了吧 有懂統計或語言的大大知道為什麼嗎 這些又可以應用在哪邊? (除了霍夫曼編碼 似乎也可以拿來判斷文章是否異常?如果z超過5%之類的) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.220.255.143 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/ask/M.1578041902.A.01E.html

01/03 17:07, 4年前 , 1F
應用的話,太過簡單的加密可以光靠統計頻率辨認出是英文
01/03 17:07, 1F

01/03 17:07, 4年前 , 2F
甚至可以光看出現頻率就知道哪個是 e
01/03 17:07, 2F

01/03 18:11, 4年前 , 3F
考慮發音的話,母音跟字音的比例不太能太懸殊不然根本念
01/03 18:11, 3F

01/03 18:11, 4年前 , 4F
不出來
01/03 18:11, 4F
文章代碼(AID): #1U3m8k0U (ask)