[問題] 將文章以字為單位進行切分

看板R_Language作者 (家政教育學系班代)時間5年前 (2018/09/16 09:50), 編輯推噓1(101)
留言2則, 2人參與, 5年前最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) 我想用R計算文本的字頻。 大多數的中文文本處理好像都會包含斷詞, 所以都是斷詞後計算詞頻。 有沒有可以直接取得字頻資訊的函數或套件? 或將文本先將字一個一個斷開的函數? -- 觀自在菩薩行深般若波羅蜜多時。照見五蘊皆空。度一切苦厄。舍利子色不異空 不異色即是空空即是色。受想行識。亦復如是。舍利子。是諸法空相。不生不滅。 不垢不淨。不增不減。是故空中無色。無受想行識。無眼耳鼻舌身意無色聲香味觸法 無眼界乃至無意識界。無無明。亦無無明盡。乃至無老死。亦無老死盡。無苦集滅道。無 智亦無得。已無所得故。菩提薩埵。依般若波羅蜜多故。心無罣礙無罣礙故無有恐怖 。遠離顛倒夢想。究竟涅槃。三世諸佛。依若波羅蜜多故。得阿耨多羅三藐三菩提。故 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.38.93 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1537062636.A.C45.html

09/16 10:59, 5年前 , 1F
table(strsplit(x, "" ) )
09/16 10:59, 1F

09/16 11:28, 5年前 , 2F
謝謝。好厲害。
09/16 11:28, 2F
文章代碼(AID): #1RdRRin5 (R_Language)