Re: [偷可] 藏頭詩產生器已回收
之前忘記是劍橋還是哪家
有出中文的斷詞系統
加上分析情緒的
出來的結果蠻好玩的
我們中研院也有喔~
但他好像不能外加資料庫
所以不推
覺得中文分析很難
黃河入海流
黃河 入 海 流 n v n v
黃 河 入海 流 adj n v v
黃河 入 海流 n v n
.
.
.
中文超難的阿!!!
加上情緒更難
還有反諷QAQ
※ 引述《steve1121 (o'.'o)》之銘言:
: ※ 引述《rrr518 (理沙)》之銘言:
: : 來個專業回答
: : 如果要這種產生器
: : 不能說做不出來
: : 但肯定要花非常久的時間
: : 程式方面不是問題
: : 問題在要建立非常龐大的資料庫
: : 蒐集各種句子
: : 還要給這些句子編排各種順序之類的
: : 簡單來說 光在資料庫這邊就會花非常久的時間
: : 光那個詩的產生器
: : 那種狗屁不通的詩就用了20000首唐詩當資料庫分析的數據
: : 我這輩子讀過的唐詩都沒那麼多吧 XDD
: 之前,我就花了幾個月的時間,不務正業的寫了一個搜尋引擎,
: 規模差不多將近有4000萬筆資料。
: 那時候也是在考慮如何建立索引,
: 考慮的方法很多,
: 其中有一種叫中文斷詞,就是分解/分析一個句子的詞性
: 例如:黃河入海流
: 就可以斷成
: 黃河 (名詞)
: 入 (動詞)
: 海流 (名詞)
: 以上面的範例,也許就是可以去分析一首五個字的詩,
: 可能會有
: (名詞)+(動詞)+(名詞)
: 或則
: 例如:更上一層樓
: 更 (形容詞/複詞)
: 上 (動詞)
: 一層樓 (名詞)
: 那麼就可以是
: (形容詞/複詞)+(動詞)+(名詞)
: 我想這種東西應該也是可以用來寫一個藏頭詩吧。
: 或則應用在現在流行歌的自動填詞系統,
: 這樣會不會是在跟方文山搶飯碗呢?
: 其實,我是覺得中文真的很難,尤其是古文級的「詩」。
: 還好,我的本業只是研究 1 byte 而以,
: 就那 8 個 0 與 1 會比較單純一點。
: o'.'o
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.2.66
※ 文章網址: https://www.ptt.cc/bbs/talk/M.1462031469.A.493.html
推
04/30 23:56, , 1F
04/30 23:56, 1F
→
05/01 00:07, , 2F
05/01 00:07, 2F
討論串 (同標題文章)