Re: [偷可] 藏頭詩產生器已回收

看板talk作者 (理沙)時間8年前 (2016/04/30 23:51), 編輯推噓1(101)
留言2則, 2人參與, 最新討論串5/6 (看更多)
之前忘記是劍橋還是哪家 有出中文的斷詞系統 加上分析情緒的 出來的結果蠻好玩的 我們中研院也有喔~ 但他好像不能外加資料庫 所以不推 覺得中文分析很難 黃河入海流 黃河 入 海 流 n v n v 黃 河 入海 流 adj n v v 黃河 入 海流 n v n . . . 中文超難的阿!!! 加上情緒更難 還有反諷QAQ ※ 引述《steve1121 (o'.'o)》之銘言: : ※ 引述《rrr518 (理沙)》之銘言: : : 來個專業回答 : : 如果要這種產生器 : : 不能說做不出來 : : 但肯定要花非常久的時間 : : 程式方面不是問題 : : 問題在要建立非常龐大的資料庫 : : 蒐集各種句子 : : 還要給這些句子編排各種順序之類的 : : 簡單來說 光在資料庫這邊就會花非常久的時間 : : 光那個詩的產生器 : : 那種狗屁不通的詩就用了20000首唐詩當資料庫分析的數據 : : 我這輩子讀過的唐詩都沒那麼多吧 XDD : 之前,我就花了幾個月的時間,不務正業的寫了一個搜尋引擎, : 規模差不多將近有4000萬筆資料。 : 那時候也是在考慮如何建立索引, : 考慮的方法很多, : 其中有一種叫中文斷詞,就是分解/分析一個句子的詞性 : 例如:黃河入海流 : 就可以斷成 : 黃河 (名詞) : 入 (動詞) : 海流 (名詞) : 以上面的範例,也許就是可以去分析一首五個字的詩, : 可能會有 : (名詞)+(動詞)+(名詞) : 或則 : 例如:更上一層樓 : 更 (形容詞/複詞) : 上 (動詞) : 一層樓 (名詞) : 那麼就可以是 : (形容詞/複詞)+(動詞)+(名詞) : 我想這種東西應該也是可以用來寫一個藏頭詩吧。 : 或則應用在現在流行歌的自動填詞系統, : 這樣會不會是在跟方文山搶飯碗呢? : 其實,我是覺得中文真的很難,尤其是古文級的「詩」。 : 還好,我的本業只是研究 1 byte 而以, : 就那 8 個 0 與 1 會比較單純一點。 : o'.'o -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.115.2.66 ※ 文章網址: https://www.ptt.cc/bbs/talk/M.1462031469.A.493.html

04/30 23:56, , 1F
3R是做這方面的研究嗎??? XDD o'.'o
04/30 23:56, 1F

05/01 00:07, , 2F
專題有用到 XDD
05/01 00:07, 2F
文章代碼(AID): #1N9DHjIJ (talk)
討論串 (同標題文章)
文章代碼(AID): #1N9DHjIJ (talk)