Re: [SQL ] 中文斷句
※ 引述《savealone (嘴砲馬)》之銘言:
: 我們做類似搜循引擎的系統,有做全文檢索
: 在處理英文關鍵字時,斷句都能順利找到符合的資料
: 但處理中文關鍵句時,因為斷句的關係,並沒有找到所有應該列出的資料
: 例如,搜尋"資料"只會找出剛好滿足"資料"的結果
: 但不會列出"資料庫"的搜查結果
: 但搜"資料庫"列出的查詢結果則不相同
: 請問版上的神人有不一樣的解法,或是介紹好用的插件
第一,這根本不是「斷句」的問題,也不是「斷詞」的問題,你只是要全文檢索而已。
第二,如果用 SQL 的話,那像板友的推文所說,用 LIKE '%資料%' 就可以找到
所有包含「資料」的項目。
第三,但看起你要做的是 search engine,難道 search engine 是用 SQL 做的嗎?
這樣會非常慢,尤其是 LIKE '%something%' 這種語法,
非常慢,要 linear time,也無法透過建立 index 改善。
或許你要重新思考是否使用 SQL 作 "search engine"。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.31.73
※ 編輯: Huangs 來自: 140.112.31.73 (12/12 16:15)
推
12/12 23:22, , 1F
12/12 23:22, 1F
討論串 (同標題文章)