Re: [SQL ] 中文斷句

看板Database作者 (Hi-End 精神)時間15年前 (2008/12/12 16:14), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串2/3 (看更多)
※ 引述《savealone (嘴砲馬)》之銘言: : 我們做類似搜循引擎的系統,有做全文檢索 : 在處理英文關鍵字時,斷句都能順利找到符合的資料 : 但處理中文關鍵句時,因為斷句的關係,並沒有找到所有應該列出的資料 : 例如,搜尋"資料"只會找出剛好滿足"資料"的結果 : 但不會列出"資料庫"的搜查結果 : 但搜"資料庫"列出的查詢結果則不相同 : 請問版上的神人有不一樣的解法,或是介紹好用的插件 第一,這根本不是「斷句」的問題,也不是「斷詞」的問題,你只是要全文檢索而已。 第二,如果用 SQL 的話,那像板友的推文所說,用 LIKE '%資料%' 就可以找到 所有包含「資料」的項目。 第三,但看起你要做的是 search engine,難道 search engine 是用 SQL 做的嗎? 這樣會非常慢,尤其是 LIKE '%something%' 這種語法, 非常慢,要 linear time,也無法透過建立 index 改善。 或許你要重新思考是否使用 SQL 作 "search engine"。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.31.73 ※ 編輯: Huangs 來自: 140.112.31.73 (12/12 16:15)

12/12 23:22, , 1F
12/12 23:22, 1F
文章代碼(AID): #19GXrVcG (Database)
文章代碼(AID): #19GXrVcG (Database)