[轉錄] 語意搜尋引擎

看板NTNU_Lin_96作者 (H+ pump)時間15年前 (2008/09/23 23:39), 編輯推噓2(202)
留言4則, 3人參與, 最新討論串1/1
語意搜尋引擎 http://mmdays.com/2008/09/22/semantic_search_engine/ Posted By Mr. Thursday 今天上網尋找東西或資訊,無論是用Google還是Yahoo,我們用的都是關鍵字 (keyword) 搜尋。關鍵字搜尋對一些專有名詞的資訊搜尋效果不錯,然而有時候我們只知道比較廣泛 的概念,想要找比較詳細的資訊卻不知道該下什麼關鍵字,或著是同義字很多,像是 Apple是指水果的蘋果,還是蘋果電腦?或是我們想用自然語言的問句,來界定我們關鍵 字的上下文意義,避免找到有這個關鍵字,應用情境 (context) 卻不是想要尋找的情況 。「語意搜尋引擎」想要達成的目標就是如此,當少數關鍵字的意思並不明確,無法清楚 定義出情境 (context) 或是排除同義字,或是想從廣泛的概念搜尋比較詳細特定的概念 ,就可以運用語意搜尋引擎來找找。 目前有哪些搜尋引擎呢?針對 Wikipedia 內容來做語意搜尋的搜尋引擎有 Powerset 和 Cognition,Cognition除了包含Wikipedia的內容外,也針對法律 (legal) 內容和醫學 (medicine) 內容做搜尋。Hakia 則是針對整個網路的內容做語意搜尋。除此之外,最近 也有 Evri 這個語意搜尋引擎,使用類似資料庫裡面 entity-relationship (ER) 的瀏覽 方式,讓使用者可以根據事情之間意義上的關係,從一個網頁連到另外一個網頁,讓超連 結 (hyperlink) 不是只有關鍵字的連結,而是經由事物的屬性意義的連結。下面就讓我 們先看一下這些搜尋引擎的 DEMO 吧! http://tw.youtube.com/watch?v=b00bfZ8UDqs 影片1 Powerset demo http://link.brightcove.com/services/link/bcpid910498365/bctid1576332516 影片2 Evri demo at D6 從上面的影片可以看到,語意搜尋引擎通常會附加自然語言的問句輸入,原本只要打幾 個關鍵字迅速又方便,但是需要整個句子來清楚表達所要搜尋的事情的時候,自然語言問 句輸入功能就是一大幫手。其次,語意搜尋引擎通常會對搜尋結果做個整理,然而整理的 方式不是單純地使用 clustering的方式依照關鍵字出現頻率或順序來歸類,而是根據字 的意思來歸類,通常會整理成一個樹狀的結構,讓比較特定細節的概念包含在比較一般廣 泛的概念字下面,或是經由一個事情的各種屬性放射狀投射到其他頁面,都是根據意義來 連結整理,而不是單純文字的連結。最後是應用的範圍,Wikipedia 應用最多,Powerset 和Cognition都有搜尋Wikipedia的語意內容。再來就有專門領域的搜尋,像是Cognition 有搜尋法律和醫學的語意內容。針對整個網路內容的語意搜尋結果不知道如何?目前 Hakia和Evri是想要搜尋整個網路的語意資訊。也許下次如果Google關鍵字找不到想要的 東西,或是感覺搜尋過程中有些迷失方向,那麼不妨試試這些語意搜尋引擎,說不定就可 以找到你想要的資訊了! 關於這些搜尋引擎的技術,一搬來說就是自然語言處理上的技術最多,細節我就不清楚, 但是斷詞和自然語言一些基本功能,對於語意搜尋引擎來說應該都是基本要具備的功能了 !其次就是文法剖析上的技術,就看各家發展的特點了。最重要的就是能夠分辨同義字 (synonym),以及分辨上義字 (hypernym) 和下義字 (hyponym)。上義字是比較廣義的字 ,下義字是比較特定詳細的字,譬如說:紅色(red)是顏色(color)的下義字,因為紅色是 比較特定詳細的概念,顏色(color)則是紅色(red)的上義字,因為顏色是比較廣泛一般的 概念。 目前這些語意搜尋引擎除了Powerset已經被Microsoft買下以外,其他還在各自發展,有 的像是 Evri 還只有 beta 功能可以測試而已。因此目前這些語意搜尋引擎都是讓各位有 另外一種選擇,當你搜尋的資訊需要有比較清楚的語意辨識,或是用關鍵搜尋的結果不大 滿意,可以用這些語意搜尋引擎試試看。未來則是希望這種屬於人工智慧議題的語意搜尋 技術能夠更加成熟,讓搜尋過程能夠更貼近和人溝通的經驗,機器也能夠更聰明地提供人 類搜尋服務了! 相關連結 Powerset http://www.powerset.com/ Cognition http://www.cognition.com/ Hakia http://www.hakia.com/ Evri http://www.evri.com/ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.122.220.82 ※ 編輯: erilinda 來自: 140.122.220.82 (09/23 23:39)

09/23 23:51, , 1F
哇 硬是要得阿! 這引擎好牛!
09/23 23:51, 1F

09/23 23:53, , 2F
剛剛試用了一下Cognition 標出同義字的結果還蠻有趣的XD
09/23 23:53, 2F

09/23 23:57, , 3F
我給的句子裡有hate 就出現acrimonious aversion loathe
09/23 23:57, 3F

09/24 00:03, , 4F
感謝linda時常提供好東西:)
09/24 00:03, 4F
文章代碼(AID): #18sGsqKX (NTNU_Lin_96)