Re: [請益] 英文單字的過濾軟體

看板Master_D作者 (只是個暱稱罷了)時間17年前 (2009/02/13 12:53), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串2/2 (看更多)
※ 引述《dodonpachi (隨波逐流)》之銘言: : 據說有一種軟體可以把一篇文章中的特性詞性單字取出來 : 比如說「名詞」「形容詞」之類的 : 動詞冠詞之類沒意義的都去掉 : 我的論文剛好需要這類的軟體 : 請問版上鄉民是否有用過? 我不清楚你所要處理的語言是哪一種,不過你需要的是 POS(Part-of-Speech) tagging 這種工具程式。 底下這幾個是我有用過的工具。其中 TreeTagger 是速度最快的;SVMTool 速度最慢; FreeLing 功能最強大(它可以做到 syntactic/grammatical function tagging)。 1. TreeTagger - a language independent part-of-speech tagger http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/ 線上版本(這有字數限制,不過你可以分段貼) http://www.cele.nottingham.ac.uk/~ccztk/treetagger.php 2. SVMTool http://www.lsi.upc.edu/~nlp/SVMTool/ 線上版 http://www.lsi.upc.edu/~nlp/SVMTool/demo.php 3. FreeLing http://garraf.epsevg.upc.es/freeling/ 線上版 http://garraf.epsevg.upc.es/freeling/demo.php 中文的話,台灣有中研院的線上系統可使用: http://rocling.iis.sinica.edu.tw/CKIP/onlinesystem.htm 至於你後半段提到的,想要把不要的地方去掉。這部份若你會寫程式的話,有了上面的 輸出結果,很容易就可以辦到了。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.116.111.182

02/13 12:54, , 1F
呃...對不起看太快 沒看到你已經有說是要處理英文單字了
02/13 12:54, 1F

02/13 12:55, , 2F
中文那個就請自動忽略掉吧 XDDDDDDD
02/13 12:55, 2F

02/13 13:30, , 3F
推喔^^
02/13 13:30, 3F
文章代碼(AID): #19bFp0O- (Master_D)
文章代碼(AID): #19bFp0O- (Master_D)