Re: [請益] 英文單字的過濾軟體
※ 引述《dodonpachi (隨波逐流)》之銘言:
: 據說有一種軟體可以把一篇文章中的特性詞性單字取出來
: 比如說「名詞」「形容詞」之類的
: 動詞冠詞之類沒意義的都去掉
: 我的論文剛好需要這類的軟體
: 請問版上鄉民是否有用過?
我不清楚你所要處理的語言是哪一種,不過你需要的是 POS(Part-of-Speech) tagging
這種工具程式。
底下這幾個是我有用過的工具。其中 TreeTagger 是速度最快的;SVMTool 速度最慢;
FreeLing 功能最強大(它可以做到 syntactic/grammatical function tagging)。
1. TreeTagger - a language independent part-of-speech tagger
http://www.ims.uni-stuttgart.de/projekte/corplex/TreeTagger/
線上版本(這有字數限制,不過你可以分段貼)
http://www.cele.nottingham.ac.uk/~ccztk/treetagger.php
2. SVMTool
http://www.lsi.upc.edu/~nlp/SVMTool/
線上版
http://www.lsi.upc.edu/~nlp/SVMTool/demo.php
3. FreeLing
http://garraf.epsevg.upc.es/freeling/
線上版
http://garraf.epsevg.upc.es/freeling/demo.php
中文的話,台灣有中研院的線上系統可使用:
http://rocling.iis.sinica.edu.tw/CKIP/onlinesystem.htm
至於你後半段提到的,想要把不要的地方去掉。這部份若你會寫程式的話,有了上面的
輸出結果,很容易就可以辦到了。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 122.116.111.182
→
02/13 12:54, , 1F
02/13 12:54, 1F
→
02/13 12:55, , 2F
02/13 12:55, 2F
推
02/13 13:30, , 3F
02/13 13:30, 3F
討論串 (同標題文章)