[問題] 有關語意分析的方向

看板Python作者 (RayShigeno)時間8年前 (2015/11/11 19:16), 編輯推噓5(509)
留言14則, 6人參與, 最新討論串1/1
不好意思我目前想學習有關語意分析這塊 那我做了些功課後發現,使用python是最簡單的 我想問各位,我對語意分析的用法是不是有錯 我想實用在抓取關鍵字 例如去某個網站,利用Python先斷詞,再把出現的次數最高的依序抓出來,這樣就能知道 哪個關鍵字最熱門,進一步做推論 請問我這樣的想法有錯嗎?python可以做到這樣嗎?感謝各位 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.242.90.187 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1447240570.A.6D7.html

11/11 19:18, , 1F
Python 可以做到。想法也正確。不過實際上複雜很多
11/11 19:18, 1F

11/11 19:19, , 2F
例如你覺得 Python 這個版斷完詞之後哪些詞最熱門?
11/11 19:19, 2F

11/11 19:19, , 3F
不意外會有 Python,但我想「問題」「錯誤」也會很熱門
11/11 19:19, 3F

11/11 19:20, , 4F
更 general 一點,中文高詞頻有你、大家,商品有漂亮
11/11 19:20, 4F

11/11 19:20, , 5F
想法很OK 但是細節很多
11/11 19:20, 5F

11/11 19:21, , 6F
這些詞次數高,但會是關鍵字嗎?就要進一步要思考
11/11 19:21, 6F

11/11 21:39, , 7F
樓上說的是TF-IDF吧
11/11 21:39, 7F

11/11 21:48, , 8F
恩恩,還有 LDA HDP 甚至用 word2vec 做 clustering
11/11 21:48, 8F

11/12 09:40, , 9F
推薦你可以用jieba斷詞 語意分析好多東西可以玩耶 從你的
11/12 09:40, 9F

11/12 09:40, , 10F
敘述可以先做TF-Idf
11/12 09:40, 10F

11/20 17:27, , 11F
sk-learn和gensim這兩個套件可以拿來用,之前用來做過to
11/20 17:27, 11F

11/20 17:27, , 12F
pic modeling和clustering
11/20 17:27, 12F

11/20 17:31, , 13F
scikit-learn,剛才打到簡稱=x=
11/20 17:31, 13F

12/05 01:58, , 14F
這牽涉到超多..我現在在搞text SVM classification
12/05 01:58, 14F
文章代碼(AID): #1MGoDwRN (Python)