[問題] 從評論提取特徵並做成分類器
小弟目前是學生,有個專案是要從幾萬筆的評論中提取出幾個重要的特徵,並且將這些特
徵拿來製造篩選器。
例如從餐廳的評論中得出「食物種類」、「食物價錢」、「食物口味」非常重要,就用這
三個當作分類器的attribute。然後在給定這些attribute值的時候,就能夠導向對應的餐
廳。
自己思考一下作法後,歸類出兩個問題:
首先是該如何提取特徵?我目前的想法是使用tf-idf向量化,找出tf-idf最高的前幾個字
當作曬選器的attribute(X)。請問還有其他更適合的方式嗎?
第二個問題是該如何把餐廳(Y)跟選定的attribute(X)做連結?畢竟無法連結的話就
無法訓練分類器,所以該怎麼把這些attribute(X)跟餐廳(Y)是個大問題... 目前怎
麼解決這件事情小弟完全沒有頭緒,不知道有沒有大神可以解答Orz [編輯]:選定att
ribute之後該怎麼將評論中對應attribute的文字量化,例如評論中提到「食物很好吃」
,那該如何將「好吃」量化放入食物口味的attribute中
麻煩各位鄉民們替小弟解惑,如果有上述方法以外的作法也麻煩各位不吝提出,感謝!
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.28.197 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1588950110.A.4FF.html
推
05/08 23:40,
4年前
, 1F
05/08 23:40, 1F
小弟的意思是,選定attribute之後該怎麼將其量化,例如評論中提到「食物很好吃」,
那該如何將「好吃」量化放入食物口味的attribute中,感謝您的提問
※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/08/2020 23:54:27
推
05/08 23:51,
4年前
, 2F
05/08 23:51, 2F
→
05/08 23:51,
4年前
, 3F
05/08 23:51, 3F
→
05/09 00:12,
4年前
, 4F
05/09 00:12, 4F
→
05/09 00:16,
4年前
, 5F
05/09 00:16, 5F
→
05/09 00:16,
4年前
, 6F
05/09 00:16, 6F
沒錯,看起來就是這個東西!原諒小弟才疏學淺不知道有推薦系統這個東西orz 請問有什
麼關鍵字可以上網找實作範例嗎?
→
05/09 00:17,
4年前
, 7F
05/09 00:17, 7F
那請問 關鍵字 -> 分數 有什麼方式可以做轉換嗎?
※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/09/2020 00:31:26
推
05/09 00:53,
4年前
, 8F
05/09 00:53, 8F
→
05/09 00:53,
4年前
, 9F
05/09 00:53, 9F
→
05/09 00:54,
4年前
, 10F
05/09 00:54, 10F
→
05/09 00:55,
4年前
, 11F
05/09 00:55, 11F
→
05/09 00:55,
4年前
, 12F
05/09 00:55, 12F
→
05/09 00:56,
4年前
, 13F
05/09 00:56, 13F
了解,感謝您~ 小弟剛拜讀完您的文章,有在回文下面提問,再麻煩您解惑了
推
05/09 01:35,
4年前
, 14F
05/09 01:35, 14F
→
05/09 01:35,
4年前
, 15F
05/09 01:35, 15F
不只是要做情緒分析唷,主要是希望產出一個篩選器,透過填寫篩選器的attribute最終
導向符合理想的店家~
※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/09/2020 09:41:53
推
05/13 19:32,
4年前
, 16F
05/13 19:32, 16F
→
05/13 19:32,
4年前
, 17F
05/13 19:32, 17F
推
05/21 15:21,
4年前
, 18F
05/21 15:21, 18F
→
05/21 15:21,
4年前
, 19F
05/21 15:21, 19F
討論串 (同標題文章)