[問題] 從評論提取特徵並做成分類器

看板Python作者 (batman)時間4年前 (2020/05/08 23:01), 4年前編輯推噓6(6013)
留言19則, 7人參與, 4年前最新討論串1/2 (看更多)
小弟目前是學生,有個專案是要從幾萬筆的評論中提取出幾個重要的特徵,並且將這些特 徵拿來製造篩選器。 例如從餐廳的評論中得出「食物種類」、「食物價錢」、「食物口味」非常重要,就用這 三個當作分類器的attribute。然後在給定這些attribute值的時候,就能夠導向對應的餐 廳。 自己思考一下作法後,歸類出兩個問題: 首先是該如何提取特徵?我目前的想法是使用tf-idf向量化,找出tf-idf最高的前幾個字 當作曬選器的attribute(X)。請問還有其他更適合的方式嗎? 第二個問題是該如何把餐廳(Y)跟選定的attribute(X)做連結?畢竟無法連結的話就 無法訓練分類器,所以該怎麼把這些attribute(X)跟餐廳(Y)是個大問題... 目前怎 麼解決這件事情小弟完全沒有頭緒,不知道有沒有大神可以解答Orz [編輯]:選定att ribute之後該怎麼將評論中對應attribute的文字量化,例如評論中提到「食物很好吃」 ,那該如何將「好吃」量化放入食物口味的attribute中 麻煩各位鄉民們替小弟解惑,如果有上述方法以外的作法也麻煩各位不吝提出,感謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.28.197 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1588950110.A.4FF.html

05/08 23:40, 4年前 , 1F
第二個問題是?? 評論就能產生X吧
05/08 23:40, 1F
小弟的意思是,選定attribute之後該怎麼將其量化,例如評論中提到「食物很好吃」, 那該如何將「好吃」量化放入食物口味的attribute中,感謝您的提問 ※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/08/2020 23:54:27

05/08 23:51, 4年前 , 2F
給Y一個具體的定義,然後看一下 supervised learning
05/08 23:51, 2F

05/08 23:51, 4年前 , 3F
看看?
05/08 23:51, 3F

05/09 00:12, 4年前 , 4F
y就是餐廳唷,例如「爭鮮」「必勝客」
05/09 00:12, 4F

05/09 00:16, 4年前 , 5F
你想要的應該是推薦系統,把評論關鍵字轉換成加權分數
05/09 00:16, 5F

05/09 00:16, 4年前 , 6F
根據加權分數算出排名推薦出來吧?
05/09 00:16, 6F
沒錯,看起來就是這個東西!原諒小弟才疏學淺不知道有推薦系統這個東西orz 請問有什 麼關鍵字可以上網找實作範例嗎?

05/09 00:17, 4年前 , 7F
關鍵字 -> 分數 想是沒什麼客觀標準拉...
05/09 00:17, 7F
那請問 關鍵字 -> 分數 有什麼方式可以做轉換嗎? ※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/09/2020 00:31:26

05/09 00:53, 4年前 , 8F
講推薦系統很籠統,同樣是推薦系統,其外表的目的性跟內部
05/09 00:53, 8F

05/09 00:53, 4年前 , 9F
的實際方法都可能天差地遠
05/09 00:53, 9F

05/09 00:54, 4年前 , 10F
你在用的導航系統也是推薦系統(推薦你路線),Google廣告
05/09 00:54, 10F

05/09 00:55, 4年前 , 11F
也是推薦系統(嘗試推薦你更可能有興趣的廣告),Facebook
05/09 00:55, 11F

05/09 00:55, 4年前 , 12F
推薦你可能認識的好友也是推薦系統,推薦系統其實是一個太
05/09 00:55, 12F

05/09 00:56, 4年前 , 13F
大的類別,只講推薦系統其實沒有解答到到實作方向的答案
05/09 00:56, 13F
了解,感謝您~ 小弟剛拜讀完您的文章,有在回文下面提問,再麻煩您解惑了

05/09 01:35, 4年前 , 14F
RNN語意分類?tensorflow官方教學有輸入IMDB評論,然後
05/09 01:35, 14F

05/09 01:35, 4年前 , 15F
判斷這個評論是屬於正面或負面
05/09 01:35, 15F
不只是要做情緒分析唷,主要是希望產出一個篩選器,透過填寫篩選器的attribute最終 導向符合理想的店家~ ※ 編輯: nchunerdy120 (36.231.28.197 臺灣), 05/09/2020 09:41:53

05/13 19:32, 4年前 , 16F
大部分的評論都有這三種attributes嗎 沒有的話感覺data
05/13 19:32, 16F

05/13 19:32, 4年前 , 17F
很難處理
05/13 19:32, 17F

05/21 15:21, 4年前 , 18F
樓上,當然不一定有啊,沒有的你就是要給個missing值之類
05/21 15:21, 18F

05/21 15:21, 4年前 , 19F
的來標記
05/21 15:21, 19F
文章代碼(AID): #1UjNHUJ_ (Python)
文章代碼(AID): #1UjNHUJ_ (Python)