[評價] 109-1 陳建錦 文字探勘初論

看板NTUcourse作者 (駱駝)時間2年前 (2021/07/08 11:39), 2年前編輯推噓0(004)
留言4則, 1人參與, 2年前最新討論串1/1
※ 本文是否可提供臺大同學轉作其他非營利用途?(須保留原作者 ID) (是/否/其他條件):否 哪一學年度修課: 109-1 ψ 授課教師 (若為多人合授請寫開課教師,以方便收錄) 陳建錦 λ 開課系所與授課對象 (是否為必修或通識課 / 內容是否與某些背景相關) 資管系選修/商業資料分析學程課程 δ 課程大概內容 Term Vocabulary Term Weighting and Vector Space Model Text Classification and Naive Bayes Vector Space Classification Flat Clustering Hierarchical Clustering Latent Semantic Analysis Language Models Link Analysis Concept of Neural Network Word2Vec & Bert Deep Learning for Classification Ω 私心推薦指數(以五分計) ★★★★★ ★★★★★ η 上課用書(影印講義或是指定教科書) Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze, Introduction to Information Retrieval, Cambridge University Press, 2008. μ 上課方式(投影片、團體討論、老師教學風格) 老師會在課前上傳投影片,上課就會照這個投影片講,有時會demo一些python範例。 σ 評分方式(給分甜嗎?是紮實分?) 程式作業 30% (3 x 10%) 期末專題 35% 期末考 35% 紮實甜 ρ 考題型式、作業方式 [程式作業] PA1:給一堆文件txt檔,要算出TF-IDF vector和兩個文件的cosine similarity PA2:給一堆文件txt檔,要分別用Bernoulli Naïve Bayes、SVM Linear kernel、SVM RBF kernel來做分類,並寫報告評估其表現 PA3:給一堆文件txt檔,首先使用 BERT 將文章轉為 word vectors, 再以SVM Linear kernel 進行分類,要把結果丟到kaggle上排名,並寫 報告評估其表現 [期末專題] 最多五人一組,要想辦法應用課堂所學的技術,主題不拘,並需上台簡報與繳交書面報告 。同學們都蠻有創意的,看到了很多豐富的主題,很有趣,像是:匈牙利新聞對歐盟的態 度、PTT政治人物輿論、歌詞產生器、輸入歌詞推薦歌、澳洲新聞預測經濟指標、新聞主 題分析、黃國昌質詢跟部會表現相關、Google評論產生器、自殺言論偵測、美國死囚遺言 分析... [期末考] 基本上是上課概念的問答,比如要解釋某個概念,或分析兩種方法的優劣等,不難。 ω 其它(是否注重出席率?如果為外系選修,需先有什麼基礎較好嗎?老師個性? 加簽習慣?嚴禁遲到等…) 加簽習慣: 資管系跟學程生先簽,但最後人沒有到太爆滿,所以基本上全簽了。 修課基礎: Python,因作業要用python寫。此外懂一點機率會比較好。 Ψ 總結 這門課是新開的,不過老師一直以來都有開一班給資管系的「資訊檢索與文字探勘導論」 ,據說兩者課程內容大致差不多,只是因這門課修課同學的組成比較複雜,老師表示在不 確定大家程度如何的情況下會把難度拿捏的稍微低一點,像是有些比較複雜的數學證明老 師會跳過(但我其實蠻愛聽的xD),且作業也允許使用套件而不要求手刻(因此有點過於簡 單)。畢竟課名叫「初論」,自然許多地方就不會講太深,然而課程也不失豐富度, 一學期下來還是能對文字探勘的許多重要議題有基本的認識。 這個領域是老師的專長,可以感受到老師很有熱忱,概念都講解得很清楚。而且我覺得老 師人很nice,也很樂意回答同學們的課堂問題,有次我半夜寄了一長串的問題,老師隔天 早上九點就回信了!一學期下來就我一個毫無基礎的人而言收穫不少,也覺得這領域 蠻有趣的,未來蠻想去修修看這方面再進階一點課程,不知道各位大大有沒有推薦的xD。 總之很推。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.240.133.46 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/NTUcourse/M.1625715585.A.CFD.html ※ 編輯: kamelus (123.240.133.46 臺灣), 07/08/2021 11:51:49

07/09 09:43, 2年前 , 1F
資工那有進階的課 但不一定推 然後這些模型的原始概念有
07/09 09:43, 1F

07/09 09:43, 2年前 , 2F
用在很多地方 數學 電類都有類似的 經濟 財金說不定也有
07/09 09:43, 2F

07/09 09:47, 2年前 , 3F
到頭來都是在某個高維空間找某種距離罷了 重點是要怎轉換
07/09 09:47, 3F

07/09 09:47, 2年前 , 4F
過去 不然就是要怎過濾
07/09 09:47, 4F
文章代碼(AID): #1WvdE1pz (NTUcourse)