作者查詢 / Wush978
作者 Wush978 在 PTT [ DataScience ] 看板的留言(推文), 共61則
限定看板:DataScience
看板排序:
全部Gossiping4495HatePolitics2903R_Language1256Statistics355NTUMath91295nCoV2019264Soft_Job260NTHU_STAT97238Military136GO129LoL126NTHU_STAT96118C_Chat112NTU67Philo-0364BabyMother62DataScience61CrossStrait59C_and_CPP55PHP42BoardGame39Hearthstone31NTHU_STAT9831Programming23Tech_Job23PUBG22BattleRoyale21Python18SLG15MOD14NBA13sex13Ikariam12NTUMath9210HSNU_9789joke9NCCU07_Ghis8CVS7L_TalkandCha7NTUcourse7Sub_CS7Wen-Shan7feminine_sex6PathofExile6Baseball5Hate5Steam5HSNU_9854LawBasketbal4Linux4marriage4Prob_Solve4Salary4TKU_TSPCB934W-Philosophy4Warfare4eSports3FATE_GO3FBG3Federer3PhD3PLT3Poker3StupidClown3SWhite3Tainan3Tennis3Windows3EngTalk2GossipPicket2LGS2Magic2MdnCNhistory2MenTalk2NBME_Lab2NTUHistory882PublicIssue2PublicServan2specialman2Sub_GOnline2WomenTalk2AfterPhD1B88A011XX1Boy-Girl1Broad_Band1Chan_Mou1chess1ck54th3051Cloud1CodeJob1consumer1CPU_FS7411CS92Lien1Daan1Database1dlsh-7th-3031Ecophilia1EZsoft1Fantasy1FCSH_133101FCU_EE00B1FJU1FJU-ACCR941FJU-Stat95A1FJU-STAT95B1FLAT_CLUB1Google1Haruhi1home-sale1HomeTeach1Hornets1Hsinchu1HsinYi1HSNU_11431HSNU_9861Jeremy_Lin1Ju-881KOTDFansClub1KS95-3181KS96-3141KS97-3131LAW1Management1Math1media-chaos1MobileComm1movie1NCCU00_Histo1NCCU_C-Baske1NCHU-Stat971NCTU-STAT98G1NCU91Finance1NSYSU1NSYSU_EE95-11NTHU-EE-CAPT1NTUCH-901NTUE-CS1021NTUE-CS1041NTUE-CS981NTUE-DC991NTUE-EPC-1001NTUEE_BL5271NTUEOE-IOL1NTUmed911NUK_AC981Orzhong97cl1Policy1PTHS95-3101RealPlaying1RS6171scu_transfer1SM04th011SM05th3xx1SorryPub1studyabroad1Taipei1toberich1TypeMoon1TYSH50-3031UTAH-JAZZ1Volunteer1YOLO1YP91-3111<< 收起看板(163)
18F推: 手刻模型要學數值最佳化套件, 像是LBFGS 或是 SGD等等01/22 10:42
19F→: 還有要練習自己建model matrix ,需要線性代數知識01/22 10:44
20F→: 以及會用相關的函式庫01/22 10:44
1F推: 就用你手上的資料試試看吧,這才是Data Science不是嗎?03/26 18:45
2F→: 小心違法02/18 00:52
3F→: 我忘記是哪一條了,但是之前有印象做台鐵驗證碼的OCR可能02/18 00:54
4F→: 有觸法之虞,建議低調02/18 00:55
26F→: 現在除了做dummy variable外還流行做embedding了09/10 21:27
10F→: nearest neighbor 類的演算法,例如 1NN06/21 02:55
18F→: 我沒聽過越多層辨識率會越高的說法06/10 23:28
19F→: https://www.slideshare.net/tw_dsconf/ss-6224535106/10 23:33
20F→: Deeper usually does not imply better06/10 23:33
21F→: (p87)06/10 23:34
32F推: 不是,參數多只是比較有彈性,不是比較好06/11 14:55
33F→: 二十年前統計理論就可以告訴你當參數超過需要的參數時,06/11 14:56
34F→: 會以什麼樣的方式來傷害模型06/11 14:56
35F推: 層數變深的進步主要是針對計算上的問題克服,但是基本統06/11 15:03
36F→: 計的定理是針對「利用數據建模」這件事情去給予限制,這06/11 15:03
37F→: 部分並沒有被突破。06/11 15:03
38F推: 而我們也只能說在影像等應用領域,似乎越深層的模型結構06/11 15:05
39F→: 越接近真理,但是直接下結論越深越好是很危險的。我研究06/11 15:05
40F→: 的廣告領域,深度學習的表現並沒有特別突破,反而是另一06/11 15:05
41F→: 類模型在比賽中是常勝軍。06/11 15:05
42F推: 我今年投稿kdd的實驗中,在處理censoring 的問題時,甚06/11 15:08
43F→: 至沒有證據顯示深度學習一定比linear好...是個很難做的06/11 15:08
44F→: 問題。06/11 15:08
45F→: 看別人成功的經驗是沒錯的,但是目前在這行,關鍵在實驗06/12 09:40
46F→: 設計:如何建立有效率的環境讓你快速驗證方法是否適用於06/12 09:40
47F→: 你的問題06/12 09:40
48F→: 沒辦法,目前這個領域處於實驗、方法都不太reproducible06/12 09:41
49F→: 簡單來說,別人覺得有用的方法,在你的問題上不一定有用06/12 09:41
50F→: 所以就是看別人怎麼做,但是自己要仔細檢驗...06/12 09:41
51F→: 話說這行目前paper的可信度也不如傳統科學領域,所以驗證06/12 09:42
52F→: 與懷疑非常非常重要...06/12 09:42
28F推: 不會程式的話,專注學分析資料會比較有價值04/25 00:58
29F→: 程式只是影響你分析的工具可以用到哪裡,用excel也能分析04/25 00:58
30F→: 很多了04/25 00:58
31F→: 要學程式建議等你真的需要的時候再開始自學R, python等工04/25 00:59
32F→: 具,學得有點興趣再考慮上課。我目前遇到業界非分析非資04/25 01:00
33F→: 工的資料科學高手,都是主賣像視覺化、或是專業領域(行銷04/25 01:00
34F→: ...等等)的,程式只是加分,不是他們讓人覺得威猛的點04/25 01:00
37F→: 最基礎的統計學好,知道怎麼解釋數據,以及當老闆的問題04/25 22:02
38F→: 或工作的問題出來之後,如何用數據與統計的方法解決04/25 22:02
39F→: 我是在學校學統計的,業界的話就是學前輩怎麼用統計04/25 22:03
40F→: 或是看其他人怎麼在寫報告中使用統計來增強論述說服別人04/25 22:04
40F→: python夠用就好,資料科學家的價值不在於coding04/23 11:19
12F→: 你可以請前輩讀這篇文章做開始:04/16 02:25
13F→: https://research.google.com/pubs/pub43146.html04/16 02:25
14F→: 裡面具體地指出機器學習系統的挑戰04/16 02:25
15F→: 然後你們可以開始研究解法(這應該還是Open Problem)04/16 02:26
16F→: 我不覺得version control可以解決所有的問題, 但是如04/16 02:26
17F→: code / data schema 進 version control 應該只是基本04/16 02:26
18F→: 版上很多人給的建議是關於"code"方面的管理,下面有板友04/16 02:28
19F→: 推薦了"data"上的管理工具, 不過如果你們是每天收集新資04/16 02:28
20F→: 料更新模型的系統,那我想data dependency的挑戰人然很大04/16 02:29
2F推: 如果運用如Linear Regression的模型,可以考慮即時算04/02 22:51