作者查詢 / Wush978

總覽項目: 發文 | 留言 | 暱稱
作者 Wush978 在 PTT [ DataScience ] 看板的留言(推文), 共61則
限定看板:DataScience
看板排序:
全部Gossiping4495HatePolitics2903R_Language1256Statistics355NTUMath91295nCoV2019264Soft_Job260NTHU_STAT97238Military136GO129LoL126NTHU_STAT96118C_Chat112NTU67Philo-0364BabyMother62DataScience61CrossStrait59C_and_CPP55PHP42BoardGame39Hearthstone31NTHU_STAT9831Programming23Tech_Job23PUBG22BattleRoyale21Python18SLG15MOD14NBA13sex13Ikariam12NTUMath9210HSNU_9789joke9NCCU07_Ghis8CVS7L_TalkandCha7NTUcourse7Sub_CS7Wen-Shan7feminine_sex6PathofExile6Baseball5Hate5Steam5HSNU_9854LawBasketbal4Linux4marriage4Prob_Solve4Salary4TKU_TSPCB934W-Philosophy4Warfare4eSports3FATE_GO3FBG3Federer3PhD3PLT3Poker3StupidClown3SWhite3Tainan3Tennis3Windows3EngTalk2GossipPicket2LGS2Magic2MdnCNhistory2MenTalk2NBME_Lab2NTUHistory882PublicIssue2PublicServan2specialman2Sub_GOnline2WomenTalk2AfterPhD1B88A011XX1Boy-Girl1Broad_Band1Chan_Mou1chess1ck54th3051Cloud1CodeJob1consumer1CPU_FS7411CS92Lien1Daan1Database1dlsh-7th-3031Ecophilia1EZsoft1Fantasy1FCSH_133101FCU_EE00B1FJU1FJU-ACCR941FJU-Stat95A1FJU-STAT95B1FLAT_CLUB1Google1Haruhi1home-sale1HomeTeach1Hornets1Hsinchu1HsinYi1HSNU_11431HSNU_9861Jeremy_Lin1Ju-881KOTDFansClub1KS95-3181KS96-3141KS97-3131LAW1Management1Math1media-chaos1MobileComm1movie1NCCU00_Histo1NCCU_C-Baske1NCHU-Stat971NCTU-STAT98G1NCU91Finance1NSYSU1NSYSU_EE95-11NTHU-EE-CAPT1NTUCH-901NTUE-CS1021NTUE-CS1041NTUE-CS981NTUE-DC991NTUE-EPC-1001NTUEE_BL5271NTUEOE-IOL1NTUmed911NUK_AC981Orzhong97cl1Policy1PTHS95-3101RealPlaying1RS6171scu_transfer1SM04th011SM05th3xx1SorryPub1studyabroad1Taipei1toberich1TypeMoon1TYSH50-3031UTAH-JAZZ1Volunteer1YOLO1YP91-3111<< 收起看板(163)
首頁
上一頁
1
2
下一頁
尾頁
[問題] 手刻機器學習模型
[ DataScience ]39 留言, 推噓總分: +12
作者: retest75 - 發表於 2023/01/20 22:02(2年前)
18FWush978: 手刻模型要學數值最佳化套件, 像是LBFGS 或是 SGD等等01/22 10:42
19FWush978: 還有要練習自己建model matrix ,需要線性代數知識01/22 10:44
20FWush978: 以及會用相關的函式庫01/22 10:44
[問題] 任意兩條軌跡的相似度
[ DataScience ]3 留言, 推噓總分: +2
作者: ccbruce - 發表於 2022/03/25 10:24(3年前)
1FWush978: 就用你手上的資料試試看吧,這才是Data Science不是嗎?03/26 18:45
Fw: [心得] 分享 台鐵驗證碼辨識/轉文字 package
[ DataScience ]7 留言, 推噓總分: +4
作者: f496328mm - 發表於 2019/02/17 22:56(6年前)
2FWush978: 小心違法02/18 00:52
3FWush978: 我忘記是哪一條了,但是之前有印象做台鐵驗證碼的OCR可能02/18 00:54
4FWush978: 有觸法之虞,建議低調02/18 00:55
[問題] 類別變數再神經網路或是其他 ML 方法處理
[ DataScience ]32 留言, 推噓總分: +6
作者: zxc741qaz123 - 發表於 2018/09/09 16:21(7年前)
26FWush978: 現在除了做dummy variable外還流行做embedding了09/10 21:27
[討論] 適合二元分類的演算法
[ DataScience ]30 留言, 推噓總分: +16
作者: D0128431 - 發表於 2018/06/18 19:03(7年前)
10FWush978: nearest neighbor 類的演算法,例如 1NN06/21 02:55
[問題] 關於CNN架構設計及GAN的epoch設計
[ DataScience ]52 留言, 推噓總分: +9
作者: arch2453 - 發表於 2018/06/10 16:22(7年前)
18FWush978: 我沒聽過越多層辨識率會越高的說法06/10 23:28
19FWush978: https://www.slideshare.net/tw_dsconf/ss-6224535106/10 23:33
20FWush978: Deeper usually does not imply better06/10 23:33
21FWush978: (p87)06/10 23:34
32FWush978: 不是,參數多只是比較有彈性,不是比較好06/11 14:55
33FWush978: 二十年前統計理論就可以告訴你當參數超過需要的參數時,06/11 14:56
34FWush978: 會以什麼樣的方式來傷害模型06/11 14:56
35FWush978: 層數變深的進步主要是針對計算上的問題克服,但是基本統06/11 15:03
36FWush978: 計的定理是針對「利用數據建模」這件事情去給予限制,這06/11 15:03
37FWush978: 部分並沒有被突破。06/11 15:03
38FWush978: 而我們也只能說在影像等應用領域,似乎越深層的模型結構06/11 15:05
39FWush978: 越接近真理,但是直接下結論越深越好是很危險的。我研究06/11 15:05
40FWush978: 的廣告領域,深度學習的表現並沒有特別突破,反而是另一06/11 15:05
41FWush978: 類模型在比賽中是常勝軍。06/11 15:05
42FWush978: 我今年投稿kdd的實驗中,在處理censoring 的問題時,甚06/11 15:08
43FWush978: 至沒有證據顯示深度學習一定比linear好...是個很難做的06/11 15:08
44FWush978: 問題。06/11 15:08
45FWush978: 看別人成功的經驗是沒錯的,但是目前在這行,關鍵在實驗06/12 09:40
46FWush978: 設計:如何建立有效率的環境讓你快速驗證方法是否適用於06/12 09:40
47FWush978: 你的問題06/12 09:40
48FWush978: 沒辦法,目前這個領域處於實驗、方法都不太reproducible06/12 09:41
49FWush978: 簡單來說,別人覺得有用的方法,在你的問題上不一定有用06/12 09:41
50FWush978: 所以就是看別人怎麼做,但是自己要仔細檢驗...06/12 09:41
51FWush978: 話說這行目前paper的可信度也不如傳統科學領域,所以驗證06/12 09:42
52FWush978: 與懷疑非常非常重要...06/12 09:42
[問題] 數據類職業進修
[ DataScience ]40 留言, 推噓總分: +5
作者: janet5141li - 發表於 2018/04/24 00:47(7年前)
28FWush978: 不會程式的話,專注學分析資料會比較有價值04/25 00:58
29FWush978: 程式只是影響你分析的工具可以用到哪裡,用excel也能分析04/25 00:58
30FWush978: 很多了04/25 00:58
31FWush978: 要學程式建議等你真的需要的時候再開始自學R, python等工04/25 00:59
32FWush978: 具,學得有點興趣再考慮上課。我目前遇到業界非分析非資04/25 01:00
33FWush978: 工的資料科學高手,都是主賣像視覺化、或是專業領域(行銷04/25 01:00
34FWush978: ...等等)的,程式只是加分,不是他們讓人覺得威猛的點04/25 01:00
37FWush978: 最基礎的統計學好,知道怎麼解釋數據,以及當老闆的問題04/25 22:02
38FWush978: 或工作的問題出來之後,如何用數據與統計的方法解決04/25 22:02
39FWush978: 我是在學校學統計的,業界的話就是學前輩怎麼用統計04/25 22:03
40FWush978: 或是看其他人怎麼在寫報告中使用統計來增強論述說服別人04/25 22:04
[問題] 工作上要成為資料科學家python該如何練功
[ DataScience ]40 留言, 推噓總分: +15
作者: ruthertw - 發表於 2018/04/18 15:21(7年前)
40FWush978: python夠用就好,資料科學家的價值不在於coding04/23 11:19
[討論] 機器學習如何做好version control???
[ DataScience ]20 留言, 推噓總分: +3
作者: littleyuan - 發表於 2018/04/14 05:15(7年前)
12FWush978: 你可以請前輩讀這篇文章做開始:04/16 02:25
13FWush978: https://research.google.com/pubs/pub43146.html04/16 02:25
14FWush978: 裡面具體地指出機器學習系統的挑戰04/16 02:25
15FWush978: 然後你們可以開始研究解法(這應該還是Open Problem)04/16 02:26
16FWush978: 我不覺得version control可以解決所有的問題, 但是如04/16 02:26
17FWush978: code / data schema 進 version control 應該只是基本04/16 02:26
18FWush978: 版上很多人給的建議是關於"code"方面的管理,下面有板友04/16 02:28
19FWush978: 推薦了"data"上的管理工具, 不過如果你們是每天收集新資04/16 02:28
20FWush978: 料更新模型的系統,那我想data dependency的挑戰人然很大04/16 02:29
[問題] 推薦系統除了預先準備結果有更好的方法嗎
[ DataScience ]18 留言, 推噓總分: +7
作者: del680202 - 發表於 2018/04/01 19:49(7年前)
2FWush978: 如果運用如Linear Regression的模型,可以考慮即時算04/02 22:51
首頁
上一頁
1
2
下一頁
尾頁