作者查詢 / Wush978
作者 Wush978 在 PTT [ Statistics ] 看板的留言(推文), 共355則
限定看板:Statistics
看板排序:
全部Gossiping4495HatePolitics2903R_Language1256Statistics355NTUMath91295nCoV2019264Soft_Job260NTHU_STAT97238Military136GO129LoL126NTHU_STAT96118C_Chat112NTU67Philo-0364BabyMother62DataScience61CrossStrait59C_and_CPP55PHP42BoardGame39Hearthstone31NTHU_STAT9831Programming23Tech_Job23PUBG22BattleRoyale21Python18SLG15MOD14NBA13sex13Ikariam12NTUMath9210HSNU_9789joke9NCCU07_Ghis8CVS7L_TalkandCha7NTUcourse7Sub_CS7Wen-Shan7feminine_sex6PathofExile6Baseball5Hate5Steam5HSNU_9854LawBasketbal4Linux4marriage4Prob_Solve4Salary4TKU_TSPCB934W-Philosophy4Warfare4eSports3FATE_GO3FBG3Federer3PhD3PLT3Poker3StupidClown3SWhite3Tainan3Tennis3Windows3EngTalk2GossipPicket2LGS2Magic2MdnCNhistory2MenTalk2NBME_Lab2NTUHistory882PublicIssue2PublicServan2specialman2Sub_GOnline2WomenTalk2AfterPhD1B88A011XX1Boy-Girl1Broad_Band1Chan_Mou1chess1ck54th3051Cloud1CodeJob1consumer1CPU_FS7411CS92Lien1Daan1Database1dlsh-7th-3031Ecophilia1EZsoft1Fantasy1FCSH_133101FCU_EE00B1FJU1FJU-ACCR941FJU-Stat95A1FJU-STAT95B1FLAT_CLUB1Google1Haruhi1home-sale1HomeTeach1Hornets1Hsinchu1HsinYi1HSNU_11431HSNU_9861Jeremy_Lin1Ju-881KOTDFansClub1KS95-3181KS96-3141KS97-3131LAW1Management1Math1media-chaos1MobileComm1movie1NCCU00_Histo1NCCU_C-Baske1NCHU-Stat971NCTU-STAT98G1NCU91Finance1NSYSU1NSYSU_EE95-11NTHU-EE-CAPT1NTUCH-901NTUE-CS1021NTUE-CS1041NTUE-CS981NTUE-DC991NTUE-EPC-1001NTUEE_BL5271NTUEOE-IOL1NTUmed911NUK_AC981Orzhong97cl1Policy1PTHS95-3101RealPlaying1RS6171scu_transfer1SM04th011SM05th3xx1SorryPub1studyabroad1Taipei1toberich1TypeMoon1TYSH50-3031UTAH-JAZZ1Volunteer1YOLO1YP91-3111<< 收起看板(163)
15F→: 學一下dplyr的group_by?12/01 15:54
1F→: 從迴歸開始吧10/23 14:55
3F→: 先估計你需要的RAM個數。直接跟老師要個一萬筆資料,讀到10/19 20:25
4F→: R/python之中利用API (R 用 object.size, python 我不知)10/19 20:26
5F→: 查記憶體用量。然後乘以1000就是千萬筆資料需要的記憶體10/19 20:26
6F→: 然後再乘以2,就差不多是你要穩穩整理資料需要的記憶體10/19 20:26
7F→: 如果你的記憶體低於我上面講的方法算出來的數字,整理資10/19 20:27
8F→: 料會比較辛苦一點。10/19 20:28
9F→: 另外資料分析我比較推桌機,比筆電便宜,長時間跑也可以10/19 20:29
10F→: 放著10/19 20:29
4F→: 如果你有效能問題的話,就不建議用R直接做10/13 12:13
5F→: 不過50萬筆對桌機來說不吃力,你可以考慮把多個篩選的布10/13 12:14
6F→: 林運算式寫出來之後,再用&算出集合,然後搭配中括號[10/13 12:15
1F→: console有警告你,應該是字型問題09/03 22:50
4F→: FDA: R OK for drug trials http://0rz.tw/TdyF703/03 00:40
5F→: 不過R 要取代SAS最大的困難在人, 誰沒事會想把自己跑若干03/03 00:41
6F→: 年的程式從SAS換成R? 出錯誰頂?03/03 00:41
7F→: 但是反過來看,新的單位就很有機會用R了,因為沒包袱03/03 00:43
1F→: 試試看用strsplit(df$Price, split = "(") 然後再去整理01/09 23:21
2F→: 有興趣了解細節的話,可以參考R語言翻轉教室的01/09 23:22
3F→: RDataEngineer 系列的第一個單元01/09 23:22
4F→: 翻轉教室的網址: http://datascienceandr.org01/09 23:22
6F→: data.frame中的factor型態在跑lm的時候會自動轉成dummy06/16 18:57
7F→: variable。細節可以參考model.matrix06/16 18:57
8F→: http://wush978.github.io/FeatureHashing/#16 也有一些06/16 18:58
9F→: 相關資料06/16 18:58
7F→: Rstudio or jupyter ir-kernel05/15 14:24
3F→: 各有利弊, windows處理中文資料比較麻煩, mac 繪圖視窗不04/18 15:42
4F→: 是原生的,所以也比較麻煩04/18 15:42
6F→: 預設用起來沒差,但是當遇到中文時,有字型問題04/18 18:11
7F→: 我的意思是說,你在mac上用R畫圖,普通狀況就和其他的相04/18 18:12
8F→: 同,但是當遇到中文的時候,會有額外的麻煩04/18 18:12