Re: [討論] 會用Hadoop == 具備大數據處理能力?

看板Soft_Job作者 (881 forever)時間9年前 (2016/07/07 10:22), 編輯推噓4(4012)
留言16則, 6人參與, 最新討論串5/6 (看更多)
板上有好多會大數據的高手啊 搭一下順風車,問一個問題 小的最近公司需要所以在鑽研Spark 然後在玩Spark SQL裡面的 DataFrame,他很像Python裡面的Pandas 應該會很好用才對 請問一下各位大大,除了官網上的lib介紹 這有比較完整的教學文件(或是書)可以看嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.220.35.20 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1467858134.A.8F5.html

07/07 10:44, , 1F
Gitbook有人分享基礎教學手冊,不過我大多是看官網的手冊
07/07 10:44, 1F

07/07 10:44, , 2F
07/07 10:44, 2F

07/07 10:47, , 3F
這東西太新改太快還是要靠官網,不過官網文件真的不是
07/07 10:47, 3F

07/07 10:47, , 4F
很清楚...
07/07 10:47, 4F

07/07 11:02, , 5F
官網吧,然後不要完全相信他的 Dataframe API,自己試過
07/07 11:02, 5F

07/07 11:02, , 6F
確定是對的再說(切身之痛)
07/07 11:02, 6F

07/07 11:22, , 7F
^^^^^^^^ 可以在不被告前提舉例嗎XD
07/07 11:22, 7F

07/07 11:25, , 8F
偷偷偷渡最近我會release的dataframe opensource lib
07/07 11:25, 8F

07/07 11:25, , 9F

07/07 18:44, , 10F
我被搞過 isnull 不是真的 isnull,最後自己寫判斷式,
07/07 18:44, 10F

07/07 18:44, , 11F
但版本改這麼快沒有太多參考價值就是了
07/07 18:44, 11F

07/07 18:50, , 12F
當時 dataframe api doc 有些地方寫得模糊,加上抄了未
07/07 18:50, 12F

07/07 18:50, , 13F
必會動,動了不一定會對,都要自己 try 過我才敢用,現
07/07 18:50, 13F

07/07 18:50, , 14F
在可能有改善(?)
07/07 18:50, 14F

07/08 00:30, , 15F
假的isnull應該浪費不少時間debug XD
07/08 00:30, 15F

07/08 07:51, , 16F
別說了…QQ
07/08 07:51, 16F
文章代碼(AID): #1NVRpMZr (Soft_Job)
討論串 (同標題文章)
文章代碼(AID): #1NVRpMZr (Soft_Job)