[問題] hadoop map reduce如何一次跑三種reduce

看板java作者 (22)時間13年前 (2012/08/10 14:52), 編輯推噓4(406)
留言10則, 6人參與, 最新討論串1/1
我的問題是要把一個大log檔倒入db後 再下sql select att_id , max(timestamp) , min(timestamp) , count(1) from table_a 這件事改成用hadoop的map reduce做 我已經寫好分別對 max, min , count三件事的的reducer att_id是map output key, value前兩個Map來的是timestamp 包成longwritable 後面一個的是intwritable 但是要分成三次來做,實在是浪費了兩次maper的處理時間 而且分成三個輸出,要再另外合併 請問有沒有辦法在一次reduce裡完成 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 210.69.230.190

08/10 14:54, , 1F
這個... 你有沒有考慮在 Database 版問?
08/10 14:54, 1F

08/10 15:30, , 2F
這是java問題吧 我覺得會被請回來
08/10 15:30, 2F

08/10 18:23, , 3F
這可以去 Programming 跟 Prob_Solve,因為是演算法問題吧
08/10 18:23, 3F

08/10 21:22, , 4F
Write imtermediate result to hdfs,
08/10 21:22, 4F

08/10 21:33, , 5F
Then read via (empty map + reduce)*(thrice)
08/10 21:33, 5F

08/11 00:42, , 6F
針對同一個key做事,應可以一次做完…
08/11 00:42, 6F

08/11 07:09, , 7F
我等等把一些code放上來
08/11 07:09, 7F

08/11 19:09, , 8F
有cloud板
08/11 19:09, 8F

08/11 19:10, , 9F
也可以到台灣雲端論壇發問 http://forum.hadoop.tw/
08/11 19:10, 9F

08/11 19:12, , 10F
你的問題應該不難解
08/11 19:12, 10F
文章代碼(AID): #1G9A-Uwn (java)