Re: [技術]別老扯什麼Hadoop了,你的數據根本不夠大
※ 引述《realmeat (真肉)》之銘言:
: ※ 引述《Lordaeron (Terry)》之銘言:
: : 譯文: http://geek.csdn.net//news/detail/2780
: : 原文: http://www.chrisstucchio.com/blog/2013/hadoop_hatred.html
: 控制map-reduce是一回事
: 搞懂整個map-reduce每個步驟怎進行是一回事
: 能夠控制map-reduce每個環節是另一回事
: 用map-reduce控制hbase又是另一回事
: 使用hdfs是一回事
: 了解hdfs架構又是一回事
: 搞懂hdfs跟map-reduce之間的關連又是一回事
: 搞懂hdfs跟hbase name server之間的關連又是一回事
: 設定job tracker是一回事
: 控制scheduler又是另一回事
: 讓map-reduce 有效率的執行也是一回事
: mapreduce跟mapred也是不同一件事啊 (爆
: 大象書其實也沒有寫太多細節的事,
: 能幾個字就說完hadoop, 也真的頗神奇 (笑
: 不過他真的很難用 (無奈
這篇說得很好啊。
很多人根本不去了解細節,就在靠別人的二手發言去學習。
我在剛開始碰 MapReduce時,拿經典的字數計算來當教材,
實在搞不懂 MapReduce 的概念與資料庫 Group 運算的做法有什麼不同
更覺得 Hadoop/MapReduc/HDFS 不就是十幾年前流行過的分散式系統而已嗎?
把工作拆成小工作到各節點,最後再彙總。
這概念不就是 Divide and Conquer 而已嗎。
我也不知道為何中間要有 Shuffle phase,直接兩階段 Devide and Conquer不就好。
更不知道為何不在 Map階段就做掉所有的事情,分那麼多階段幹嘛。
於是我一開始根本就不鳥 Hadoop 的 MapReduce 與 HDFS,
直接在我自己的分散式環境下用自己的方式把工作拆到多個節點去做。
幾乎等於自己在做一套專用的分散式批次處理環境。
後來自己慢慢摸,發現一些瓶頸,例如擴充的瓶頸、效能的瓶頸,
回頭重看 MapReduce 才知道其中的奧妙與觀念的重點。
Hadoop/MapReduce/HDFS 的確不適用於所有情形。
但是也沒原文說得那麼扯,把 MapReduce劣化成用SQL Group by語法。
原文很多內容真的看看笑笑就好。
Hadoop 解決了很多你自己在搞分散式系統時會遇到的擴充、管理、效能瓶頸。
而且把這些問題包起來,你永遠看不到,讓人覺得他沒什麼,
其他工具隨便就能取代一樣。
這觀念就好像,你不懂Facebook,然後說Facebook沒什麼,
隨便自己寫個互動網頁也能取代一樣。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 59.102.185.21
推
09/20 16:56, , 1F
09/20 16:56, 1F
推
09/20 17:10, , 2F
09/20 17:10, 2F
推
09/20 17:20, , 3F
09/20 17:20, 3F
→
09/20 17:21, , 4F
09/20 17:21, 4F
→
09/20 17:24, , 5F
09/20 17:24, 5F
→
09/20 17:25, , 6F
09/20 17:25, 6F
→
09/20 17:25, , 7F
09/20 17:25, 7F
→
09/20 17:26, , 8F
09/20 17:26, 8F
→
09/20 18:00, , 9F
09/20 18:00, 9F
→
09/20 18:00, , 10F
09/20 18:00, 10F
推
09/20 20:50, , 11F
09/20 20:50, 11F
→
09/20 21:37, , 12F
09/20 21:37, 12F
推
09/20 22:33, , 13F
09/20 22:33, 13F
→
09/21 07:12, , 14F
09/21 07:12, 14F
→
09/21 07:26, , 15F
09/21 07:26, 15F
推
09/21 12:04, , 16F
09/21 12:04, 16F
→
09/21 13:19, , 17F
09/21 13:19, 17F
→
09/21 13:19, , 18F
09/21 13:19, 18F
→
09/21 13:20, , 19F
09/21 13:20, 19F
→
09/21 13:20, , 20F
09/21 13:20, 20F
→
09/21 13:21, , 21F
09/21 13:21, 21F
→
09/21 13:22, , 22F
09/21 13:22, 22F
→
09/21 13:23, , 23F
09/21 13:23, 23F
→
09/21 14:30, , 24F
09/21 14:30, 24F
→
09/21 14:31, , 25F
09/21 14:31, 25F
→
09/22 03:19, , 26F
09/22 03:19, 26F
→
09/22 13:59, , 27F
09/22 13:59, 27F
→
09/22 14:01, , 28F
09/22 14:01, 28F
推
09/23 10:10, , 29F
09/23 10:10, 29F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):