[閒聊] 大數據?別唬人了

看板Soft_Job作者 (Terry)時間11年前 (2013/05/14 15:02), 編輯推噓23(230183)
留言206則, 17人參與, 最新討論串1/1
原文: http://tinyurl.com/c32av9s 大陸譯文: http://tinyurl.com/cmc4wev 簡單的說, 統計學沒跟你說過: 資料"量"越大, 統計結果越準. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 116.59.241.171 ※ 編輯: Lordaeron 來自: 116.59.241.171 (05/14 15:23)

05/14 16:27, , 1F
Google不能不存頁面index,facebook不能漏存用戶訊息...
05/14 16:27, 1F

05/14 16:28, , 2F
還有很多針對使用者客製的服務都是不能用 sample 的
05/14 16:28, 2F

05/14 16:47, , 3F
Big data 跟cloud一樣是行銷手法,並非新發明新需求
05/14 16:47, 3F

05/14 19:18, , 4F
台灣得先搞出個Google or FB才需要煩惱bigdata吧
05/14 19:18, 4F

05/14 19:19, , 5F
不然真的是唬爛成分居多囉 手上的資料量明明用10年前的
05/14 19:19, 5F

05/14 19:20, , 6F
Oracle DB就可以跑得好好的 根本沒必要去跟人家趕流行
05/14 19:20, 6F

05/14 23:51, , 7F
Nobody ever got fired for buying a cluster 這篇文章說了
05/14 23:51, 7F

05/14 23:52, , 8F
你幾乎都不需要大數據處理~ 但他引用這篇文章根本誤導人...
05/14 23:52, 8F

05/14 23:54, , 9F
512 GB Memory 用來類比 Cluster 浪費錢 這是搞笑嘛?...
05/14 23:54, 9F

05/14 23:54, , 10F
光是要插 512 GB 記憶體伺服器的錢又是一件事了...
05/14 23:54, 10F

05/14 23:55, , 11F
Big Data is not a silver bullet 是確定的,但講唬人也是唬
05/14 23:55, 11F

05/14 23:55, , 12F
人就是了~
05/14 23:55, 12F

05/15 00:06, , 13F
好的資料勝過多資料,但是又好又多的資料呢?
05/15 00:06, 13F

05/15 01:06, , 14F
BigData如果是真的 那對台灣硬體廠商不是好消息
05/15 01:06, 14F

05/15 01:06, , 15F
因為這樣以後大家都用國外的雲端服務 硬體廠商利潤更低
05/15 01:06, 15F

05/15 01:07, , 16F
如果BigData是假的 買台server照樣跑得嚇嚇叫 那我們的
05/15 01:07, 16F

05/15 01:07, , 17F
廠商或還可以喘息一下
05/15 01:07, 17F

05/15 01:38, , 18F
我相信BigData有用. 但不是台灣的企業....
05/15 01:38, 18F

05/15 06:36, , 19F
好的資料能多嗎? 還是將好的定義降低?
05/15 06:36, 19F

05/15 07:25, , 20F
為什麼好資料不能多?願聞其詳
05/15 07:25, 20F

05/15 09:21, , 21F
我才想問呢, 為什麼能多?
05/15 09:21, 21F

05/15 09:24, , 22F
當天下都是賊時, 就是天下無賊, 簡單的道理.
05/15 09:24, 22F

05/15 09:49, , 23F
看看搜尋引擎出來的結果就知道了,資訊太多不見得好
05/15 09:49, 23F

05/15 11:58, , 24F
如果是to C 的領域,生意越好就越多
05/15 11:58, 24F

05/15 11:59, , 25F
另外個人化服務也需要高精度資料
05/15 11:59, 25F

05/15 13:04, , 26F
看來你是連問卷都沒設計過的,還是去做你的生意吧.
05/15 13:04, 26F

05/15 13:06, , 27F
這些資料大部分都在國外 而且現在fb, google都https的
05/15 13:06, 27F

05/15 13:06, , 28F
你頂多只有他ip address跟時間吧的資料吧
05/15 13:06, 28F

05/15 13:07, , 29F
說真的台灣應該是沒有bigdata, hadoop之類的需求吧
05/15 13:07, 29F

05/15 13:14, , 30F
!!某晶圓廠!!
05/15 13:14, 30F

05/15 14:03, , 31F
如果是每片wafer上的每個chip的每個資料可能有需要
05/15 14:03, 31F

05/15 14:22, , 32F
研究基因...哪個基因幹嘛的 要非常多人的全部基因資料
05/15 14:22, 32F

05/15 14:23, , 33F
...臺灣好像沒這個產業
05/15 14:23, 33F

05/15 14:34, , 34F
不是可能有需要,是人家就在做,只是沒跟著doop一下潮流.
05/15 14:34, 34F

05/15 14:34, , 35F
台灣有遇到big data的公司,只是不多。
05/15 14:34, 35F

05/15 14:46, , 36F
不過可以想見只要生意好,又有做log,未來都還是會有分析
05/15 14:46, 36F

05/15 14:46, , 37F
的需求。
05/15 14:46, 37F

05/15 15:11, , 38F
基因定序生物資訊分析應該是bigdata的失敗案例吧 幾年前炒
05/15 15:11, 38F

05/15 15:12, , 39F
做2千萬人的生意,有什麼好big data 的?
05/15 15:12, 39F
還有 127 則推文
05/21 00:12, , 167F
是你在亂扯吧。我講的就是這領域的目前的主流,你要批評這
05/21 00:12, 167F

05/21 00:13, , 168F
領域,又不是針對主流作法,非常的莫名其妙。
05/21 00:13, 168F

05/21 00:14, , 169F
當然啦,如果你要自己創造「L氏大數據」,然後說他是唬人
05/21 00:14, 169F

05/21 00:14, , 170F
的,我個人是沒意見的。
05/21 00:14, 170F

05/21 02:15, , 171F
big data比較像是Wush978說得這樣
05/21 02:15, 171F

05/21 02:19, , 172F
要從大量資料找出business intelligence這樣
05/21 02:19, 172F

05/21 09:15, , 173F
哪個叫data mining!!
05/21 09:15, 173F

05/21 09:17, , 174F
Data Mining 在你口中的Bigdata 還未在炒時就在Mine了
05/21 09:17, 174F

05/21 09:19, , 175F
再來, 從為何好資料不能多,一直扯放不進硬碟,再扣我冒子
05/21 09:19, 175F

05/21 09:20, , 176F
頂能轉的. wiki上中英文的DM 的定義都有.
05/21 09:20, 176F

05/21 12:00, , 177F
Big data本來就是包括storage跟analytics,而我覺得真正賣
05/21 12:00, 177F

05/21 12:00, , 178F
點並非storage而是analytics
05/21 12:00, 178F

05/21 12:01, , 179F
當然analytics就是data mining,也不是新東西,但是這東西
05/21 12:01, 179F

05/21 12:01, , 180F
之前沒發展到這麼成熟,最近幾年有明顯的進展,IBM的
05/21 12:01, 180F

05/21 12:02, , 181F
Watson跟Apple的Siri都是
05/21 12:02, 181F

05/21 12:02, , 182F
現在所有公司跟產業分析師都在講analytics能怎樣怎樣,當
05/21 12:02, 182F

05/21 12:03, , 183F
然中間會有灌水成份,有些狀況是講得很美好,實際功能卻有
05/21 12:03, 183F

05/21 12:04, , 184F
不小落差,目前說法是這東西依然未成熟,大概要再4~5年
05/21 12:04, 184F

05/21 12:04, , 185F
問題是4~5年後是不是真的就會成熟,這就只有天曉得了
05/21 12:04, 185F

05/21 12:05, , 186F
但身為科技公司,在大家都在講這是將來潮流時,你要賭一把
05/21 12:05, 186F

05/21 12:05, , 187F
說這東西不會成熟,還是多少投資一點玩玩看?
05/21 12:05, 187F

05/21 12:58, , 188F
@L, 是不是扣帽子大家心理有數。
05/21 12:58, 188F

05/21 13:03, , 189F
你的BIGDATA 跟別人不同, 還用我說. 更別說, 好資料的定
05/21 13:03, 189F

05/21 13:03, , 190F
義, 也是跟別人不同.
05/21 13:03, 190F

05/21 13:28, , 191F
@W, 其實我認為現在big data會熱,是因為種種技術成熟所導
05/21 13:28, 191F

05/21 13:29, , 192F
致的,換句話說,就是水到渠成。無論是資料的收集,到資料
05/21 13:29, 192F

05/21 13:30, , 193F
的分析,這目前看起來有太多的潛力了。例如Kaggle上就有很
05/21 13:30, 193F

05/21 13:31, , 194F
多好的結果。我以為成功不成功不是問題,差別只在多賺多少
05/21 13:31, 194F

05/21 17:56, , 195F
大家都是互相撞擊自己的意見 科學本身就是這樣
05/21 17:56, 195F

05/21 17:57, , 196F
IMP,DATA沒有好壞 只是你能不能分析而已 以前沒辦法分析
05/21 17:57, 196F

05/21 17:58, , 197F
現在可以分析這就是big data 好幾年前CERN就是big data
05/21 17:58, 197F

05/21 17:59, , 198F
就好的例子 只是現在可以分析的東西太多了 遠超過你能想
05/21 17:59, 198F

05/21 18:01, , 199F
想像的 什麼鬼資料都可以分析 只要你能說的通 拿出數據
05/21 18:01, 199F

05/21 18:02, , 200F
大家接受 沒有什麼好資料 壞資料的分別
05/21 18:02, 200F

05/21 18:17, , 201F
@e, 我認為資料的重要性是超過分析的。
05/21 18:17, 201F

05/21 18:19, , 202F
有一種說法叫garbage in, garbage out。不好的資料可能會
05/21 18:19, 202F

05/21 18:19, , 203F
誤導決策,造成很大的損失。不可不慎。
05/21 18:19, 203F

05/21 18:30, , 204F
也許 但我還是認為資料就是資料 沒有好壞之分 XD
05/21 18:30, 204F

05/22 10:36, , 205F
人也沒好壞之分,何苦將人抓去關<--這算屁話嗎?
05/22 10:36, 205F

05/25 01:33, , 206F
大資料是蒐集資料方法之一吧,可記拉基資料保後路
05/25 01:33, 206F
文章代碼(AID): #1HaU5poN (Soft_Job)