[問題] spark 資料減去平均值
目前資料已分成一串tuple存在RDD裡面 (ID, Data)
目前想做的是將Data值減去其ID的Data平均值
例如: (1,10) (1,20) (2,10) 跑完後會變成
(1,-5) (1,5) (2,0) 這樣
因為剛接觸不太清楚該怎麼實作
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 67.161.17.57
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1538372100.A.827.html
→
10/01 21:55,
5年前
, 1F
10/01 21:55, 1F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):