[問題] pandas resample 遺失資料

看板Python作者 (nathan)時間5年前 (2018/06/07 22:03), 5年前編輯推噓2(204)
留言6則, 3人參與, 5年前最新討論串1/1
請問各位前輩 我在做resample的時候form daily to weekly daily 的資料裡並沒有NaN 但是轉換成weekly後就多了21row的NaN 爬了很多文都找不到原因 請問大家這是什麼原因呢? Input: df_ohlc = df.resample('W').agg({'Open': 'first', 'High': 'max', 'Low': 'min', 'Close': 'last'}) print('count df_ohlc weekly null value:'+str(df_ohlc.isnull().sum())) Output: count df_ohlc weekly null value:Open 21 High 21 Low 21 Close 21 dtype: int64 Open High Low Close Date 2014-12-21 NaN NaN NaN NaN 2015-01-04 NaN NaN NaN NaN 2015-01-18 NaN NaN NaN NaN 2015-01-25 NaN NaN NaN NaN 2015-02-22 NaN NaN NaN NaN 2015-03-01 NaN NaN NaN NaN 2015-04-26 NaN NaN NaN NaN 2015-05-03 NaN NaN NaN NaN 2015-05-10 NaN NaN NaN NaN 2015-08-02 NaN NaN NaN NaN 2015-08-09 NaN NaN NaN NaN 2015-08-23 NaN NaN NaN NaN 2015-11-29 NaN NaN NaN NaN 2015-12-20 NaN NaN NaN NaN 2016-02-14 NaN NaN NaN NaN 2016-04-10 NaN NaN NaN NaN 2016-04-24 NaN NaN NaN NaN 2016-06-12 NaN NaN NaN NaN 2016-07-17 NaN NaN NaN NaN 2016-07-24 NaN NaN NaN NaN 2016-07-31 NaN NaN NaN NaN 附上2014-11-26~2018-06-06 0050.TW.csv檔https://tinyurl.com/ybffoxlt -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 223.140.148.5 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1528380236.A.D3D.html

06/07 22:46, 5年前 , 1F
有幾周沒開盤阿!如新年連假之類的
06/07 22:46, 1F
※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 11:50:55 ※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 11:52:37 ※ 編輯: nathan7812 (223.140.148.5), 06/08/2018 12:01:53

06/08 12:03, 5年前 , 2F
K大提到的問題我回去檢視後,好像不僅止於放假的問題?
06/08 12:03, 2F

06/08 13:24, 5年前 , 3F
你的原始資料缺的很嚴重喔,很多天都沒資料
06/08 13:24, 3F

06/08 13:29, 5年前 , 4F
謝謝B大提醒,原檔真的缺的很嚴重,冏rz
06/08 13:29, 4F

06/09 01:05, 5年前 , 5F
結論上來說明一下,yahoo finance的歷史資料真的缺很
06/09 01:05, 5F

06/09 01:05, 5年前 , 6F
大,在找不到其他api之前,只能自己爬了。
06/09 01:05, 6F
文章代碼(AID): #1R6JjCqz (Python)