Re: [問題] pandas 問題

看板Python作者 ( )時間6年前 (2018/02/05 22:32), 6年前編輯推噓2(202)
留言4則, 2人參與, 6年前最新討論串2/3 (看更多)
不好意思,想再問另外一個問題 df= UserID time A 16:01 A 16:03 A 16:04 A 16:07 A 16:08 B 17:10 B 17:11 想計算每個USER最近值相剪的數列 也就是 A 2=16:03-16:01 A 1=16:04-16:03 A 3=16:07-16:04 B 1=17:11-17:10 ※ 引述《lance5487 ( )》之銘言: : 不好意思,小弟是pandas新手,想請問pandas的問題,請各位大大幫幫小弟忙QQ : 假設今天有一個df : df= UserID time : A 16:01 : A 16:03 : A 16:04 : A 16:07 : A 16:08 : B 17:10 : B 17:11 : 想統計根據groupby UserID後 以 X 分鐘時間內統計的平均,眾數,最大值 : 假設以五分鐘為例 : A : 16:01 5分鐘後為 16:06 => 共 3 筆 (16:01,16:03,16:04) : 16:03 5分鐘後為 16:08 => 共 4 筆 (16:03,16:04,16:07,16:08) : 16:04 5分鐘後為 16:09 => 共 3 筆 (16:04,16:07,16:08) : 16:07 5分鐘後為 16:12 => 共 2 筆 (16:07,16:08) : 16:08 5分鐘後為 16:13 => 共 1 筆 (16:08) : 平均:(1+2+3+3+4)/5=3.6 : 最大值:4筆 : 眾數:3筆 : 最後整理成 : USERID 平均 眾數 最大值 : A 3.6 3 4 : B 1.5 1或2(1.5是最好) 2 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.126.136 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1517841120.A.7D5.html

02/06 05:41, 6年前 , 1F
02/06 05:41, 1F
好像不行 因為這樣好像會計算到不同user,想求的只有同一個user底下的差值 ,因為user蠻多的QQ ※ 編輯: lance5487 (220.129.59.40), 02/06/2018 06:07:47

02/06 06:43, 6年前 , 2F
查到了 好像用groupby跟diff就可以了
02/06 06:43, 2F

02/06 06:45, 6年前 , 3F
原本想說關鍵字不好下 囧
02/06 06:45, 3F

02/06 10:11, 6年前 , 4F
喔喔沒看到要用user分
02/06 10:11, 4F
文章代碼(AID): #1QU6hWVL (Python)
討論串 (同標題文章)
文章代碼(AID): #1QU6hWVL (Python)