[程式] R語言找兩變數之間是否有顯著關係

看板Statistics作者 (珍惜當下)時間7年前 (2017/06/21 11:49), 7年前編輯推噓2(2010)
留言12則, 3人參與, 最新討論串1/1
[軟體程式類別]: R [程式問題]: 統計 [軟體熟悉度]: 新手 [問題敘述]: 現有員工資料,欄位有年資(例如 3.5年)及是否在職中(A:在職中,T:已離職) 及其他許多欄位。 想找出員工大多待多久就離職?例如年資為3.5到4.0之間的離職率最高(T的數目最多), 或是哪個國家的離職率最高? 想請問R程式該怎麼寫比較好? [程式範例]: 資料表格式如下: ID Name StayYears Status Country 1 John 3.5 T USA 2 Mary 2.1 A USA 3 Ben 1.7 T French 4 Kevin 3.2 T India 5 Cindy 2.6 A French 6 Jack 3.9 A USA 7 Peter 1.3 A India 8 Andy 2.7 T French 9 David 0.8 A India 10 Nick 1.1 A USA -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 59.124.165.66 ※ 文章網址: https://www.ptt.cc/bbs/Statistics/M.1498016944.A.69B.html ※ 編輯: qazsd (59.124.165.66), 06/21/2017 11:49:50

06/21 15:18, , 1F
也遇到類似問題,提出我的作法,還請大家指正。連續
06/21 15:18, 1F

06/21 15:18, , 2F
對類別變數的相關性,可用oneway ANOVA,再用post-ho
06/21 15:18, 2F

06/21 15:18, , 3F
c細看各組差異;類別對類別變數,以你的例子,是否在
06/21 15:18, 3F

06/21 15:18, , 4F
職是二元變數,應也可用oneway ANOVA。R的寫法可參
06/21 15:18, 4F

06/21 15:18, , 5F
06/21 15:18, 5F

06/21 22:37, , 6F
把待的時間當成存活時間,離職表示死亡,未離職為
06/21 22:37, 6F

06/21 22:37, , 7F
設限資料
06/21 22:37, 7F

06/21 22:38, , 8F
去估計給定變數下的平均存活時間
06/21 22:38, 8F

06/21 22:38, , 9F
不知道會不會太難Orz
06/21 22:38, 9F

06/21 22:38, , 10F
這樣應該可以跑cox-model~~
06/21 22:38, 10F

06/21 22:40, , 11F
至於R怎麼寫,找一下吧,我覺得idea有了,程式不難
06/21 22:40, 11F

06/22 16:51, , 12F
可以用Survival 這個package
06/22 16:51, 12F
文章代碼(AID): #1PIUomQR (Statistics)