[問題] 關於串檔及存活率分析
如果是跟統計軟體有關請重發文章。
如果跟論文有關也煩請您重發文章。
請詳述問題內容,以利板友幫忙解答,過短文章依板規處置,請注意。
是這樣的
目前在進行健保資料的研究
想把住院檔(dd檔)串門診檔(cd檔)及承保檔(id檔)
住院檔已經利用整合功能將同ID同次住院但申報多筆的資料整合
以整合過的住院檔串門診檔時
一直覺得串出來的不正確
因為
根據疾病特性
出院後應該會有多筆門診返診時間(至少半年要返診追蹤一次)
所以預期串出來的門診檔人數會比住院檔人數多
但是
我串出來之後
住院人數是幾筆門診人數就是幾筆(我是以ID進行兩表的資料合併)
想請問
1.如果住院檔只有一筆(也就是只住院一次)但門診有三筆
那串出來會如何呈現呢?
是像
(A)會出現空格
ID IN_DATE OPD_DATE
1245 20120101 20120601
20121201
20130601
還是像
(B)會把空格填滿
ID IN_DATE OPD_DATE
1245 20120101 20120601
1245 20120101 20121201
1245 20120101 20130601
因為我是選擇兩表皆提供觀察值
所以如果像A一樣的話
那我就會刪掉很多筆了.....
另外
想問一個存活率的問題
我手邊共有5年的資料
想知道第一年存活率和第三年存活率
應該怎樣去設定時間呢(或者是說應該如何去進行這樣的分析)
為什麼這麼問呢?
因為每個病人的開刀時間都不一樣
假設我的5年資料是20080101-20131231
有一個病人是20131205開刀
然後活著回家
可是這樣也不能算一年啊
又如果
有病人是20080625開刀
然後一直存活到20131231都沒有顯示死亡
那當然這個病人第三年依然存活
如果直接把全部的資料丟進去跑存活分析
似乎有點怪怪的
所以想請問大家
是否有比較好的做法
謝謝大家
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.228.181.141
※ 文章網址: http://www.ptt.cc/bbs/Statistics/M.1419693957.A.D7C.html
推
12/27 23:35, , 1F
12/27 23:35, 1F
→
12/27 23:36, , 2F
12/27 23:36, 2F
→
12/27 23:51, , 3F
12/27 23:51, 3F
→
12/27 23:52, , 4F
12/27 23:52, 4F
推
12/27 23:57, , 5F
12/27 23:57, 5F
→
12/27 23:58, , 6F
12/27 23:58, 6F
→
12/28 00:00, , 7F
12/28 00:00, 7F
→
12/28 00:01, , 8F
12/28 00:01, 8F
→
12/28 00:01, , 9F
12/28 00:01, 9F
→
12/28 00:02, , 10F
12/28 00:02, 10F
→
12/28 00:02, , 11F
12/28 00:02, 11F
→
12/28 00:03, , 12F
12/28 00:03, 12F
→
12/28 00:06, , 13F
12/28 00:06, 13F
→
12/28 00:07, , 14F
12/28 00:07, 14F
→
12/28 00:08, , 15F
12/28 00:08, 15F
推
12/28 00:08, , 16F
12/28 00:08, 16F
→
12/28 00:09, , 17F
12/28 00:09, 17F
→
12/28 00:09, , 18F
12/28 00:09, 18F
→
12/28 00:11, , 19F
12/28 00:11, 19F