[程式] R要如何讀不規則的txt檔

看板Statistics作者 (享)時間11年前 (2013/02/25 14:34), 編輯推噓2(203)
留言5則, 3人參與, 最新討論串1/2 (看更多)
------------------------------------------------------------------------ [軟體程式類別]: R [程式問題]: 讀檔 [軟體熟悉度]: 請把以下不需要的部份刪除 低(1~3個月) [問題敘述]: 不規則的txt檔 譬如:身分證字號(ID)跟生日(b_bate) 死亡日(d_date) 一般人會要分開看 可是如果資料今天是 打成 X123456789050102550703 意思是id=X123456789 b_date=05年01月02日 d_date=55年07月03日 可是今天處理資料中 有人尚未死亡 故沒有d_date 有些則有 那要如何把這樣的資料有系統的讀入R呢? [程式範例]: ----------------------------------------------------------------------------- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 219.85.83.97

02/25 15:43, , 1F
這是很一般性質的字串處理,建議使用regular expression
02/25 15:43, 1F

02/25 15:44, , 2F
R內建有對regular expression的支援,請?grep
02/25 15:44, 2F

02/25 16:37, , 3F
一開始就沒空格 那讀進來也是一樣的
02/25 16:37, 3F

02/25 16:38, , 4F
可以用 substr("ABC",1,2) 這樣的方式去處理
02/25 16:38, 4F

02/25 19:17, , 5F
read.fwf(".txt", widths=c(10,6,6))
02/25 19:17, 5F
文章代碼(AID): #1HAmNxbR (Statistics)
文章代碼(AID): #1HAmNxbR (Statistics)