Re: [程式] SAS選取號碼

看板Statistics作者 (嘆這世間無奈好多)時間15年前 (2010/04/29 18:13), 編輯推噓1(101)
留言2則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《centrair (日本中部國際空港)》之銘言: ------------------------------------------------------------------------ [軟體程式類別]: SAS [程式問題]: 資料處理 [軟體熟悉度]: 低(1~3個月) [問題敘述]: 大家好,前幾天從A資料庫抓了大約有10,000多筆公司的資料 而目前要與B資料庫進行合併(merge),但是這兩個資料庫唯一的共通點就是cusip 而經過觀察發現這兩個資料庫的cusip只有前6碼相同(總共9碼), 所以我想詢問板上的各位大大,SAS是否有能選取某資料的前6碼的功能呢? 另外,我在合併的時候,log視窗常有出現一個咖啡色的錯誤指令說明如下: ERROR: Variable CUSIP has been defined as both character and numeric. 我是否需要對cusip先做什麼樣的處理呢? 謝謝各位的回答了<(_ _)> [程式範例]: ----------------------------------------------------------------------------- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.39.153.215

03/19 11:05,
substr
03/19 11:05

03/19 11:06,
推一樓
03/19 11:06

03/19 11:12,
謝謝,我會試試看
03/19 11:12

03/19 14:00,
會失敗 因為九碼公司的前六碼 會有一推重複的
03/19 14:00

03/19 14:00,
你必須看看還有沒有其他資料庫
03/19 14:00

03/19 14:01,
美國資料 ticker permno cusip GVKEY都可以指出同一下公司
03/19 14:01

03/19 14:03,
如果 你可以有其他資料庫 請先跟其他資料合併
03/19 14:03

03/19 14:06,
我說的失敗不是指程式上的失敗
03/19 14:06

03/19 14:06,
而是合併出來的資料 本身就會有問題 請小心
03/19 14:06

03/19 15:16,
感謝樓上,我會注意的:)
03/19 15:16

03/22 00:27,
CUSIP前六碼指的是公司,並不會指向不同公司。
03/22 00:27

03/22 00:28,
第七、八碼指的是同一家公司不同的股票或債券等issue
03/22 00:28

03/25 14:36,
後來觀察,樓上正解,不過也謝謝tew:)
03/25 14:36
不好意思借這個標題來問一下 我也是用CUSIP在合併CRSP跟COMPUSTAT的資料 subcusip=substr(cusip,1,8); 取出前八碼作為合併依據 但log檔出現下面訊息 WARNING: Multiple lengths were specified for the BY variable subcusip by input data sets. This may cause unexpected results. 請問是否是因為cusip中同時還有英文跟數字所以才產生這樣的問題? 可是似乎並不會每一步都出現這樣的問題 似乎是CRSP內的資料以CUSIP合併就不會出現這樣的問題 (我不確定 但我以CUSIP做了三次合併步驟 只有在跟COMPUSTAT合併才出現上面訊息) 有沒有先進遇過類似問題? 該對CUSIP做什麼樣的處理才能解決呢? 感謝看到這邊沒直接END的人 m(_ _)m -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.4.185

05/21 13:26, , 1F
應該是兩個資料庫的 CUSIP性質不同 一個屬值 一個屬量
05/21 13:26, 1F

05/21 13:28, , 2F
那應該是不同資料庫中 相同變數的格式不同(例如 長度)
05/21 13:28, 2F
文章代碼(AID): #1BsLl4-b (Statistics)
文章代碼(AID): #1BsLl4-b (Statistics)