[問題] 使用R進行購物籃分析

看板R_Language作者 (paipai)時間6年前 (2018/03/12 15:25), 編輯推噓3(3026)
留言29則, 4人參與, 6年前最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) [軟體熟悉度]: 新手(沒寫過程式,R 是我的第一次) [問題敘述]: 我想用apriori做十三種藥物的關聯性分析 [程式範例]: 我是參考這篇 http://www.cc.ntu.edu.tw/chinese/epaper/0036/20160321_3606.html 我的資料是二元檔,共13個變項, beer=read.xlsx("d:\\stella\\R\\beer.xls",header=T,sheetIndex=1) beer=as.matrix(beer) 進行到這裡之後,要計算關聯性 rule=apriori(beer,parameter=list(supp=0.2,conf=0.8)) 可是計算的結果,我的lhs欄位都是空白的,只有rhs有我的13個變項, 想請問是這甚麼原因?謝謝! [環境敘述]: R 3.4.3 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.128.67.236 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1520839553.A.AF0.html

03/12 19:01, 6年前 , 1F
感覺跟前幾篇文章有87%像
03/12 19:01, 1F

03/12 22:42, 6年前 , 2F
我有先搜尋"購物籃",版上的文章,但沒看到跟我一樣的問題
03/12 22:42, 2F

03/12 22:42, 6年前 , 3F
,但也可能是我是新手看不出來lol我的檔案各個變數已經是
03/12 22:42, 3F

03/12 22:42, 6年前 , 4F
0和1,不過我跑了轉換矩陣那行程式後,雖然檔案描述有變成
03/12 22:42, 4F

03/12 22:42, 6年前 , 5F
矩陣,可是打開檔案呈現的樣子還是跟轉換前的一樣, 這是
03/12 22:42, 5F

03/12 22:42, 6年前 , 6F
正確的嗎?還麻煩各位高手幫忙解惑了!
03/12 22:42, 6F

03/13 00:22, 6年前 , 7F
關鍵字可以找關聯性分析
03/13 00:22, 7F

03/13 10:22, 6年前 , 8F
你範例能跑成功嗎?如果可以,看看data的差異,或者是
03/13 10:22, 8F

03/13 10:22, 6年前 , 9F
參數的問題
03/13 10:22, 9F

03/13 10:55, 6年前 , 10F
建議你調低你的supp跟conf,你這兩個都很高,可以看一下
03/13 10:55, 10F

03/13 10:56, 6年前 , 11F
document這兩項分別代表什麼,conf 0.8幾乎篩不出任何
03/13 10:56, 11F

03/13 10:56, 6年前 , 12F
值是很正常的
03/13 10:56, 12F

03/13 12:24, 6年前 , 13F
謝謝大家的回覆!不好意思沒有講清楚,我的樣本數有13000
03/13 12:24, 13F

03/13 12:24, 6年前 , 14F
,supp跟conf我都調到小數點下好幾位,但結果都還是跑不出
03/13 12:24, 14F

03/13 12:24, 6年前 , 15F
來,這樣是代表我的資料之間沒有關聯性嗎?
03/13 12:24, 15F

03/13 12:39, 6年前 , 16F
我跑範例beer那個就跑的出來,觀察了資料,都是0,1的二元
03/13 12:39, 16F

03/13 12:39, 6年前 , 17F
檔,差在我的變數和資料比數多很多。
03/13 12:39, 17F

03/13 12:45, 6年前 , 18F
很難說,但我的經驗是調低以後,那種空白的現象還是會有
03/13 12:45, 18F

03/13 12:46, 6年前 , 19F
但是如果一筆有效資料都沒有的話,可能你還是要檢視自己
03/13 12:46, 19F

03/13 12:46, 6年前 , 20F
的資料,究竟有沒有你想要的關係
03/13 12:46, 20F

03/13 13:04, 6年前 , 21F
有辦法公開 DATA 嗎? 這樣會比較清楚問題
03/13 13:04, 21F

03/13 18:10, 6年前 , 22F

03/13 18:10, 6年前 , 23F
後來又檢查了資料發現是我在合併資料的時候犯錯,難怪都
03/13 18:10, 23F

03/13 18:10, 6年前 , 24F
跑不出來。謝謝大家的提醒!然後我想再請問,有辦法設定l
03/13 18:10, 24F

03/13 18:10, 6年前 , 25F
ift的下限嗎?還有這個網路圖,有辦法加入各個品項的出現
03/13 18:10, 25F

03/13 18:10, 6年前 , 26F
頻率大小嗎?謝謝!
03/13 18:10, 26F

03/13 18:33, 6年前 , 27F
然後我發現在加上minlen=2這個條件設定就可以避免掉lhs
03/13 18:33, 27F

03/13 18:33, 6年前 , 28F
是空白的結果,不知道這樣對不對。
03/13 18:33, 28F

03/13 18:36, 6年前 , 29F
lift不能設下限,只能事後從結果篩出子集合
03/13 18:36, 29F
文章代碼(AID): #1QfYk1hm (R_Language)