[問題] 投影尋蹤相關問題

看板R_Language作者 (elegantnight)時間8年前 (2015/11/15 23:00), 編輯推噓0(006)
留言6則, 2人參與, 最新討論串1/1
[問題類型]: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) 不好意思打擾,我有個台灣去北京大學唸書的朋友,遇到一份需要使用R的作業,希望可以 請大家幫忙 >"< 他是第一次寫R的新手,完全不知道該怎麼處理, 所以希望可以得到一點建議或是方向,謝謝大家! 問題如下: 4. 探索性数据分析部分 在loan data中,自选合适的定量变量,通过投影寻踪来研究影响grade的因素。要求: (1)指出你所选择的投影指标,并说明理由; (2)给出投影向量,你是否能通过投影向量说明哪些变量对grade的影响比较大? (3)在投影结果中,对不同grade的样本点进行染色,说明投影结果是否能够反应grade变量的分组情况 (4)数据中是否存在特异点?如果有,请指出来。 會需要用到REPPlab中的函數 3. 统计制图部分 在loan data中,自选合适的变量,绘制以下图形: (1)分面的风玫瑰图,玫瑰叶片的颜色至少三种; (2)某一个连续型变量的分布直方图,并加入拟合分布线,直方图的组距和组数自己设定 (不要使用默认的),并且每个柱子里面填上相应的组的频数,整个图片加上一个蓝色的 外框,并且图的底色为深色,柱子为浅色; (3)某两个连续型变量的密度图,并且在图中找出一个部分加上一个方框与其他部分区 别开来(比如说,密度最高或者最低的区域,用一个矩形的方框加以标示); (4)挑选多个连续型变量,进行聚类,并且绘制相应的热图(可以不用全部样本)。 要求:以上所有图表都要求有图表名称、图例、行标题、列标题等要素。 data 如下:https://www.dropbox.com/s/t7madvx8dmj4ai6/LoanStats3d.csv.zip?dl=0 因為我也完全不會R,但是朋友希望我可以幫他問問看,如果有不洽當的地方, 再麻煩跟我說,我會自己刪文,拜託大家了,謝謝! >"< -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.227.174.122 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1447599655.A.E98.html

11/15 23:22, , 1F
請建議你朋友把R 學起來之後再嘗試看看。可以參考置底
11/15 23:22, 1F

11/15 23:22, , 2F
也歡迎試試看我最近寫的教材:
11/15 23:22, 2F


11/15 23:49, , 4F
謝謝W大,但是因為她明天就得交,所以還是希望得到
11/15 23:49, 4F

11/15 23:49, , 5F
一些方向的建議 >"<
11/15 23:49, 5F

11/16 01:13, , 6F
對於完全不懂R 的新手,我覺得除了學R 以外的建議都多餘
11/16 01:13, 6F
文章代碼(AID): #1MI9udwO (R_Language)