Re: [問題] 求幫助,如何計算共同參加社團數
定義學生S1.S2...
社團編號1.2.3.....100
分頁1:學生S1參加了5.41.90這三個社團,S2學生參加了77.52.38三個社團...
整理成一張表
https://upload.cc/i/w0V2Ft.jpg

分頁2:是關聯性展開,第一個學生參加的社團
可以視為(5,41)(41,90)(90,5)(5,41,90)四種關聯
最後一個欄位是把社團代號,串成一個字串
分頁2是由分頁1寫巨集轉過來的
https://upload.cc/i/zYEfp4.jpg

分頁3:由分頁2去跑樞紐後,會得到分頁3。像是
100--16-- 3 ==> 參加社團100跟社團16的,共有3個學生
100--11-- 1 ==> 參加社團100跟社團11的,共有1個學生
12--36--34 1 ==> 參加社團12跟社團36跟社團34的,共有1個學生
因為一開始分頁1是亂數產生的,像是第一筆100-100,在實務上不會產生
https://upload.cc/i/Bd9GWi.jpg

分頁4:把樞紐作由大到小排序後,前面幾筆就是關聯度比較高的
58-35-- 4 ==> 同時參加社團58跟社團35的學生有4位
70-33-- 4 ==> 同時參加社團70跟社團33的學生有4位
74-69-- 4 ==> 同時參加社團74跟社團69的學生有4位......
https://upload.cc/i/Wzd8mo.jpg

※ 引述《danail (呼嘎~)》之銘言:
: ※ [本文轉錄自 Statistics 看板 #1QGRCNkX ]
: 作者: danail (呼嘎~) 看板: Statistics
: 標題: [問題] 求幫助,如果計算共同參加社團數
: 時間: Tue Dec 26 10:25:25 2017
: 某學校有100個社團,每間社團皆有紀錄團員名單並使用Excel紀錄起來。
: 又該學校有1000名學生,且每位學生可能依照自己的喜好參加0~3個社團,
: 目前學校希望了解哪幾對社團(希望找出前5對社團)有最多共同參加的學生,
: 以了解同學們選擇複數社團的喜好及未來整合社團資源的方向。
: 備註:若社團22一組為一對,100個社團可以有4950種組合
: 目前自己的想法如下:
: 步驟1:先給予社團獨立的代碼後,利用社團紀錄的團員名單將100個社團的團員名單整合如下:
: ┌──────┬──────┐
: │社團ID │學生ID │
: ├──────┼──────│
: │AAA11 │E11XX │
: ├──────┼──────│
: │AAA11 │E12XX │
: ├──────┼──────│
: │AAA11 │F11XX │
: ├──────┼──────│
: :
: :
: 步驟2:挑出參加2個以上社團的學生。利用excel的設定格式化條件將學生ID「重複的値」變色,然後使用篩選的依色彩篩選挑出參加2個以上社團的學生後建立新表格。
: ┌──────┬──────┐
: │社團ID │學生ID │
: ├──────┼──────│
: │AAA11 │E11XX │
: ├──────┼──────│
: │AAA11 │F11XX │
: ├──────┼──────│
: :
: :
: 步驟3:計算哪幾對社團(希望找出前5對社團)有最多共同參加的學生這個我就不會了T︿T,我只想到用土法煉鋼的方式,做一張矩陣表(4950種組合…)畫正字記號來算… 有沒有大大可以給我一點靈感或是教我怎麼用excel或是SAS來挑呢?感激不盡T︿T
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 117.56.51.117
※ 文章網址: https://www.ptt.cc/bbs/Math/M.1514274531.A.06D.html
推
12/26 16:35,
8年前
, 1F
12/26 16:35, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):