[SQL ] 有趣性

看板Database作者 (M)時間9年前 (2014/09/07 23:36), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串1/1
想請問版友有人算過有趣性(Interestingness)的嗎? http://msdn.microsoft.com/zh-tw/library/ms175382.aspx 根據裡面的說明,可以找到有趣性的公式為: Interestingness(Attribute) = - (m - Entropy(Attribute)) * (m - Entropy(Attribute)) m代表整個功能集的entropy (我不太懂這句的意思) 假設有兩個變數 x=2,2,3,4,5,6 y=3,4,4,4,6,8 根據Shannon entropy H(x)= - sum_i p(x_i) * log_2( p(x_i) ) p(x_i)為X的pmf X的entropy H(x)=2.251629 Y的entropy H(y)=1.792481 那請問m及x,y的interestingness是多少呢? 那麼Interestingness是越高越好? 還是越低越好? 因為感覺起來會為負數,跟我原本以為是正數不大一樣 先謝謝各位了!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 113.28.26.107 ※ 文章網址: http://www.ptt.cc/bbs/Database/M.1410104189.A.DF0.html

09/08 13:16, , 1F
你發錯地方了
09/08 13:16, 1F
文章代碼(AID): #1K37jztm (Database)