Re: [問題] 請問一題可能跟信賴程度有關的問題
我有一個想法
請大家鞭小力一點...
方法是這樣
你拿輸入的序列(Ai)對資料庫(A1~A10000)做出10000個r
也就有10000個r^2
由大至小排序r^2並畫圖(大小 x r^2)
在圖形驟降的地方切割
驟降看是要算迴歸線(maybe logistic)然後微分
或是鄰近兩點的差值都好
當然這樣你還是要訂一個標準
(迴歸或差值要下降多少才切)
不過可能
比較有感覺吧XD
※ 引述《showponn (showpon)》之銘言:
: 大家好 我是資工所的學生 只有在大學時學過一點點統計
: 想請問大家一個最近遇到的問題 如下:
: 假設現在手中有一萬條dna序列
: 現在要做一個系統 讓使用者可以每次輸入一條序列 去和這一萬條算相似度
: 每一個相似度 都有一個分數來代表 分數越高就是相似度越高 反之就越低
: 但是我們的系統 希望呈現給使用者的只有那些相似度高的序列
: 被判斷成相似度低的序列 就不呈現出來
: 我的困惑在於 如何從這一萬個分數的分佈裡 算出一個合理的門檻
: 把分數低於門檻的都視為不相似 (其實方法不需太精確 能大略判斷出合理門檻就行)
: 感覺這需要一些統計的方法
: 麻煩各位高手可以撥個空 幫我解惑一下
: haha 小弟感激不盡!!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.112.4.234
推
10/04 13:37, , 1F
10/04 13:37, 1F
→
10/04 14:04, , 2F
10/04 14:04, 2F
→
10/04 14:05, , 3F
10/04 14:05, 3F
→
10/04 14:06, , 4F
10/04 14:06, 4F
推
10/04 14:14, , 5F
10/04 14:14, 5F
推
10/04 15:18, , 6F
10/04 15:18, 6F
→
10/04 15:18, , 7F
10/04 15:18, 7F
推
10/04 15:22, , 8F
10/04 15:22, 8F
→
10/04 15:23, , 9F
10/04 15:23, 9F
→
10/04 15:25, , 10F
10/04 15:25, 10F
→
10/04 15:26, , 11F
10/04 15:26, 11F
→
10/04 15:27, , 12F
10/04 15:27, 12F
討論串 (同標題文章)