Re: [問題] 請問一題可能跟信賴程度有關的問題

看板Statistics作者gloriosa (Gix.Andy)時間18年前 (2007/10/04 10:05)推噓4(4推 0噓 8→)

留言12則, 2人參與討論串2/3 (看更多)

我有一個想法請大家鞭小力一點... 方法是這樣你拿輸入的序列(Ai)對資料庫(A1~A10000)做出10000個r 也就有10000個r^2 由大至小排序r^2並畫圖(大小 x r^2) 在圖形驟降的地方切割驟降看是要算迴歸線(maybe logistic)然後微分或是鄰近兩點的差值都好當然這樣你還是要訂一個標準 (迴歸或差值要下降多少才切) 不過可能比較有感覺吧XD ※ 引述《showponn (showpon)》之銘言： : 大家好我是資工所的學生只有在大學時學過一點點統計 : 想請問大家一個最近遇到的問題如下: : 假設現在手中有一萬條dna序列 : 現在要做一個系統讓使用者可以每次輸入一條序列去和這一萬條算相似度 : 每一個相似度都有一個分數來代表分數越高就是相似度越高反之就越低 : 但是我們的系統希望呈現給使用者的只有那些相似度高的序列 : 被判斷成相似度低的序列就不呈現出來 : 我的困惑在於如何從這一萬個分數的分佈裡算出一個合理的門檻 : 把分數低於門檻的都視為不相似 (其實方法不需太精確能大略判斷出合理門檻就行) : 感覺這需要一些統計的方法 : 麻煩各位高手可以撥個空幫我解惑一下 : haha 小弟感激不盡!!!! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.112.4.234

推

showponn

10/04 13:37, , 1^F

10/04 13:37, 1^F

→

showponn

10/04 14:04, , 2^F

10/04 14:04, 2^F

→

showponn

10/04 14:05, , 3^F

10/04 14:05, 3^F