[問題] 請問一題可能跟信賴程度有關的問題
大家好 我是資工所的學生 只有在大學時學過一點點統計
想請問大家一個最近遇到的問題 如下:
假設現在手中有一萬條dna序列
現在要做一個系統 讓使用者可以每次輸入一條序列 去和這一萬條算相似度
每一個相似度 都有一個分數來代表 分數越高就是相似度越高 反之就越低
但是我們的系統 希望呈現給使用者的只有那些相似度高的序列
被判斷成相似度低的序列 就不呈現出來
我的困惑在於 如何從這一萬個分數的分佈裡 算出一個合理的門檻
把分數低於門檻的都視為不相似 (其實方法不需太精確 能大略判斷出合理門檻就行)
感覺這需要一些統計的方法
麻煩各位高手可以撥個空 幫我解惑一下
haha 小弟感激不盡!!!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.116.245.196
※ 編輯: showponn 來自: 140.116.245.196 (10/04 00:49)
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 3 篇):