Re: [新聞] 麻省理工博士數據分析 6.9萬川普選票被篡改
※ 引述《BinnigQuate (新手上路 能閃則閃)》之銘言:
: ※ 引述《goldenhill (我的人權時代)》之銘言:
: : 3.完整新聞標題:麻省理工博士數據分析 6.9萬川普選票被篡改
: : 肯特(Kent)的選票數據,呈現出非正常的散點分布,只要共和黨支持率超過20%,軟
: : 體的算法就開始自動減少川普的得票,有明顯的修改痕跡。
: 八卦是這位Shiva要在Twitter上討論這個研究,
: 可是他的Twitter帳號竟然就被封了,
: 一堆左派電視台爭相採訪他,
: 但被他拒絕了,
: 因為他知道記者訪問回去之後會怎麼誣陷他,
我想借題發揮一下之前有被提出來過,但是可能因為較為複雜所以討論的人不多。
進入正題之前,我們先來點數學:
假設我們對 0-19 之間 20 個整數作公平的隨機取樣,那麼第一個數字為 1 機會有多少?
機會大概是 55%。因為有 1 與 10, 11, ..., 19 共 11 個可能。
同理,除了 1 以外的數字,例如 2,機會有 5%。
我們也可以把範圍從 0-19 放大到 0-100,並計算第一個數字為 1-10 之間某一數字的可
能性(排除 0)。因此可以用不包括 0 的百分比作為輸入。
這就是所謂的班福特數列。這常常在會計學上用來抓數字造假的機率。例如,可以把某公
公司在一段時間內的出帳或入帳的金額。當資料愈大時,每一筆金額的特定位數字應該要
愈接近班福特數列。
來實作一下:
[A] [B] [Benford]
1 9.75 12.3 11.9
2 12.3 11.5 11.3
3 9.9 11.3 10.9
4 10.15 10.1 10.4
5 9.3 11.4 10.0
6 12.0 9.8 9.7
7 9.5 7.8 9.3
8 8.4 8.9 9.0
9 8.8 9.0 8.7
10 9.7 8.1 8.45
兩個數列 A, B 這次美國某區兩陣營每次開票時報出的數字中,頭位數字分部的比例。
(四捨五入過所以加起來不是 100。不過這不影響計算)
第三個數列是班福特序列。理論上 A B 都要接近 Benford。所以我們可以計算兩組數字
與 Benford 的標準差。
stddev
A: 1.202
B: 0.699
A 與 Benford 的標準差快是 B 的兩倍。
當然,這只是一區的資料,並不能因此說 A 陣營必然有作帳。這個只能說在這區,B 陣營
的數據比 A 陣營更接近自然產生的隨機數。
不過,我們可以這個方法應用到多個區。比較看這兩個陣營在多個區中,拿到較高 stddev
的機會是不是一樣。
結果,嗯,其實跟媒體上傳出有計票誤差發生時,結果都非常剛好的有利於某特定陣營的
現像一致。
一場球賽中,發生多次裁判誤判,結果都非常剛好有利於某隊。不啓人疑竇?
我等下會給出完整証明。我先去收個 UPS..
--
→ k_______n:我推的平權政策 都不著重種族之間的平等,改強調種族之間的差別待遇
→ k_______n:年輕人都很歡迎 但就是太過激進 另外再特別給非裔專屬特權
推 w_____2:XDDD
→ D_____N:沒有種族平等還能叫做平權???
→ k_______n:這兩個配起來非常棒 最好是加點街頭暴力
推 j_________n:那就不算是種族平等了吧..
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 148.168.216.5 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1605218022.A.F3E.html
推
11/13 05:55,
5年前
, 1F
11/13 05:55, 1F
推
11/13 05:57,
5年前
, 2F
11/13 05:57, 2F
推
11/13 05:58,
5年前
, 3F
11/13 05:58, 3F
推
11/13 05:58,
5年前
, 4F
11/13 05:58, 4F
推
11/13 06:02,
5年前
, 5F
11/13 06:02, 5F
推
11/13 06:14,
5年前
, 6F
11/13 06:14, 6F
推
11/13 06:23,
5年前
, 7F
11/13 06:23, 7F
→
11/13 06:26,
5年前
, 8F
11/13 06:26, 8F
我也想知道。不過沒辦法証明質數有總量上線
推
11/13 06:31,
5年前
, 9F
11/13 06:31, 9F
→
11/13 06:31,
5年前
, 10F
11/13 06:31, 10F
大部的自媒體都只有算一半。光是看 Benford 是沒用的。
跟 Benford 比只能說特定群隨機性比較低。但不能說他一定有作票。樓下某個五毛說的沒
用應該是指這個。
推
11/13 06:34,
5年前
, 11F
11/13 06:34, 11F
→
11/13 06:34,
5年前
, 12F
11/13 06:34, 12F
對耶。是同行?
推
11/13 06:34,
5年前
, 13F
11/13 06:34, 13F
推
11/13 06:40,
5年前
, 14F
11/13 06:40, 14F
→
11/13 06:40,
5年前
, 15F
11/13 06:40, 15F
噓
11/13 06:46,
5年前
, 16F
11/13 06:46, 16F
噓
11/13 06:50,
5年前
, 17F
11/13 06:50, 17F
→
11/13 06:50,
5年前
, 18F
11/13 06:50, 18F
推
11/13 06:51,
5年前
, 19F
11/13 06:51, 19F
數列本身是沒用沒錯啊。後面隨之而來的計算才有用。
不過我知道你看到「沒用」兩個字後。後面的描述就不會再看了。
然後基本上共產黨開的事實查核中心只有共產黨員會相信。跟毛語錄一樣大概。
→
11/13 07:05,
5年前
, 20F
11/13 07:05, 20F
不要轉 DS 啦。若沒有 PhD 的話只能當低階碼農。物理好玩多了。
推
11/13 07:06,
5年前
, 21F
11/13 07:06, 21F
推
11/13 07:09,
5年前
, 22F
11/13 07:09, 22F
有証明啦。 好像 2006 年有論文。晚一點找找。
質數的 Benford 還沒辦法証明。我對這個很有興趣。不過前提是要知道質數是否有上限。
這個大概這一輩子是看不到了。
→
11/13 07:13,
5年前
, 23F
11/13 07:13, 23F
會嗎?物理所外國人不少啊。除非你唸的是敏感題目?
轉的話轉 CS 輔 DS。機會大一些。加個特定專長例如 bioinformatics,就業機會大。
推
11/13 07:13,
5年前
, 24F
11/13 07:13, 24F
應該是可以。我們團隊正在弄。
不過我再申明一次這方法沒辦法証明作票。只能說特定陣營票數的隨機性有可疑的空間。
作票與否那是法律問題,不是科學問題。
推
11/13 07:14,
5年前
, 25F
11/13 07:14, 25F
我們是計算 標準差的大小。用 euclidean distance 意思一樣。
→
11/13 07:21,
5年前
, 26F
11/13 07:21, 26F
→
11/13 07:22,
5年前
, 27F
11/13 07:22, 27F
→
11/13 07:23,
5年前
, 28F
11/13 07:23, 28F
理論物理確實路比較窄。轉 CS/DS 有空間。不過別放棄啊。有真愛才走得久。
我花很多空閒時間去計算 Black Hole Math。無耐不是本科料。算得很辛苦。
推
11/13 07:26,
5年前
, 29F
11/13 07:26, 29F
※ 編輯: cybergenie (148.168.216.5 美國), 11/13/2020 07:31:25
→
11/13 07:28,
5年前
, 30F
11/13 07:28, 30F
→
11/13 07:28,
5年前
, 31F
11/13 07:28, 31F
→
11/13 07:29,
5年前
, 32F
11/13 07:29, 32F
幫改。
→
11/13 07:29,
5年前
, 33F
11/13 07:29, 33F
推
11/13 07:30,
5年前
, 34F
11/13 07:30, 34F
→
11/13 07:30,
5年前
, 35F
11/13 07:30, 35F
→
11/13 07:31,
5年前
, 36F
11/13 07:31, 36F
嚴格來說任何隨機數都可以拿來用啦。只是現實生活中產生的數字可能不那麼俱有隨機性
就是了。
→
11/13 07:31,
5年前
, 37F
11/13 07:31, 37F
→
11/13 07:32,
5年前
, 38F
11/13 07:32, 38F
是不行沒錯。所以沒打算搭這順風車。並且我也沒說是什麼陣營隨機性比較低。
其實看新聞可以看到開票出包結果都是很剛好的有利於某營。這不用數學來算,誰都看得
出來XD
→
11/13 07:33,
5年前
, 39F
11/13 07:33, 39F
→
11/13 07:33,
5年前
, 40F
11/13 07:33, 40F
Benford 只能証明某營開票隨機性比較低而己。那沒辦法証明造假。很多自媒體都過度解
讀這東西。選舉造假是政治司法問題。不是數學問題。
→
11/13 07:41,
5年前
, 41F
11/13 07:41, 41F
→
11/13 07:42,
5年前
, 42F
11/13 07:42, 42F
→
11/13 07:43,
5年前
, 43F
11/13 07:43, 43F
→
11/13 07:43,
5年前
, 44F
11/13 07:43, 44F
→
11/13 07:44,
5年前
, 45F
11/13 07:44, 45F
有道理。來算算看。
推
11/13 07:47,
5年前
, 46F
11/13 07:47, 46F
→
11/13 07:47,
5年前
, 47F
11/13 07:47, 47F
→
11/13 07:48,
5年前
, 48F
11/13 07:48, 48F
推
11/13 07:49,
5年前
, 49F
11/13 07:49, 49F
→
11/13 07:49,
5年前
, 50F
11/13 07:49, 50F
推
11/13 08:04,
5年前
, 51F
11/13 08:04, 51F
推
11/13 08:33,
5年前
, 52F
11/13 08:33, 52F
→
11/13 08:34,
5年前
, 53F
11/13 08:34, 53F
推
11/13 08:40,
5年前
, 54F
11/13 08:40, 54F
推
11/13 08:49,
5年前
, 55F
11/13 08:49, 55F
→
11/13 08:49,
5年前
, 56F
11/13 08:49, 56F
推
11/13 09:00,
5年前
, 57F
11/13 09:00, 57F
推
11/13 09:18,
5年前
, 58F
11/13 09:18, 58F
推
11/13 09:18,
5年前
, 59F
11/13 09:18, 59F
→
11/13 09:18,
5年前
, 60F
11/13 09:18, 60F
→
11/13 09:19,
5年前
, 61F
11/13 09:19, 61F
→
11/13 09:19,
5年前
, 62F
11/13 09:19, 62F
推
11/13 09:21,
5年前
, 63F
11/13 09:21, 63F
推
11/13 10:04,
5年前
, 64F
11/13 10:04, 64F
→
11/13 10:04,
5年前
, 65F
11/13 10:04, 65F
→
11/13 10:04,
5年前
, 66F
11/13 10:04, 66F
→
11/13 10:04,
5年前
, 67F
11/13 10:04, 67F
Benford's Law 能不能看出有沒有作票?答案肯定是不行。
但是我認為用來研究兩方之間哪一方的隨機性比較大是可以的。
當然隨機性比較低也不能說就一定是有問題。例如 49% - 51%。
若兩方都是用一樣方法,但在絕大部份地區都顯示其中一方隨機性比較低,這很難說不可
疑吧?
推
11/13 10:21,
5年前
, 68F
11/13 10:21, 68F
→
11/13 10:21,
5年前
, 69F
11/13 10:21, 69F
推
11/13 10:47,
5年前
, 70F
11/13 10:47, 70F
→
11/13 10:47,
5年前
, 71F
11/13 10:47, 71F
很多人一看班佛+美國選舉,直接就說不行不可信了。
又知道我算的是選舉中的什麼東西了?
→
11/13 11:02,
5年前
, 72F
11/13 11:02, 72F
→
11/13 11:03,
5年前
, 73F
11/13 11:03, 73F
推
11/13 11:36,
5年前
, 74F
11/13 11:36, 74F
→
11/13 11:36,
5年前
, 75F
11/13 11:36, 75F
推
11/14 00:16,
5年前
, 76F
11/14 00:16, 76F
※ 編輯: cybergenie (148.168.216.5 美國), 11/14/2020 03:29:01
推
11/14 10:34,
5年前
, 77F
11/14 10:34, 77F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 6 篇):