Re: [洽特] 為什麼AI不太會畫手指 ?
嘗試解釋一下AI生成實際上在做的事情
AI在機器學習的最佳化過程中所想要學的目標是「機率分布」
假設今天有一個全知全能的裏洽之神,而你獲得無限次對祂許願的機會
你許下的願望是:
「請給我一張在溫泉遇到的鬼族幼女想要把我調教成蘿莉控的圖片」
(示意圖:https://i.imgur.com/U2t8SKY.jpg
)
那麼就有可能出現如同上圖一樣的內容
不過鬼族不一定有兩隻角,所以角可能是一隻或三隻
願望內容中完全沒有出現東方,所以當然不一定會是東方角色
如果你真的可以許願無數次,你就可以看到幾乎所有可能
同時還可以知道各種你沒講清楚的屬性出現的機率各自為何
一個AI模型的學習目標就是在收到同樣的指令後,產生盡量接近的機率分布
至於各種語言的關鍵字如何被理解為一句話的指令,就牽涉到自然語言的領域
這部分比變形金剛的科學原理還要複雜,在此就省略不細講了
(有興趣的人可以參考:https://www.youtube.com/watch?v=ugWDIIOHtPA
)
類神經網路真的可以「學習」一個機率分布嗎?
這個領域的數學家已經用各種證明告訴你「應該可以」
至於這個證明過程中當然有許多「這裡我算不下去所以假設一下」的內容
不過成果各位也看到了,細節相信各位不想去碰,因此這個「應該」還是可以相信的
那為什麼AI會忽略手指呢?
因為「圖片的機率分布」這種無限精細度的連續函數,本來就是不可能完全重現的東西
就連訓練者也不會知道標準答案是什麼,幾億張的訓練資料並無法代表無限大
變化量大的內容(如五根手指的擺放方式)在兩張很接近的圖片之間的未知領域
連人類都不知道詳細應該怎麼畫,訓練出來的AI就只能自行「腦補」
而AI的腦力(這可以用模型的Byte數直接比喻)是有限的,他會選擇最有效率的方式
如果它真的覺得五→六→五根手指的轉換是最順的
(例如,長一根出來再縮一根回去,圖片變化幅度可能最小)
那人類也無法先行阻止,只能用extra fingers之類的關鍵字與它鬥智鬥勇
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.240.232.168 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1685242799.A.B5D.html
推
05/28 19:09,
11月前
, 1F
05/28 19:09, 1F
推
05/29 01:32,
11月前
, 2F
05/29 01:32, 2F
→
05/30 21:51,
11月前
, 3F
05/30 21:51, 3F
→
05/30 21:51,
11月前
, 4F
05/30 21:51, 4F
推
05/30 23:43,
11月前
, 5F
05/30 23:43, 5F
→
05/31 01:31,
11月前
, 6F
05/31 01:31, 6F
→
05/31 01:31,
11月前
, 7F
05/31 01:31, 7F
→
05/31 01:31,
11月前
, 8F
05/31 01:31, 8F
討論串 (同標題文章)
完整討論串 (本文為第 2 之 2 篇):
洽特
25
82