Re: [閒聊] AI畫圖是不是大數據拼圖?
我嘗試來簡單圖解一下 AI生成圖的概念
因為 1. 想要簡單解釋 2. 我不是本科生
請板上各位高手不吝指教 不過別太嚴格
見圖一
首先,我想要從向量空間開始講起
假設你有一張圖 只有兩個像素 1 x 2
那你可以把第一個像素當成 x 第二個當成 y
這圖就是一個(x,y)向量 (見下圖)
假如有 3個像素 1 x 3 就是(x,y,z)三維向量
同理,
nx x ny 像素的圖 就是一個nx x ny 維度的向量
https://i.imgur.com/5QxQiV2.jpg
圖一
見圖二
理解這個想法後
我們把圖像的高維空間畫成二維方便表示
以ACG圖為例
那被人類接受的ACG圖就是一個高維空間中的分佈
簡單理解就是一個範圍內的圖,會被視為可接受的ACG圖
在那個範圍外的空間包含相片 雜訊 古典藝術 支離破碎的圖
生成模型的目的,就是從範圍內的樣本(下圖紅點)建立一個模型
這個模型學習到這個範圍,而模型可以生成也只會生成在範圍內的點
https://i.imgur.com/NfUyIAg.jpg
圖二
這裡有兩點值得注意
1. 模型並沒有儲存紅色樣本點的資訊,而是學到讓點落在那個範圍內的方法
2. 雖然理想上是要學習被人類接受的ACG圖的範圍,但是能學到的範圍受到樣本的限制
例如:未來會出現的畫風照道理說也在範圍內,但是沒有樣本,理論上學不到
又或者你的樣本內沒有一張圖出現耳機,模型就生不出戴耳機的妹子
基本上這機器學習的概念和人類有像,就是看很多存在的圖理解什麼算ACG圖
怎樣畫才是合格的ACG圖
但是
1.模型缺乏人類的先驗知識,例如我們知道耳機長怎樣,即使沒看過耳機的ACG圖
2.缺乏人類的創造力,因為人所能接受的ACG圖範圍一定比現在大得多,
缺乏人類的經驗知識或本能,以現在的做法機器無法拓展新的創作範圍
接下來簡單講一下,我所理解的主流生成模型
1. 生成對抗網路
這是兩個模型 一個機器評鑑家 和一個機器創作者
機器評鑑家不斷的學習分辨真正的人類創造 和 機器創作者造出的膺品
機器創作者則是不斷學著越畫越像人 騙過評鑑家
一個模型學習界定範圍
另一個學習讓生成的點在範圍內
2. Diffusion model (見圖三)
這個東西就是現在主流的這些動漫圖生成器的原理
這東西比較不直觀 數學也很複雜
簡單來說,
在訓練這模型時,先讓原本那些樣本點隨機擴散
最後變成一個高斯分佈 (ACG圖退化成雜訊)
同時紀錄擴散過程
之後再訓練一個模型學習逆擴散,把高斯分佈還原回ACG圖範圍
之後你高斯分佈取一點(丟一張雜訊給模型)
模型就會自動把你的圖推回去那範圍(變成ACG圖了)
https://i.imgur.com/zdnQPmj.jpg
這樣大致解釋一下,你覺得是拼貼嗎
-----
Sent from JPTT on my iPad
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.96.90.228 (美國)
※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1665034221.A.E97.html
→
10/06 13:32,
1年前
, 1F
10/06 13:32, 1F
推
10/06 13:33,
1年前
, 2F
10/06 13:33, 2F
推
10/06 13:33,
1年前
, 3F
10/06 13:33, 3F
→
10/06 13:33,
1年前
, 4F
10/06 13:33, 4F
→
10/06 13:33,
1年前
, 5F
10/06 13:33, 5F
→
10/06 13:33,
1年前
, 6F
10/06 13:33, 6F
推
10/06 13:34,
1年前
, 7F
10/06 13:34, 7F
→
10/06 13:35,
1年前
, 8F
10/06 13:35, 8F
推
10/06 13:35,
1年前
, 9F
10/06 13:35, 9F
推
10/06 13:35,
1年前
, 10F
10/06 13:35, 10F
→
10/06 13:35,
1年前
, 11F
10/06 13:35, 11F
推
10/06 13:37,
1年前
, 12F
10/06 13:37, 12F
推
10/06 13:37,
1年前
, 13F
10/06 13:37, 13F
推
10/06 13:37,
1年前
, 14F
10/06 13:37, 14F
推
10/06 13:37,
1年前
, 15F
10/06 13:37, 15F
推
10/06 13:38,
1年前
, 16F
10/06 13:38, 16F
推
10/06 13:39,
1年前
, 17F
10/06 13:39, 17F
→
10/06 13:39,
1年前
, 18F
10/06 13:39, 18F
推
10/06 13:41,
1年前
, 19F
10/06 13:41, 19F
推
10/06 13:41,
1年前
, 20F
10/06 13:41, 20F
→
10/06 13:41,
1年前
, 21F
10/06 13:41, 21F
→
10/06 13:41,
1年前
, 22F
10/06 13:41, 22F
→
10/06 13:43,
1年前
, 23F
10/06 13:43, 23F
推
10/06 13:43,
1年前
, 24F
10/06 13:43, 24F
推
10/06 13:43,
1年前
, 25F
10/06 13:43, 25F
→
10/06 13:44,
1年前
, 26F
10/06 13:44, 26F
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:47:15
推
10/06 13:45,
1年前
, 27F
10/06 13:45, 27F
推
10/06 13:48,
1年前
, 28F
10/06 13:48, 28F
說到這個,
假如有人亂玩過GAN就知道
train壞的GAN會認為生成在範圍內的最好方法就是
直接生成樣本點XD
推
10/06 13:48,
1年前
, 29F
10/06 13:48, 29F
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:50:52
→
10/06 13:49,
1年前
, 30F
10/06 13:49, 30F
→
10/06 13:50,
1年前
, 31F
10/06 13:50, 31F
→
10/06 13:50,
1年前
, 32F
10/06 13:50, 32F
→
10/06 13:52,
1年前
, 33F
10/06 13:52, 33F
→
10/06 13:54,
1年前
, 34F
10/06 13:54, 34F
問題是人類也是阿
哪個繪師的身體各部位畫法 不是看其他人的圖學來的
不同點是人類有其他知識經驗 電腦只有偽隨機數 和 比人類多更多的閱覽描圖量
→
10/06 13:55,
1年前
, 35F
10/06 13:55, 35F
還有 125 則推文
還有 1 段內文
推
10/06 15:00,
1年前
, 161F
10/06 15:00, 161F
→
10/06 15:00,
1年前
, 162F
10/06 15:00, 162F
→
10/06 15:00,
1年前
, 163F
10/06 15:00, 163F
→
10/06 15:03,
1年前
, 164F
10/06 15:03, 164F
→
10/06 15:03,
1年前
, 165F
10/06 15:03, 165F
推
10/06 15:04,
1年前
, 166F
10/06 15:04, 166F
→
10/06 15:04,
1年前
, 167F
10/06 15:04, 167F
推
10/06 15:06,
1年前
, 168F
10/06 15:06, 168F
→
10/06 15:06,
1年前
, 169F
10/06 15:06, 169F
→
10/06 15:07,
1年前
, 170F
10/06 15:07, 170F
推
10/06 15:07,
1年前
, 171F
10/06 15:07, 171F
推
10/06 15:09,
1年前
, 172F
10/06 15:09, 172F
→
10/06 15:09,
1年前
, 173F
10/06 15:09, 173F
→
10/06 15:09,
1年前
, 174F
10/06 15:09, 174F
推
10/06 15:10,
1年前
, 175F
10/06 15:10, 175F
→
10/06 15:10,
1年前
, 176F
10/06 15:10, 176F
推
10/06 15:16,
1年前
, 177F
10/06 15:16, 177F
→
10/06 15:21,
1年前
, 178F
10/06 15:21, 178F
→
10/06 15:21,
1年前
, 179F
10/06 15:21, 179F
→
10/06 15:23,
1年前
, 180F
10/06 15:23, 180F
→
10/06 15:23,
1年前
, 181F
10/06 15:23, 181F
→
10/06 15:23,
1年前
, 182F
10/06 15:23, 182F
→
10/06 15:23,
1年前
, 183F
10/06 15:23, 183F
→
10/06 15:24,
1年前
, 184F
10/06 15:24, 184F
→
10/06 15:25,
1年前
, 185F
10/06 15:25, 185F
→
10/06 15:25,
1年前
, 186F
10/06 15:25, 186F
→
10/06 15:26,
1年前
, 187F
10/06 15:26, 187F
→
10/06 15:26,
1年前
, 188F
10/06 15:26, 188F
推
10/06 15:39,
1年前
, 189F
10/06 15:39, 189F
→
10/06 15:39,
1年前
, 190F
10/06 15:39, 190F
→
10/06 15:39,
1年前
, 191F
10/06 15:39, 191F
→
10/06 15:39,
1年前
, 192F
10/06 15:39, 192F
→
10/06 15:39,
1年前
, 193F
10/06 15:39, 193F
→
10/06 15:39,
1年前
, 194F
10/06 15:39, 194F
推
10/06 15:41,
1年前
, 195F
10/06 15:41, 195F
→
10/06 15:43,
1年前
, 196F
10/06 15:43, 196F
→
10/06 15:43,
1年前
, 197F
10/06 15:43, 197F
推
10/06 17:35,
1年前
, 198F
10/06 17:35, 198F
→
10/06 17:35,
1年前
, 199F
10/06 17:35, 199F
推
10/06 18:07,
1年前
, 200F
10/06 18:07, 200F
討論串 (同標題文章)