Re: [閒聊] AI畫圖是不是大數據拼圖?

看板C_Chat作者 (說不定我一生涓滴廢文)時間1年前 (2022/10/06 13:30), 1年前編輯推噓56(560144)
留言200則, 37人參與, 1年前最新討論串7/11 (看更多)
我嘗試來簡單圖解一下 AI生成圖的概念 因為 1. 想要簡單解釋 2. 我不是本科生 請板上各位高手不吝指教 不過別太嚴格 見圖一 首先,我想要從向量空間開始講起 假設你有一張圖 只有兩個像素 1 x 2 那你可以把第一個像素當成 x 第二個當成 y 這圖就是一個(x,y)向量 (見下圖) 假如有 3個像素 1 x 3 就是(x,y,z)三維向量 同理, nx x ny 像素的圖 就是一個nx x ny 維度的向量 https://i.imgur.com/5QxQiV2.jpg
圖一 見圖二 理解這個想法後 我們把圖像的高維空間畫成二維方便表示 以ACG圖為例 那被人類接受的ACG圖就是一個高維空間中的分佈 簡單理解就是一個範圍內的圖,會被視為可接受的ACG圖 在那個範圍外的空間包含相片 雜訊 古典藝術 支離破碎的圖 生成模型的目的,就是從範圍內的樣本(下圖紅點)建立一個模型 這個模型學習到這個範圍,而模型可以生成也只會生成在範圍內的點 https://i.imgur.com/NfUyIAg.jpg
圖二 這裡有兩點值得注意 1. 模型並沒有儲存紅色樣本點的資訊,而是學到讓點落在那個範圍內的方法 2. 雖然理想上是要學習被人類接受的ACG圖的範圍,但是能學到的範圍受到樣本的限制 例如:未來會出現的畫風照道理說也在範圍內,但是沒有樣本,理論上學不到 又或者你的樣本內沒有一張圖出現耳機,模型就生不出戴耳機的妹子 基本上這機器學習的概念和人類有像,就是看很多存在的圖理解什麼算ACG圖 怎樣畫才是合格的ACG圖 但是 1.模型缺乏人類的先驗知識,例如我們知道耳機長怎樣,即使沒看過耳機的ACG圖 2.缺乏人類的創造力,因為人所能接受的ACG圖範圍一定比現在大得多, 缺乏人類的經驗知識或本能,以現在的做法機器無法拓展新的創作範圍 接下來簡單講一下,我所理解的主流生成模型 1. 生成對抗網路 這是兩個模型 一個機器評鑑家 和一個機器創作者 機器評鑑家不斷的學習分辨真正的人類創造 和 機器創作者造出的膺品 機器創作者則是不斷學著越畫越像人 騙過評鑑家 一個模型學習界定範圍 另一個學習讓生成的點在範圍內 2. Diffusion model (見圖三) 這個東西就是現在主流的這些動漫圖生成器的原理 這東西比較不直觀 數學也很複雜 簡單來說, 在訓練這模型時,先讓原本那些樣本點隨機擴散 最後變成一個高斯分佈 (ACG圖退化成雜訊) 同時紀錄擴散過程 之後再訓練一個模型學習逆擴散,把高斯分佈還原回ACG圖範圍 之後你高斯分佈取一點(丟一張雜訊給模型) 模型就會自動把你的圖推回去那範圍(變成ACG圖了) https://i.imgur.com/zdnQPmj.jpg
這樣大致解釋一下,你覺得是拼貼嗎 ----- Sent from JPTT on my iPad -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 73.96.90.228 (美國) ※ 文章網址: https://www.ptt.cc/bbs/C_Chat/M.1665034221.A.E97.html

10/06 13:32, 1年前 , 1F
哭啊 打到一半就有人解釋了 我在幹嘛…
10/06 13:32, 1F

10/06 13:33, 1年前 , 2F
沒事 有手繪解說給你推QQ
10/06 13:33, 2F

10/06 13:33, 1年前 , 3F
訓練學到的convolution filter 會像是小塊pattern
10/06 13:33, 3F

10/06 13:33, 1年前 , 4F
根據activation 強度會在輸出圖上出現相應的pattern
10/06 13:33, 4F

10/06 13:33, 1年前 , 5F
一層一層疊起來
10/06 13:33, 5F

10/06 13:33, 1年前 , 6F
硬要凹是拼貼也沒說錯
10/06 13:33, 6F

10/06 13:34, 1年前 , 7F
圖文並茂 很棒啊
10/06 13:34, 7F

10/06 13:35, 1年前 , 8F
你講那麼多文組哪懂,看起來像就說拼貼阿
10/06 13:35, 8F

10/06 13:35, 1年前 , 9F
沒關係,你講的比較簡單好懂一點
10/06 13:35, 9F

10/06 13:35, 1年前 , 10F
透過運算把圖拆解 然後透過運算把圖產出來 算拼貼嗎
10/06 13:35, 10F

10/06 13:35, 1年前 , 11F
手繪的 你的分數更高啦
10/06 13:35, 11F

10/06 13:37, 1年前 , 12F
你的圖說蠻清楚的耶
10/06 13:37, 12F

10/06 13:37, 1年前 , 13F
我那篇只是複製貼上啦ww
10/06 13:37, 13F

10/06 13:37, 1年前 , 14F
推推 你的說明也很棒
10/06 13:37, 14F

10/06 13:37, 1年前 , 15F
文組繼續說拼貼抄襲
10/06 13:37, 15F

10/06 13:38, 1年前 , 16F
寫得很清楚
10/06 13:38, 16F

10/06 13:39, 1年前 , 17F
其實我覺得這篇沒有比上一篇好懂 不過推用心
10/06 13:39, 17F

10/06 13:39, 1年前 , 18F
我只是想有人解釋就懶得解釋了
10/06 13:39, 18F

10/06 13:41, 1年前 , 19F
手繪贏了
10/06 13:41, 19F

10/06 13:41, 1年前 , 20F
我懂ㄌ 謝了
10/06 13:41, 20F

10/06 13:41, 1年前 , 21F
有沒有專門用來解釋AI的AI
10/06 13:41, 21F

10/06 13:41, 1年前 , 22F
你的圖很清楚
10/06 13:41, 22F

10/06 13:43, 1年前 , 23F
這問題就在把東西推到不同維度去做拼貼叫不叫拼貼
10/06 13:43, 23F

10/06 13:43, 1年前 , 24F
數學我頭好痛= =
10/06 13:43, 24F

10/06 13:43, 1年前 , 25F
推解說
10/06 13:43, 25F

10/06 13:44, 1年前 , 26F
很好奇擴散手法的發想w 無奈數學不夠好
10/06 13:44, 26F
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:47:15

10/06 13:45, 1年前 , 27F
圖解w
10/06 13:45, 27F

10/06 13:48, 1年前 , 28F
他沒有儲存原始資料能算拼貼嗎?
10/06 13:48, 28F
說到這個, 假如有人亂玩過GAN就知道 train壞的GAN會認為生成在範圍內的最好方法就是 直接生成樣本點XD

10/06 13:48, 1年前 , 29F
Diffusion的概念就是拓樸啊。感覺應該要建立距離概念,那
10/06 13:48, 29F
※ 編輯: newwu (73.96.90.228 美國), 10/06/2022 13:50:52

10/06 13:49, 1年前 , 30F
就應該是賦距的拓樸。有一點類似這樣:給全世界所有人都打
10/06 13:49, 30F

10/06 13:50, 1年前 , 31F
上一個等級,數字越接近零的才是你的朋友。數字很大的那些
10/06 13:50, 31F

10/06 13:50, 1年前 , 32F
可能因為社經或物理上距離你遙遠而數字太大。
10/06 13:50, 32F

10/06 13:52, 1年前 , 33F
他把"圖轉成雜訊又把雜訊還原成圖"的參數記下
10/06 13:52, 33F

10/06 13:54, 1年前 , 34F
把那個參數用在全新的雜訊圖上就是拼貼的時機
10/06 13:54, 34F
問題是人類也是阿 哪個繪師的身體各部位畫法 不是看其他人的圖學來的 不同點是人類有其他知識經驗 電腦只有偽隨機數 和 比人類多更多的閱覽描圖量

10/06 13:55, 1年前 , 35F
而且那種瞎雞巴大的模型隨便train一下就overfitting了
10/06 13:55, 35F
還有 125 則推文
還有 1 段內文
10/06 15:00, 1年前 , 161F
NovelAI如果是盜圖,那應該譴責他們,但AI是無辜的,
10/06 15:00, 161F

10/06 15:00, 1年前 , 162F
不能一竿子打翻一船AI,其他拿公開無版權圖案練習的AI
10/06 15:00, 162F

10/06 15:00, 1年前 , 163F
不該因此被推上處刑台
10/06 15:00, 163F

10/06 15:03, 1年前 , 164F
有問題一直都是盜圖的人,如果是自己畫圖餵給AI,哪
10/06 15:03, 164F

10/06 15:03, 1年前 , 165F
有問題
10/06 15:03, 165F

10/06 15:04, 1年前 , 166F
人類懂得把現實被認知到的概念用思想去融合或以此為
10/06 15:04, 166F

10/06 15:04, 1年前 , 167F
底魔改成一種新的本身就是在用自我意識去創造了啊
10/06 15:04, 167F

10/06 15:06, 1年前 , 168F
為什麼一直有人譴責NovelAi用盜版網站資料 但是卻沒見過
10/06 15:06, 168F

10/06 15:06, 1年前 , 169F
幾個人去譴責danbooru本身啊 它才是萬惡根源不是ㄇ
10/06 15:06, 169F

10/06 15:07, 1年前 , 170F
因為嘴danbooru高機率像上面那篇被曬www
10/06 15:07, 170F

10/06 15:07, 1年前 , 171F
ai也很會融阿 安價串不就融出一堆鬼東西
10/06 15:07, 171F

10/06 15:09, 1年前 , 172F
那像之前有人發文眼睛長奶子的難道就不算創造嗎?
10/06 15:09, 172F

10/06 15:09, 1年前 , 173F
我覺得前提是觀看者知道作者是人類或AI,才因此產生
10/06 15:09, 173F

10/06 15:09, 1年前 , 174F
出觀感差異
10/06 15:09, 174F

10/06 15:10, 1年前 , 175F
問題就在人類創意由來的生命經驗不光來自外在形象的
10/06 15:10, 175F

10/06 15:10, 1年前 , 176F
臨摹而已
10/06 15:10, 176F

10/06 15:16, 1年前 , 177F
推 好多熟悉的名詞,但我沒學好都看無
10/06 15:16, 177F

10/06 15:21, 1年前 , 178F
那是它經過思考理解之後想像得出的東西嗎?
10/06 15:21, 178F

10/06 15:21, 1年前 , 179F
樓上上說的能否舉例呢?有點抽象不太理解你的意思
10/06 15:21, 179F

10/06 15:23, 1年前 , 180F
對,我覺得重點在「作者的思考與理解」,人類繪師的
10/06 15:23, 180F

10/06 15:23, 1年前 , 181F
價值就在於.....他是人類。
10/06 15:23, 181F

10/06 15:23, 1年前 , 182F
因為我們是群居動物,天生有交流的需求,所以能夠理
10/06 15:23, 182F

10/06 15:23, 1年前 , 183F
解繪師思想的畫作比起AI隨機產圖還要有價值
10/06 15:23, 183F

10/06 15:24, 1年前 , 184F
(不過價值可能因人而異就是了)
10/06 15:24, 184F

10/06 15:25, 1年前 , 185F
並不是「因為是人類才能畫的出這樣的圖」,而是「因
10/06 15:25, 185F

10/06 15:25, 1年前 , 186F
為是人類畫出這樣的圖才有意義」
10/06 15:25, 186F

10/06 15:26, 1年前 , 187F
依照圖本身的用途不同,有些不需要作者這層意義的就
10/06 15:26, 187F

10/06 15:26, 1年前 , 188F
會被AI取代
10/06 15:26, 188F

10/06 15:39, 1年前 , 189F
現在的AI算圖的局限在於你的取材樣本終究來自於分析
10/06 15:39, 189F

10/06 15:39, 1年前 , 190F
其他人已經創作出的圖像作品,但是人類的創作靈感有
10/06 15:39, 190F

10/06 15:39, 1年前 , 191F
時候不單單來自於眼睛所見到的事物,夢境、記憶、感
10/06 15:39, 191F

10/06 15:39, 1年前 , 192F
情、經驗,甚至味覺嗅覺等等都能成為題材養分,透過
10/06 15:39, 192F

10/06 15:39, 1年前 , 193F
人的主觀意識形塑成作品,甚至在不同的精神情緒狀態
10/06 15:39, 193F

10/06 15:39, 1年前 , 194F
也會有不一樣的結果。
10/06 15:39, 194F

10/06 15:41, 1年前 , 195F
專業推
10/06 15:41, 195F

10/06 15:43, 1年前 , 196F
當然用AI學習運算可以在視覺結果上無限的接近,但我
10/06 15:43, 196F

10/06 15:43, 1年前 , 197F
認為過程還是有不小的差異
10/06 15:43, 197F

10/06 17:35, 1年前 , 198F
所以簡單說就是AI先看一幅畫怎麽被揉成垃圾
10/06 17:35, 198F

10/06 17:35, 1年前 , 199F
再嘗試把另一坨垃圾攤開變成一幅畫
10/06 17:35, 199F

10/06 18:07, 1年前 , 200F
寫得挺好&有插圖 推
10/06 18:07, 200F
文章代碼(AID): #1ZFcVjwN (C_Chat)
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 7 之 11 篇):
文章代碼(AID): #1ZFcVjwN (C_Chat)