[心得] 遊戲的"縮水" 與 TLOUR的平行運算技術

看板GameDesign作者 (CJ Cat)時間9年前 (2015/06/08 09:01), 9年前編輯推噓13(13028)
留言41則, 11人參與, 最新討論串1/1
不少遊戲初期公布的實機技術demo與最終成品有明顯畫質落差,為什麼? 本文將藉由說明在初期技術展示與最終成品階段的技術差別,來回答這個問題 順便介紹一些The Last of Us Remastered (PS4)壓榨硬體資源的技術 簡而言之:遊戲最終成品,通常所需運算資源種類與量,會比初期技術展示多 一個AAA遊戲成品在實機執行的時候,運算資源大致分配給以下幾項作業 1. 遊戲機制(CPU) 2. AI(CPU) 3. 物理(CPU and/or GPU) 4. 動畫(CPU) 5. 粒子(CPU and/or GPU) 6. 繪圖邏輯(CPU) 7. 繪圖執行(GPU) 初期實機技術demo,通常不會有多少1/2,可能會有3 4不會像最終成品消耗CPU與記憶體 所以大部分的運算資源都可以用在5/6/7 不要小看1/2/3消耗的資源量 這幾項在最終成品的資源消耗可以佔到CPU的50%以上 所以4/5/6/7能夠使用的硬體資源(粗估)只剩下初期技術demo的50% 如果在製作初期實機技術demo的時候 把100%硬體資源拿來展現4/5/6/7 那麼後來新加入1/2/3的資源消耗,勢必會產生"視覺上縮水"的情況 為了初期吸引觀眾目光,這幾乎是必然的結果 這樣是否表示AAA遊戲開發者不誠實? 見仁見智 不管是初期技術展示還是遊戲成品,硬體資源一定是幾乎被榨光的 製作初期demo的時候是否可以估計到之後會額外用到的資源? 非常難 不管是哪家工作室,應該都不想只用50%以下的硬體資源做技術展示demo吧 我個人是有了以上的認知之後 看到初期技術demo與最終成品的畫質落差 雖然會失望,但覺得比較可以接受這個事實了 接下來介紹TLOUR的一些壓榨硬體資源的技術 之前有提到,Naughty Dog為了從PS3跨到PS4 重新設計了一個平行運算的系統 負責人Christian Gyrling於今年GDC有個專題講座 強烈推薦給有興趣的資工領域朋友 影片連結 http://bit.ly/1eX5mb1 投影片連結 http://bit.ly/1HgtGQ9 TLOUR的硬體資源配置,可分為以下三種 1. 遊戲邏輯(CPU) 包含:遊戲機制、AI、物理、動畫、粒子 2. 繪圖邏輯(CPU) 生成繪圖指令,丟給GPU執行 3. 繪圖執行(GPU) 執行2生成的繪圖指令 一個單執行序的遊戲 1/2/3是串在一起,在同一個frame內線性依序執行的 如果要達到60fps,那1/2/3總共的運算時間就不可以超過16ms <A方案> CPU 遊戲邏輯 -> 繪圖邏輯 GPU -> 繪圖執行 |------------------------------| 16ms PS4有八個CPU核心,有六個是給遊戲使用的 把1/2平行化,拆給不同CPU核心執行 如此一來,1/2如果需要總共48ms執行時間,理論上只會用到8ms <B方案> CPU1 遊戲邏輯1 -> 繪圖邏輯1 CPU2 遊戲邏輯2 -> 繪圖邏輯2 CPU3 遊戲邏輯3 -> 繪圖邏輯3 CPU4 遊戲邏輯4 -> 繪圖邏輯4 CPU5 遊戲邏輯5 -> 繪圖邏輯5 CPU6 遊戲邏輯6 -> 繪圖邏輯6 GPU -> 繪圖執行 |--------------------------------| 16ms 但這還是不夠理想,CPU忙的時候GPU閒著,GPU忙的時候CPU閒著 開發AAA遊戲的精隨就是要最大幅度使用硬體資源啊! 那如果把遊戲邏輯在frame0生成的資料,暫存在記憶體 繪圖邏輯在frame1的時候用這些資料生成繪圖指令,交給GPU繪圖執行呢? 把遊戲邏輯和繪圖邏輯切成小塊,交互執行 所以感覺上遊戲邏輯和繪圖邏輯"同時"在一個CPU核心上執行 <C方案> CPUn 遊戲邏輯n (生成frame1資料) 繪圖邏輯n (使用frame0資料) GPU -> 繪圖執行 |-------------------| 16ms 嗯,光是視覺看來,就已經能夠更有效率地使用硬體資源了 但是CPU和GPU還是各有自己的閒暇時間,不行! 那如果更進一步,繪圖執行使用的資料,是繪圖邏輯上一個frame產生的呢? <D方案> CPUn 遊戲邏輯n (生成frame2資料) 繪圖邏輯n (使用frame1資料,生成frame0資料) GPU 繪圖執行 (使用frame0資料) |-------| 16ms 好了,CPU和GPU已經最大幅度使用,閒不下來啦 這個D方案就是TLOUR使用的技術 缺點就是,畫面是GPU使用兩個frame以前的舊資料呈現出來的"老畫面" 所以TLOUR是有兩個frame的延遲時間的 當玩家看到畫面上,準心瞄準敵人的頭時 從遊戲邏輯的觀點來看,敵人的頭可能已經不在準心下了 TLOUR彈藥普遍稀少,為了補償玩家,在射擊的時候 只要在過去兩個frame中有瞄準到目標,就算是判定擊中 D方案不是唯一解或最佳解,一切端看開發者考量 The Order: 1886採取的方式類似B方案(有將作業切小塊和生產線處理) 因為Ready at Dawn工作室明確表態,說不想要讓遊戲有任何延遲 所以如果他們願意採用D方案,The Order: 1886可以衝到60fps也不一定? -- Web http://AllenChou.net Twitter http://twitter.com/TheAllenChou LinkedIn http://linkedin.com/in/MingLunChou -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 45.50.175.11 ※ 文章網址: https://www.ptt.cc/bbs/GameDesign/M.1433725304.A.F8C.html ※ 編輯: cjcat2266 (45.50.175.11), 06/08/2015 09:17:31

06/08 09:53, , 1F
謝謝分享~~又學到一些東西了~~
06/08 09:53, 1F

06/08 10:12, , 2F
過去2個frame有擊中都算 所以邏輯資料會保留2個frame囉
06/08 10:12, 2F

06/08 10:13, , 3F
這樣會對記憶體造成負擔嗎 或是其實資料量很少 沒影響
06/08 10:13, 3F

06/08 10:14, , 4F
既然遊戲生得出來,就表示記憶體可以負擔吧XD
06/08 10:14, 4F

06/08 10:24, , 5F
如果GPU的時脈拉到2GHz以上我推測可以用來算AI
06/08 10:24, 5F

06/08 10:25, , 6F
遊戲這種hard real time運算 對於平行後的資料蒐集
06/08 10:25, 6F

06/08 10:25, , 7F
我的想法是 通常這個frame的資料出來時
06/08 10:25, 7F

06/08 10:25, , 8F
是相當嚴苛的...
06/08 10:25, 8F

06/08 10:26, , 9F
上個frame的資料應該就丟了 甚至釋放了
06/08 10:26, 9F

06/08 10:26, , 10F
所以這作法 必須保留3個frame 的資料
06/08 10:26, 10F

06/08 10:28, , 11F
或許是硬體特性的問題 目前開發的HSA項目
06/08 10:28, 11F

06/08 10:28, , 12F
當然不是所有資料全保留啊,只保留繪圖相關資料而已
06/08 10:28, 12F

06/08 10:29, , 13F
在GPU時脈800Mhz下 簡易四則運算的回應時間是
06/08 10:29, 13F

06/08 10:29, , 14F
我們已經三個人在平行發言了XD
06/08 10:29, 14F

06/08 10:29, , 15F
1000~5000ns 比CPU慢了約100倍
06/08 10:29, 15F

06/08 10:30, , 16F
XDDDDDD
06/08 10:30, 16F

06/08 10:30, , 17F
這就是沒有ordered的關係
06/08 10:30, 17F

06/08 10:32, , 18F
但是兩個frame的延遲我認為算很嚴重了 至少競技類
06/08 10:32, 18F

06/08 10:32, , 19F
的遊戲應用起來很困難
06/08 10:32, 19F

06/08 10:33, , 20F
頑皮狗做的遊戲都是單人線性劇情走向,所以沒問題的XD
06/08 10:33, 20F

06/08 12:07, , 21F
不過TLOU和uncharted不是都有多人對戰嗎?
06/08 12:07, 21F

06/08 12:07, , 22F
對人對戰的部份也是用這種2 frame方式處理,還是改以反應
06/08 12:07, 22F

06/08 12:07, , 23F
速度為優先考量呢?
06/08 12:07, 23F

06/08 12:45, , 24F
是使用同一套系統,畢竟射擊遊戲的被攻方錯誤容許度高
06/08 12:45, 24F

06/08 12:46, , 25F
攻方如果發現有瞄準到的敵人沒有攻擊判定,會很明顯
06/08 12:46, 25F

06/08 12:46, , 26F
而被攻方受到攻擊判定,也就只能認了
06/08 12:46, 26F

06/08 12:47, , 27F
一般也不會覺得 "明明自己躲過瞄準了,怎麼還被打到?"
06/08 12:47, 27F

06/08 12:47, , 28F
因為被攻方也看不到攻方的準星是否有瞄到自己
06/08 12:47, 28F

06/08 13:55, , 29F
了解XD
06/08 13:55, 29F

06/08 14:43, , 30F
專業文!
06/08 14:43, 30F

06/08 16:22, , 31F
試著回答記憶體的問題:通常邏輯部份並不佔多少記憶體
06/08 16:22, 31F

06/08 16:23, , 32F
理論上,多存兩個frame的邏輯狀態並不會增加多少記憶體
06/08 16:23, 32F

06/08 16:23, , 33F
需求,至少和texture/audio之類動不動就上百MB比起來是
06/08 16:23, 33F

06/08 16:23, , 34F
很小的問題
06/08 16:23, 34F

06/08 16:32, , 35F
也不用存邏輯狀態,只要存繪圖需要的transform就好
06/08 16:32, 35F

06/08 19:26, , 36F
記憶體幾乎就是texture的意思了 其他比起來都是渣XD
06/08 19:26, 36F

06/08 23:27, , 37F
推好文
06/08 23:27, 37F
※ 編輯: cjcat2266 (160.33.43.15), 06/09/2015 01:01:44

06/09 02:16, , 38F
06/09 02:16, 38F

06/09 08:51, , 39F
06/09 08:51, 39F

06/09 13:24, , 40F
邏輯資料的記憶體 的確是非常小沒錯
06/09 13:24, 40F

06/09 14:33, , 41F
只是想到 videogame的記憶體也是寸土寸金 XD
06/09 14:33, 41F
文章代碼(AID): #1LTEbu-C (GameDesign)