[心得] 遊戲的"縮水" 與 TLOUR的平行運算技術
不少遊戲初期公布的實機技術demo與最終成品有明顯畫質落差,為什麼?
本文將藉由說明在初期技術展示與最終成品階段的技術差別,來回答這個問題
順便介紹一些The Last of Us Remastered (PS4)壓榨硬體資源的技術
簡而言之:遊戲最終成品,通常所需運算資源種類與量,會比初期技術展示多
一個AAA遊戲成品在實機執行的時候,運算資源大致分配給以下幾項作業
1. 遊戲機制(CPU)
2. AI(CPU)
3. 物理(CPU and/or GPU)
4. 動畫(CPU)
5. 粒子(CPU and/or GPU)
6. 繪圖邏輯(CPU)
7. 繪圖執行(GPU)
初期實機技術demo,通常不會有多少1/2,可能會有3
4不會像最終成品消耗CPU與記憶體
所以大部分的運算資源都可以用在5/6/7
不要小看1/2/3消耗的資源量
這幾項在最終成品的資源消耗可以佔到CPU的50%以上
所以4/5/6/7能夠使用的硬體資源(粗估)只剩下初期技術demo的50%
如果在製作初期實機技術demo的時候
把100%硬體資源拿來展現4/5/6/7
那麼後來新加入1/2/3的資源消耗,勢必會產生"視覺上縮水"的情況
為了初期吸引觀眾目光,這幾乎是必然的結果
這樣是否表示AAA遊戲開發者不誠實? 見仁見智
不管是初期技術展示還是遊戲成品,硬體資源一定是幾乎被榨光的
製作初期demo的時候是否可以估計到之後會額外用到的資源? 非常難
不管是哪家工作室,應該都不想只用50%以下的硬體資源做技術展示demo吧
我個人是有了以上的認知之後
看到初期技術demo與最終成品的畫質落差
雖然會失望,但覺得比較可以接受這個事實了
接下來介紹TLOUR的一些壓榨硬體資源的技術
之前有提到,Naughty Dog為了從PS3跨到PS4
重新設計了一個平行運算的系統
負責人Christian Gyrling於今年GDC有個專題講座
強烈推薦給有興趣的資工領域朋友
影片連結 http://bit.ly/1eX5mb1
投影片連結 http://bit.ly/1HgtGQ9
TLOUR的硬體資源配置,可分為以下三種
1. 遊戲邏輯(CPU) 包含:遊戲機制、AI、物理、動畫、粒子
2. 繪圖邏輯(CPU) 生成繪圖指令,丟給GPU執行
3. 繪圖執行(GPU) 執行2生成的繪圖指令
一個單執行序的遊戲
1/2/3是串在一起,在同一個frame內線性依序執行的
如果要達到60fps,那1/2/3總共的運算時間就不可以超過16ms
<A方案>
CPU 遊戲邏輯 -> 繪圖邏輯
GPU -> 繪圖執行
|------------------------------|
16ms
PS4有八個CPU核心,有六個是給遊戲使用的
把1/2平行化,拆給不同CPU核心執行
如此一來,1/2如果需要總共48ms執行時間,理論上只會用到8ms
<B方案>
CPU1 遊戲邏輯1 -> 繪圖邏輯1
CPU2 遊戲邏輯2 -> 繪圖邏輯2
CPU3 遊戲邏輯3 -> 繪圖邏輯3
CPU4 遊戲邏輯4 -> 繪圖邏輯4
CPU5 遊戲邏輯5 -> 繪圖邏輯5
CPU6 遊戲邏輯6 -> 繪圖邏輯6
GPU -> 繪圖執行
|--------------------------------|
16ms
但這還是不夠理想,CPU忙的時候GPU閒著,GPU忙的時候CPU閒著
開發AAA遊戲的精隨就是要最大幅度使用硬體資源啊!
那如果把遊戲邏輯在frame0生成的資料,暫存在記憶體
繪圖邏輯在frame1的時候用這些資料生成繪圖指令,交給GPU繪圖執行呢?
把遊戲邏輯和繪圖邏輯切成小塊,交互執行
所以感覺上遊戲邏輯和繪圖邏輯"同時"在一個CPU核心上執行
<C方案>
CPUn 遊戲邏輯n (生成frame1資料)
繪圖邏輯n (使用frame0資料)
GPU -> 繪圖執行
|-------------------|
16ms
嗯,光是視覺看來,就已經能夠更有效率地使用硬體資源了
但是CPU和GPU還是各有自己的閒暇時間,不行!
那如果更進一步,繪圖執行使用的資料,是繪圖邏輯上一個frame產生的呢?
<D方案>
CPUn 遊戲邏輯n (生成frame2資料)
繪圖邏輯n (使用frame1資料,生成frame0資料)
GPU 繪圖執行 (使用frame0資料)
|-------|
16ms
好了,CPU和GPU已經最大幅度使用,閒不下來啦
這個D方案就是TLOUR使用的技術
缺點就是,畫面是GPU使用兩個frame以前的舊資料呈現出來的"老畫面"
所以TLOUR是有兩個frame的延遲時間的
當玩家看到畫面上,準心瞄準敵人的頭時
從遊戲邏輯的觀點來看,敵人的頭可能已經不在準心下了
TLOUR彈藥普遍稀少,為了補償玩家,在射擊的時候
只要在過去兩個frame中有瞄準到目標,就算是判定擊中
D方案不是唯一解或最佳解,一切端看開發者考量
The Order: 1886採取的方式類似B方案(有將作業切小塊和生產線處理)
因為Ready at Dawn工作室明確表態,說不想要讓遊戲有任何延遲
所以如果他們願意採用D方案,The Order: 1886可以衝到60fps也不一定?
--
Web http://AllenChou.net
Twitter http://twitter.com/TheAllenChou
LinkedIn http://linkedin.com/in/MingLunChou
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 45.50.175.11
※ 文章網址: https://www.ptt.cc/bbs/GameDesign/M.1433725304.A.F8C.html
※ 編輯: cjcat2266 (45.50.175.11), 06/08/2015 09:17:31
推
06/08 09:53, , 1F
06/08 09:53, 1F
推
06/08 10:12, , 2F
06/08 10:12, 2F
→
06/08 10:13, , 3F
06/08 10:13, 3F
→
06/08 10:14, , 4F
06/08 10:14, 4F
→
06/08 10:24, , 5F
06/08 10:24, 5F
→
06/08 10:25, , 6F
06/08 10:25, 6F
→
06/08 10:25, , 7F
06/08 10:25, 7F
→
06/08 10:25, , 8F
06/08 10:25, 8F
→
06/08 10:26, , 9F
06/08 10:26, 9F
→
06/08 10:26, , 10F
06/08 10:26, 10F
→
06/08 10:28, , 11F
06/08 10:28, 11F
→
06/08 10:28, , 12F
06/08 10:28, 12F
→
06/08 10:29, , 13F
06/08 10:29, 13F
→
06/08 10:29, , 14F
06/08 10:29, 14F
推
06/08 10:29, , 15F
06/08 10:29, 15F
推
06/08 10:30, , 16F
06/08 10:30, 16F
→
06/08 10:30, , 17F
06/08 10:30, 17F
推
06/08 10:32, , 18F
06/08 10:32, 18F
→
06/08 10:32, , 19F
06/08 10:32, 19F
→
06/08 10:33, , 20F
06/08 10:33, 20F
推
06/08 12:07, , 21F
06/08 12:07, 21F
→
06/08 12:07, , 22F
06/08 12:07, 22F
→
06/08 12:07, , 23F
06/08 12:07, 23F
→
06/08 12:45, , 24F
06/08 12:45, 24F
→
06/08 12:46, , 25F
06/08 12:46, 25F
→
06/08 12:46, , 26F
06/08 12:46, 26F
→
06/08 12:47, , 27F
06/08 12:47, 27F
→
06/08 12:47, , 28F
06/08 12:47, 28F
推
06/08 13:55, , 29F
06/08 13:55, 29F
推
06/08 14:43, , 30F
06/08 14:43, 30F
推
06/08 16:22, , 31F
06/08 16:22, 31F
→
06/08 16:23, , 32F
06/08 16:23, 32F
→
06/08 16:23, , 33F
06/08 16:23, 33F
→
06/08 16:23, , 34F
06/08 16:23, 34F
→
06/08 16:32, , 35F
06/08 16:32, 35F
推
06/08 19:26, , 36F
06/08 19:26, 36F
推
06/08 23:27, , 37F
06/08 23:27, 37F
※ 編輯: cjcat2266 (160.33.43.15), 06/09/2015 01:01:44
推
06/09 02:16, , 38F
06/09 02:16, 38F
推
06/09 08:51, , 39F
06/09 08:51, 39F
→
06/09 13:24, , 40F
06/09 13:24, 40F
→
06/09 14:33, , 41F
06/09 14:33, 41F