Parallel Futures of a Game Engine (v2.0)repiiThe document presents insights from a presentation by Johan Andersson, a rendering architect at DICE, on the future of game engine development, particularly focusing on parallel computing in the Frostbite engine. It highlights the challenges of optimizing game code for different hardware platforms, approaches to job-based parallelism, and future advancements in graphic rendering and simulation. Key goals include improving the ease of development and maintainability of game code while pushing towards higher quality graphics through better computational capabilities.
LOD and Culling Systems That Scale - Unite LAUnity TechnologiesThe document outlines a data-oriented approach to implementing level of detail (LOD) and culling systems for rendering large static scenes in games. It describes the organization of a deep hierarchy of components and instances, optimizing it through techniques like flattening hierarchies and using spatial trees for efficiency. Key points include managing render batches and ensuring safe operations with entity component order versions while maintaining performance through effective culling and LOD handling.
Masked Software Occlusion CullingIntel® SoftwareThe document discusses occlusion culling techniques in graphics rendering, emphasizing both hardware and software methods such as hierarchical z-buffer and masked occlusion culling. It presents a detailed overview of algorithms, performance comparisons, and applications in modern game engines. Additionally, it provides resources and references for further exploration of the topic.
Real-time lightmap bakingRosario LeonardiThe document discusses real-time lightmap baking, addressing challenges with offline lightmap baking and outlining processes like lightmapping, UV mapping, and texture atlas creation. It emphasizes the benefits of real-time algorithms for immediate feedback in editors, comparing various methods including ray tracing and GPU utilization, while detailing performance impacts and artifacts. Additionally, it addresses instancing techniques and texture formats for optimization in rendering lightmaps and overall scene appearance.
파이썬 생존 안내서 (자막)Heungsub Lee넥슨코리아 사내 발표자료로 왓 스튜디오에서 파이썬으로 《야생의 땅: 듀랑고》 서버를 비롯한 여러가지 도구를 만든 경험을 공유합니다.
- 게임서버와 각종 툴, 테스트/빌드/배포 시스템을 만들 때 사용한 재료
- 파이썬 코드 품질 개선, 디버깅, 프로파일링, 최적화
- 파이썬 오픈소스 생태계와 왓 스튜디오가 하는 오픈소스 활동
The Rendering Technology of 'Lords of the Fallen' (Game Connection Europe 2014)Philip HammerThe document details the rendering technology used in the video game 'Lords of the Fallen', presented by Philip Hammer at GameConnection Europe 2014. It discusses advancements in deferred rendering techniques, including support for volumetric lighting and transparent shadows, along with the use of material parameter buffers to optimize performance. Additionally, it highlights the development journey, team contributions, and specific technical implementations that enhance visual fidelity in the game.
Unity Visual Effect GraphPhuong Hoang VuThe document discusses particle effects and the Unity Visual Effect Graph (VFX Graph) tool. It provides examples of making basic particle effects using techniques like burst, turbulence, and aging properties. It then compares VFX Graph to Unity's built-in Shuriken particle system, noting that VFX Graph allows for more particles, performance, and creative freedom through a node-based interface. Finally, it argues that VFX Graph and node-based tools are the future of visual effects authoring.
Technical Deep Dive into the New Prefab SystemUnity TechnologiesThe document provides a technical overview of Unity's new prefab system, detailing its functionalities such as asset importing, prefab mode, and scripting tools. Key improvements include eliminating disconnected prefab instances and enhancing the editing experience within Unity's editor. The presentation targets developers seeking to understand the backend workings and changes related to prefab management in Unity.
SNAPDRAGON SoC Family and ARM Architecture Abdullaziz TagawyThe document provides an overview of the Qualcomm Snapdragon system-on-chip (SoC) family and ARM architecture, detailing the evolution from the Scorpion CPU to the Krait CPU, highlighting their specifications and performance metrics. It also discusses the ARM architecture, its history, cache organization, and various use cases for embedded systems, application platforms, and secure applications. Key features of Snapdragon processors, such as high-definition video decoding capabilities and integration of GPUs, are emphasized, along with the distinctions between logical and physical caches in ARM architectures.
Introduction to DirectX 12 Programming , Ver 1.5YEONG-CHEON YOUIntroduction to DirectX 12 Programming , Ver 1.5
for youtube live
https://youtu.be/Z9veGJv7nPE
Parallel Graphics in Frostbite - Current & Future (Siggraph 2009)repii1. The document discusses parallel graphics techniques used in the Frostbite game engine, both currently and potentially in the future. It describes using job-based parallelism to utilize multiple CPU cores and the PS3 SPUs.
2. One technique is parallel command buffer recording to dispatch draw calls to multiple command buffers and scale linearly with core count. Another is software occlusion culling using the SPUs/CPU to rasterize a coarse z-buffer.
3. Potential future techniques discussed include deferred shading using compute shaders, with the compute shader culling lights and accumulating lighting per screen-space tile.
Frostbite on MobileElectronic Arts / DICENiklas Nummelin's presentation details the progress in adapting the Frostbite graphics engine for mobile platforms over the past 2.5 years, aiming to achieve Xbox 360 fidelity on mobile devices. The work includes transitioning from OpenGL to Metal, optimizing shaders, and implementing features like dynamic lighting and complex rendering techniques. Future efforts will focus on leveraging new APIs and optimizing for mobile hardware to deliver a complete engine feature set.
Parallel Futures of a Game Engine (v2.0)repiiThe document presents insights from a presentation by Johan Andersson, a rendering architect at DICE, on the future of game engine development, particularly focusing on parallel computing in the Frostbite engine. It highlights the challenges of optimizing game code for different hardware platforms, approaches to job-based parallelism, and future advancements in graphic rendering and simulation. Key goals include improving the ease of development and maintainability of game code while pushing towards higher quality graphics through better computational capabilities.
LOD and Culling Systems That Scale - Unite LAUnity TechnologiesThe document outlines a data-oriented approach to implementing level of detail (LOD) and culling systems for rendering large static scenes in games. It describes the organization of a deep hierarchy of components and instances, optimizing it through techniques like flattening hierarchies and using spatial trees for efficiency. Key points include managing render batches and ensuring safe operations with entity component order versions while maintaining performance through effective culling and LOD handling.
Masked Software Occlusion CullingIntel® SoftwareThe document discusses occlusion culling techniques in graphics rendering, emphasizing both hardware and software methods such as hierarchical z-buffer and masked occlusion culling. It presents a detailed overview of algorithms, performance comparisons, and applications in modern game engines. Additionally, it provides resources and references for further exploration of the topic.
Real-time lightmap bakingRosario LeonardiThe document discusses real-time lightmap baking, addressing challenges with offline lightmap baking and outlining processes like lightmapping, UV mapping, and texture atlas creation. It emphasizes the benefits of real-time algorithms for immediate feedback in editors, comparing various methods including ray tracing and GPU utilization, while detailing performance impacts and artifacts. Additionally, it addresses instancing techniques and texture formats for optimization in rendering lightmaps and overall scene appearance.
파이썬 생존 안내서 (자막)Heungsub Lee넥슨코리아 사내 발표자료로 왓 스튜디오에서 파이썬으로 《야생의 땅: 듀랑고》 서버를 비롯한 여러가지 도구를 만든 경험을 공유합니다.
- 게임서버와 각종 툴, 테스트/빌드/배포 시스템을 만들 때 사용한 재료
- 파이썬 코드 품질 개선, 디버깅, 프로파일링, 최적화
- 파이썬 오픈소스 생태계와 왓 스튜디오가 하는 오픈소스 활동
The Rendering Technology of 'Lords of the Fallen' (Game Connection Europe 2014)Philip HammerThe document details the rendering technology used in the video game 'Lords of the Fallen', presented by Philip Hammer at GameConnection Europe 2014. It discusses advancements in deferred rendering techniques, including support for volumetric lighting and transparent shadows, along with the use of material parameter buffers to optimize performance. Additionally, it highlights the development journey, team contributions, and specific technical implementations that enhance visual fidelity in the game.
Unity Visual Effect GraphPhuong Hoang VuThe document discusses particle effects and the Unity Visual Effect Graph (VFX Graph) tool. It provides examples of making basic particle effects using techniques like burst, turbulence, and aging properties. It then compares VFX Graph to Unity's built-in Shuriken particle system, noting that VFX Graph allows for more particles, performance, and creative freedom through a node-based interface. Finally, it argues that VFX Graph and node-based tools are the future of visual effects authoring.
Technical Deep Dive into the New Prefab SystemUnity TechnologiesThe document provides a technical overview of Unity's new prefab system, detailing its functionalities such as asset importing, prefab mode, and scripting tools. Key improvements include eliminating disconnected prefab instances and enhancing the editing experience within Unity's editor. The presentation targets developers seeking to understand the backend workings and changes related to prefab management in Unity.
SNAPDRAGON SoC Family and ARM Architecture Abdullaziz TagawyThe document provides an overview of the Qualcomm Snapdragon system-on-chip (SoC) family and ARM architecture, detailing the evolution from the Scorpion CPU to the Krait CPU, highlighting their specifications and performance metrics. It also discusses the ARM architecture, its history, cache organization, and various use cases for embedded systems, application platforms, and secure applications. Key features of Snapdragon processors, such as high-definition video decoding capabilities and integration of GPUs, are emphasized, along with the distinctions between logical and physical caches in ARM architectures.
Introduction to DirectX 12 Programming , Ver 1.5YEONG-CHEON YOUIntroduction to DirectX 12 Programming , Ver 1.5
for youtube live
https://youtu.be/Z9veGJv7nPE
Parallel Graphics in Frostbite - Current & Future (Siggraph 2009)repii1. The document discusses parallel graphics techniques used in the Frostbite game engine, both currently and potentially in the future. It describes using job-based parallelism to utilize multiple CPU cores and the PS3 SPUs.
2. One technique is parallel command buffer recording to dispatch draw calls to multiple command buffers and scale linearly with core count. Another is software occlusion culling using the SPUs/CPU to rasterize a coarse z-buffer.
3. Potential future techniques discussed include deferred shading using compute shaders, with the compute shader culling lights and accumulating lighting per screen-space tile.
Frostbite on MobileElectronic Arts / DICENiklas Nummelin's presentation details the progress in adapting the Frostbite graphics engine for mobile platforms over the past 2.5 years, aiming to achieve Xbox 360 fidelity on mobile devices. The work includes transitioning from OpenGL to Metal, optimizing shaders, and implementing features like dynamic lighting and complex rendering techniques. Future efforts will focus on leveraging new APIs and optimizing for mobile hardware to deliver a complete engine feature set.
언리얼엔진4를 활용한 레이트레이싱 리얼타임 영상 제작하기YOUNGJO CHO언리얼엔진4를 활용한 레이트레이싱 리얼타임 영상 제작하기 세미나 발표자료 입니다.
언리얼엔진 4.22에 적용된 레이트레이싱 기술을 사용하기 위해 필요한 기본적인 이론과 사용 방법에 대한 가이드 자료입니다.
조금이나마 도움이 되셨으면 좋겠습니다. 감사합니다.
[KGC2014] DX9에서DX11로의이행경험공유Hwan MinCyberConnect2에서는 2013년부터 DirectX11세대용 멀티플랫폼엔진 개발을 시작하였으며, 제작 시 발생하였던 문제점을 DirectX9와의 차이점을 바탕으로 공유하고자 합니다.
이 세션은 DirectX11의 개발이 처음이거나 관심 있으신 분을 대상으로 합니다. Tessellation 이나 OIT와 같은 최신기술은 다루지 않으므로 주의하시기 바랍니다.
Unity3D 엔진을 활용한 게임환경 분석 및 3D 그래픽스 기술 /제작 사례SangYun Yi20160305 부산 정보산업 진흥원 주최
부산 문화 컴플렉스(Busan Culture Complex) 컨퍼런스 발표 자료
Unity 3D를 통한 게임 환경 분석 및 개발 사례 공유
[IGC 2017] 에픽게임즈 최용훈 - 밤낮으로 부수고 짓고 액션 빌딩 게임 만들기 - 포트나이트강 민우에픽게임즈에서 제작한 포트나이트(Fortnite)는 액션 빌딩 게임으로, 낮과 밤의 환경이 존재하며 낮에는 나무, 벽돌, 철 등 오브젝트를 부수고 수집한 자원으로 건물 및 함정을 건설하고 밤에는 습격해 오는 몬스터를 물리치는 것이 특징입니다. 이런 역동적인 환경을 만들기 위해서 언리얼 엔진 4에 추가한 다양한 라이트, 섀도, 캐릭터 애니메이션 기능 그리고 100% 리얼타임 게임 트레일러를 제작하는데 사용된 ‘시퀀서’에 대해서도 살펴봅니다.
2. • 그동안 게임 개발에서 왜 레이트레이싱 이용한 GI를 사용하지 못했던 걸까?
당연한 걸 왜 물어봐?
계산량 많으니까
그렇지~
3. 기존의 그래픽카드의 발전 방향
• 코어의 클럭 속도는 정체된 반면, 코어 수 Up, Vram 용량 Up.
• 더 많은 병렬 처리가 가능하지만 코어 하나의 처리 속도 정체됨.
• 기존의 발전 방향으론 픽셀쉐이더에서 계산이 많은 연산은 힘들다.
4. NVIDIA RTX의 등장
• 기존 그래픽 카드 : 하나의 코어에서 모든 작업을 병렬 처리
• RTX : 작업에 따라 코어의 역할을 분리하여 병렬처리
5. Task
Task Task
• A: 하나의 대규모 프로그래밍 팀이 모든 일을 떠맡는다.
• B: 데브옵스, 컨텐츠, 엔진 팀을 따로 만들고, 각 팀에 알맞게 인원을 대치하고 작업한다.
• 어느 것이 더 효율적일까?
Team
Task
Task
Task
Task
Task
Engine
Dev-
Ops
Conte
nts
Task
Task
Task
Task
Task
Task
Task
Task
TaskTask
Task
Tas
k
9. Typical Scene Rendering
Render G-Buffer
Objects
조명 계산
Scene
Color Buffer Depth Buffer
G-Buffer
Normal Map Specular property
10. 그렇게 하면
안돼요!
자! 여기서 퀴즈!
멘마짱은 왜 안된다고
했을까요?
음 . . .
레이트레이싱도 G-버퍼 이용해서
조명 계산하면 되겠지?
11. Ray Tracing
• G버퍼는 카메라에서 보이는 객체들의 데이터만 저장된다.
• 하지만 레이트레이싱을 하기 위해선 씬의 안보이는 객체의 데이터도 필요하다.
카메라 공간
12. Ray Tracing
• 광원이 빛을 방사하는 것은 일종의 레이캐스팅라고 볼 수 있다.
• 반면 빛이 도달한 위치에서 반대로 광원까지의 위치를 추적하는 것을 레이트레이싱
이라고 한다.
Raycasting
Raytracing
왜 레이캐스팅이 아닌 레이트레이싱으로 전역 조명을 구현할까?
13. Ray Tracing
광원에서 빛이 방사되어 물체에 부딪히고 이 빛이 다시 반사되어 카메라 렌즈에 들어오면 우리가 보는 물체의 색이 된다.
즉, 우리는 눈에 보이는 장면 속 물체들의 색만 알면 되기 때문에 카메라 위치와 픽셀 위치를 기준으로 레이트레이싱하면
색을 구할 수 있다.
38. Culling
기존 파이프라인에서는 필요 없는 버텍스라도 GS나 PS 단계까지는 진행해야 했다.
그러나 새로운 파이프라인은 Task Shader에서 필요없는 버텍스를 사전에 버릴 수 있다.
39. Culling
• 하이폴리곤의 메쉬는 Meshlet이라는 버텍스 집합으로 분할시킬 수 있다.
• Meshlet으로 묶어 한 번의 테스트로 Meshlet 전체를 Culling 할 수 있다.
40. Dynamic LOD
• 이러한 특성을 이용해 동적으로 LOD를 조절하는 게 가능하다.
• Task Shader에서 Bbox를 이용한 Frustum Culing, Mesh Shader에서는 Meshlet에 대한
Frustum Culling을 하여 불필요한 작업을 최소화 한다.
• 협력 쓰레드 모델을 사용하여 LOD에 따라 쓰레드 개수를 조절하여 병목 현상을 줄인다.
• 다만 무조건 다 그려야 한다면 기존 파이프라인이 더 빠를 것이다.
43. Variable Rate Shading
• 기존에는 모든 픽셀에서 쉐이더를 호출해야 했지만 이제는 영역마다 쉐이더 호출 회
수를 조절할 수 있다.
모든 픽셀에서 쉐이더 호출
총 쉐이더 호출 횟수 : 256
픽셀 16개마다 쉐이더 호출
총 쉐이더 호출 횟수 : 16
59. Direct Storage와 SFS
• 오픈 월드 게임은 방대한 맵의 고해상도 텍스처를 요구하므로 다이렉트 스토리지와
SFS가 필수적이다.
• 또한 대부분의 게임에서 두 기술을 적용한 엑스박스의 로딩 속도가 PS5보다 십초 이
상 빠르다고 한다.
60. 정리
• 그래픽카드의 레이트레이싱 하드웨어 지원으로 게임에서 전역 조명 지원이 가능해졌다.
• 텐서 코어를 이용한 DLSS는 업스케일링 기술로 FHD를 UHD로 출력하여 약 2배 정도의 프레
임 향상을 기대할 수 있다.
• 메쉬 쉐이더는 동적 LOD 계산을 통해 방대한 폴리곤 처리를 가능하게 해준다.
• VRS는 개념적으로 스크린을 분할하여 각 영역마다 다른 해상도를 적용하여 쉐이딩하는 기술
이다. 눈에 보이는 퀄리티 하락은 최소화하면서 프레임을 향상시킬 수 있다.
• Direct Storage API는 GPU를 이용한 데이터 압축 처리로 데이터 이동 속도를 두배로 향상시
킨다.
• 샘플러 피드백 스트리밍은 실시간으로 텍스처의 필요한 부분만 메모리에 로드하여 메모리의
가용성을 향상시킨다.