- 나눗셈은 곱셈보다 연산 속도가 월등히 느립니다. 100 / 10 이런 식이 아닌 100 * 0.1을 사용
# magnitude 보다는 sqrMagnitude를 사용해서 비교한다. (제곱근 계산 x)
- Unity 공식 문서에서 쓰여있습니다.
# 삼각함수의 값은 상수로 저장하고 사용하는 것이 좋다.
# 문자열은 readonly 혹은 const 키워드를 사용해 가비지 컬렉션으로부터 벗어나도록 한다.
[만흉의 원인 : 가비지 컬렉터]
가비지 컬렉터(GC)는 언제 일어날지 모릅니다.
# Mono의 동적 메모리 관리 때문에 메모리 해제를 위해 GC가 자동 호출된다.
# GC는 언제 일어날지 모른다.
# GC가 일어나면 게임이 멈추는 현상이 발생하게 된다.
# 동적 메모리 해제가 가능한 일어나지 않도록 하는 것이 GC 관리의 핵심
- 우리가 쓰고 있는 MonoBehavior는 메모리 관리에 GC가 자동 호출되도록 설계되어 있습니다. 이 GC가 프로그래머의 입장에서 좋을 수도 있고 그렇지 않을 때도 있습니다. GC가 실행되는 동안 많은 양을 처리하게 되면 렉 현상을 겪게되며 그렇지 않기 위해서는 게임을 만들 때 GC를 고려하여 만들어야합니다. 가비지 컬렉터의 할 일을 줄여주기 위한 방법에 대해 알아보겠습니다.
[1] 무엇이든 동적 생성 및 해제는 굉장히 비용이 큰 작업입니다.
위에 언급된 바가 있는 오브젝트 풀링 기법을 사용해 메모리를 관리하는 것이 좋습니다.
[2] 오브젝트가 해제되면 다음 과정으로는 GC가 동작되어 렉이 걸릴 수 밖에 없습니다.
즉 오브젝트를 만들어둔 후 활성화 또는 비활성화를 이용해 사용하도록 하는 것이 좋습니다.
[3] 문자열 병합은 StringBuilder의 Append를 사용하면 좋습니다.
왜냐하면 string + string은 임시 문자열을 뱉기 때문에 가비지 컬렉션이 일어나는 환경을 제공하기 때문입니다.
[4] foreach 대신에 for를 이용하도록 합니다.
foreach는 한번 돌리면 24byte의 가비지 메모리를 생성시키게 되며 수많이 돌면 더 많은 메모리를 생성시키게 되므로 for 문을 이용하도록 하는 편이 좋습니다.
[5] 태그 비교에서는 CompareTag()를 사용하도록 합니다.
객체의 tag 프로퍼티를 호출하는 것은 추가 메모리를 할당하며 복사를 하게됩니다.
[6] 모든 비교문에서 .equals()를 사용하도록 합니다.
"==" 구문으로 사용하게되면 임시적인 메모리가 남게 되며 가비지 컬렉션이 할 일이 늘게 됩니다.
[7] 데이터 타입은 Class 대신 Struct를 사용하여 만들어 주면 메모리 관리가 된다.
많은 게임에 있어 좋은 퍼포먼스는 결정적인 것입니다. 게임의 그래픽 렌더링 속도를 극대화하기 위한 간단한 지침을 아래에서 정리합니다.
어디에서 그래픽 비용이 드는가
게임의 그래픽 부분은 주로 컴퓨터의 GPU와 CPU 두 시스템에 비용이 많이 듭니다. 어떤 최적화를 하던지 먼저 할 일은 퍼포먼스 문제가 어디에 있는지 를 찾는 것입니다. GPU와 CPU에서 최적화의 내용은 상당히 다릅니다. (경우에 따라서는 상반되는 내용입니다 - CPU 최적화를 위해 GPU의 처리를 늘리거나, 그 반대 등)
병목 현상 및 그것을 검사하는 방법으로 :
GPU는 종종 필레이트(fillrate) 또는 메모리 대역폭 제한되어 있습니다
낮은 해상도로 게임 실행함으로써 빨라졌다면, GPU의 필레이트에 의해 제한되어 있을 가능성이 높습니다.
GPU가 처리하는 정점이 너무 많은 경우. 얼만큼의 정점이어야 “문제 없다”인가는 GPU와 정점 쉐이더의 복잡성에 따라 달라집니다. 전형적인 지표는 모바일에서 “십만 이하”, PC에서 “수백만 이하”입니다.
The CPU has too many vertices to process. This could be in skinned meshes, cloth simulation, particles, or other game objects and meshes. As above, it is generally good practice to keep this number as low as possible without compromising game quality. See the section on CPU optimization below for guidance on how to do this.
GPU, CPU 렌더링이 문제가 아닌 경우. 예를 들어, 스크립트 및 물리 연산이 문제일지도 모릅니다. Profiler를 통해 확인하십시오.
CPU optimization
화면의 오브젝트를 렌더링하는 데 CPU가 해야 할 일이 몇 가지 있습니다 - 어떤 라이트가 오브젝트에 영향을 주는지를 확인하는 쉐이더 및 쉐이더 파라미터 설정, 드로잉 명령을 그래픽 드라이버에 보내고 그래픽 카드로 보내는 명령을 준비하는 등입니다. 이들은 “오브젝트 단위”의 CPU 비용이 저렴하지 않기 때문에 나타나는 오브젝트가 많이 있는 경우, 계속 쌓여버리는 경우가 있습니다.
All this “per object” CPU usage is resource-intensive, so if you have lots of visible objects, it can add up. For example, if you have a thousand triangles, it is much easier on the CPU if they are all in one mesh, rather than in one mesh per triangle (adding up to 1000 meshes). The cost of both scenarios on the GPU is very similar, but the work done by the CPU to render a thousand objects (instead of one) is significantly higher.
Reduce the visible object count. To reduce the amount of work the CPU needs to do:
오브젝트의 메테리얼 수를 줄이기 위해 다른 텍스처를 더 큰 텍스처 Atlas에 정리 합니다.
오브젝트가 여러 번 렌더링되는 것을 줄입니다(리플렉션, 그림자, 픽셀 라이트, 기타, 아래에서 설명)
오브젝트를 정리하고, 각 메쉬가 적어도 수백개의 삼각형을 가지게 하고, 메쉬 전체에서 Material이 한 개가 되도록 합니다. 메테리얼이 공통적이지 않은 두 오브젝트를 정리해도 퍼포먼스는 전혀 향상되지 않는다는 것을 이해하는 것이 중요합니다. 여러 메테리얼을 사용하는 일반적인 이유는 두 메쉬가 같은 텍스처를 사용하지 않기 때문에, CPU 성능을 최적화하려면 오브젝트가 같은 텍스쳐로 결합되어 공유하는 것을 보장해야 합니다.
그러나, Forward Rendering 경로에서 픽셀 라이트를 많이 사용하는 경우, 뒷부분에 나오는 바와 같이 오브젝트를 정리하는 것이 무의미한 경우가 있습니다.
GPU : 모델 지오메트리 최적화
There are two basic rules for optimizing the geometry of a model:
필요 이상으로 삼각형을 사용하지 말 것
UV 매핑의 솔기(seams) 및 하드 엣지(이중화한 정점)를 가능한 한 적은 수로 억제
실제로 그래픽 하드웨어가 처리해야 할 것은 3D 응용 프로그램에서 나타나는 수와 일반적으로 일치하지 않는 점에 유의하십시오. 모델링 응용 프로그램은 일반적 지오메트리 정점 수, 즉 모델을 구성하는 개별적인 코너의 수를 표시합니다. 그래픽 카드는 어떤 지오메트리 정점은 두 개 이상의 논리적인 정점으로 나눌 필요가 있습니다. 정점은 여러 법선, UV 좌표 또는 정점 컬러가 있는 경우에 분할해야 합니다. 결과적으로, Unity의 정점 수는 항상 3D 응용 프로그램에서 표시되는 것보다 커집니다.
모델 지오메트리의 수가 GPU에 가장 관련이 있으며, Unity의 일부 기능, 예를 들면 메쉬 스키닝 모델은 은 CPU에서 처리 합니다.
Lighting performance
계산이 필요없는 라이팅이 항상 가장 빠릅니다! 매 프레임 계산하는 것 대신, Lightmapping를 사용하여 라이팅 “베이크”를 한 번 해주시기 바랍니다. 라이트맵 환경을 생성하는 과정은 씬 안에서 단순히 라이트 배치를 하는 것보다 조금 더 시간이 걸립니다. 하지만:
아주 빠르게 실행됩니다(2개의 픽셀 라이트에서는 2–3 배)
전역 조명 및 라이트 매퍼의 베이크에 의해 결과를 매끄럽게 할 수 있기 때문에 외형 또한 개선됩니다.
많은 경우에서, 라이트를 여기저기 배치하는 대신에 쉐이더와 컨텐츠에 간단한 트릭을 사용하는게 가능해 집니다. 예를 들어, “Rim Lighting”을 얻기 위해 카메라에 직접 빛을 추가하는 대신 전용 “Rim Lighting”계산을 쉐이더에 직접 추가하는 것이 좋습니다.
동적 픽셀 라이팅에 의해 영향을 받는 픽셀에 오버 헤드가 증가하고 오브젝트가 여러 경로에서 렌더링되는 것으로 이어질 수 있습니다. 모바일 및 저가형 PC의 GPU 등 그다지 강력하지 않은 장치는 여러개의 Pixel Light가 하나의 오브젝트를 비추는 것은 피하고, 매 프레임마다 계산시키지 말고 라이트 맵을 사용하여 정적 오브젝트를 조명 계산을 사용하십시오. 동적 정점 라이팅도 정점 변환에 의해 비용을 상당히 증가시킵니다. 여러 라이트가 하나의 오브젝트를 비추는 것을 피하십시오.
만약 픽셀 라이팅을 사용하는 경우, 픽셀 라이트에 의해 각 메쉬가 비춰질만큼 렌더링이 이루어집니다. 만약 떨어진 두 메쉬를 결합하면 결합한 오브젝트의 유효 크기를 늘립니다. 이 결합한 오브젝트의 일부라도 비추는 모든 픽셀 라이트는 렌더링 대상으로 고려되므로, 렌더링 패스의 횟수가 늘어날지도 모릅니다. 일반적으로 결합한 오브젝트의 렌더링은 각각의 다른 오브젝트의 패스 수의 합계이기에, 결합함으로써 얻을 수 있는 없습니다. 이러한 이유로 다른 세트의 픽셀 라이트에 의해 영향을 받을 정도로 멀리 떨어진 메쉬는 결합해서는 안됩니다.
렌더링시 Unity는 메쉬를 둘러싼 모든 라이트를 찾아, 어떤 라이트가 그것에 가장 영향을 주는지를 계산합니다. Quality Settings에 의해 몇 개의 라이트가 픽셀 라이트와 정점 라이트로 남는가를 조정할 수 있습니다. 각 라이트는 메쉬에서의 거리 및 비추는 강도에 기초하여 각자의 중요도를 계산합니다. 게다가 몇 가지 라이트는 게임의 흐름을 기준으로 중요도가 다릅니다. 이러한 이유로, 모든 라이트는 Render Mode 설정이 있습니다. Important 또는 Not Important에서 설정할 수 있습니다. Not Important에 설정된 빛은 일반적으로 더 낮은 렌더링 오버 헤드가 될 것입니다.
예를 들어 자동차 경주 게임에서 플레이어의 차량이 어둠 속에서 헤드 라이트를 켜고 달리고 있다고 가정합니다. 헤드 라이트는 가장 중요한 광원이 되기 때문에 Render Mode는 아마 Important로 설정 될 것입니다. 반대로 게임의 중요성이 다소 떨어지는 것(다른 차량의 백라이트 등) 및 픽셀 라이트에 의해 시각적 효과가 개선되지 않는 경우가 있습니다. 그 라이트의 Render Mode는 Not Important로 설정함으로써, 효과가 약한 곳에서의 렌더링 소비를 피합니다.
픽셀 라이팅 최적화는 CPU와 GPU를 모두 절약할 수 있습니다 : CPU가 처리하는 드로우콜이 줄어들고, GPU가 처리하는 정점 수 및 추가 오브젝트 렌더링으로 래스터라이즈(Rasterize)하는 픽셀 수가 줄어듭니다.
GPU : 텍스처 압축과 밉맵
압축 텍스처를 사용하여 텍스처의 크기를 감소(결과적으로 로드 시간의 속도 및 메모리 사용 최소화)하고, 렌더링 성능을 비약적으로 향상시킬 수 있습니다. 압축 텍스처는 압축되지 않은 32비트 RGBA 텍스처와 비교하면 약간의 메모리 대역폭 밖에 사용하지 않습니다.
텍스처 밉맵을 사용하세요
원칙적으로 3D 씬에서 사용되는 텍스처에서 Generate Mip Maps를 활성화 하십시오. 압축 텍스처에 의해 GPU가 렌더링시에 전송되는 텍스처 데이터의 양을 제한하는 것과 마찬가지로, Mip Map 된 텍스처에 의해 GPU가 더 작은 삼각형에는 낮은 해상도를 사용합니다.
이 규칙의 유일한 예외가 되는 것은 텍셀(텍스처 픽셀)이 렌더링된 화면 픽셀에 1:1로 매핑하는, 즉 UI 요소나 2D 게임의 경우입니다.
LOD 및 레이어 당 컬링 거리(Cull Distance)
Culling objects involves making objects invisible. This is an effective way to reduce both the CPU and GPU load.
일부 게임에서는 작은 물체를 큰 오브젝트와 비교하여 무시하고 CPU 및 GPU 로드를 감소하는 것이 적절합니다. 예를 들어, 작은 바위와 모래는 먼 거리에서는 안보이게 하고 큰 건물은 보이는 상태로 할 수 있습니다.
실시간 그림자가 좋긴하지만 CPU의 과도한 드로우콜과 GPU에서 추가 작업 면에서 보았을 때 퍼포먼스 비용을 상당히 소모합니다. 자세한 내용은 Light Performance page를 참조하십시오.
GPU: 고성능 쉐이더 작성 팁
Different platforms have vastly different performance capabilities; a high-end PC GPU can handle much more in terms of graphics and shaders than a low-end mobile GPU. The same is true even on a single platform; a fast GPU is dozens of times faster than a slow integrated GPU.
모바일 플랫폼의 GPU 퍼포먼스 및 저가형 PC는 당신의 개발 기계보다 훨씬 느릴 것입니다. 일반적으로 쉐이더를 수동으로 최적화하여 계산량 및 텍스처 로딩을 절감하지 않으면 좋은 퍼포먼스를 얻을 수 없습니다. 예를 들어, Unity의 일부 내장 쉐이더는 “모바일”에 해당하는 것이 있으며, 더 빠릅니다 (몇 가지 제한 사항이나 근사치는 있지만, 그것이 바로 그들을 빠르게 하는 것입니다).
모바일 및 저가형 PC 그래픽 카드에서 가장 중요한 것을 아래에 가이드 라인으로 정리했습니다.
복잡한 수학 연산
Transcendental mathematical functions (such as pow, exp, log, cos, sin, tan) are quite resource-intensive, so avoid using them where possible. Consider using lookup textures as an alternative to complex math calculations if applicable.
Avoid writing your own operations (such as normalize, dot, inversesqrt). Unity’s built-in options ensure that the driver can generate much better code. Remember that the Alpha Test (discard) operation often makes your fragment shader slower.
부동 소수점 연산
While the precision (float vs half vs fixed) of floating point variables is largely ignored on desktop GPUs, it is quite important to get a good performance on mobile GPUs. See the Shader Data Types and Precision page for details.
내장 쉐이더를 사용하는 경우, Mobile 또는 Unlit의 카테고리에서 선택합니다. 모바일이 아닌 플랫폼에서도 작동하지만 더 복잡한 쉐이더가 단순화되고 근사화(approximated)된 버전입니다.
씬에서 다른 메테리얼의 수가 낮도록 억제합니다 - 서로 다른 오브젝트간에 메테리얼을 최대한 공유합니다.
움직이지 않는 오브젝트에 대해 Static을 설정하고 Static Batching과 같은 내부 최적화를 허용합니다.
Only have a single (preferably directional) pixel light affecting your geometry, rather than multiples.
Bake lighting rather than using dynamic lighting.
가능한한 압축 텍스처 포맷을 사용하고, 그 외의 경우는 32비트보다 16비트를 선택합니다.
Avoid using fog where possible.
Occlusion Culling의 장점을 배운 뒤, 복잡하고 static한 씬에 의해 표시되는 지오메트리의 양 및 드로우콜을 줄일 수 있습니다. 오클루전 컬링의 효과가 나오는 레벨의 설계를 합니다.
Skybox을 사용하여 멀리 있는 지오메트리를 “진짜처럼 보이게 합니다.”
픽셀 쉐이더를 사용하거나 Texture Combiner를 사용하여 다중 패스가 아닌 복수의 텍스처를 믹스합니다.
Use half precision variables where possible.
복잡한 숫자 계산에서는 사용을 최소화하고, 예를 들면 pow, sin, cos 등을 픽셀 쉐이더에서의 사용을 최소화합니다.
프라그먼트(Fragment) 당 텍스처를 보다 적어지도록 합니다.
=======================
=======================
=======================
출처: https://unityindepth.tistory.com/30
"14일만에 0에서 60프레임 만들기"
Unity3D를 사용하여 우리의 게임을 최적화시키면서 배웠던 것들
부드러운 게임 플레이는 매끄러운 프레임 레이트를 기반으로하는데, 아이폰과 아이패드를 대상으로 60프레임에 이르게하는 것은 우리의 다가오는 액션 게임, Shadow Blade의 중요한 목표였다. (http://shadowblade.deadmage.com)
다음은 우리가 고려해야 했던 것과 성능을 개선시키기위한 게임 내의 변화, 그리고 집중적인 최적화 기간 동안 목표 프레임에 도달하게하는 것들에 대한 요약이다.
기본적인 게임 기능이 잘 작동되고 난 후, 목표로 설정한 게임 성능을 만족시켜야 했다. 우리의 주요 성능 측정 툴은 내장 유니티 프로파일러와 Xcode 프로파일링 툴이였다. 유니티 프로파일러를 사용하여 장치에 실행중인 코드를 프로파일하는 것은 매우 유용한 특징이라는 것을 증명했다.
여기 우리의 요약과, 집중적인 측정, 수정, 재측정에 대해서 배운 것들이 있고, 그 결과 우리의 목표 장비에 고정된 60프레임을 만들 수 있었다.
1 – 가비지 컬렉터라고 불리는 흉포한 괴물과 직접 맞서라.
C/C++ 게임 프로그래밍 배경에 비롯하여, 우리는 가비지 컬렉터의 특정한 행동을 사용하지 않았다. 사용하지 않는 메모리를 당신 대신에 자동으로 깨끗이 하는 것은 일단 매우 멋진 일이지만, 곧 실제로 효과가 서서히 나타나기 시작하고, 쓰지 않는 메모리를 모으는 가비지 컬렉터에 의해 당신은 CPU Load를 보여주는 프로파일러에서 정기적인 급등을 목격할 것이다. 이는 특별히 모바일 장비에서 거대한 이슈로 드러났다. 메모리 할당과 이를 제거하는 것은 최우선순위가 되었고, 여기에 우리가 취했던 몇가지 주요 행동들이 있다:
코드에서 문자열 병합을 제거하라. 이는 가비지 컬렉터가 수거할 수 있는 많은 쓰레기를 남긴다.
foreach 반목문을 간단한 "for" 반복문으로 교체해라. "foreach" 반복문에서 한번 돌 때마다 24Byte의 쓰레기 메모리를 생성한다. 10번을 반복하는 간단한 반복문은 납득할 수 없는 GC가 수거 가능한 240byte의 메모리를 남긴다.
게임 오브젝트의 태그를 비교하는 방법을 교체해라. if(go.tag == "Enemy")를 사용하는 대신에, 우리는 if(go.CompareTag("Enemy")를 사용했다. 객체에 tag 프로퍼티를 호출하는 것은 추가적인 메모리를 할당하고 복사하며, 이 같은 비교문이 내부 반복문에 있다면 정말 나쁘게 작용한다.
오브젝트 풀은 훌륭하며, 우리는 게임이 실행되는 동안에, 레벨을 진행하고 있을 때, 어떤 것도 동적으로 할당하지 않기 위해서 동적 게임 오브젝트를 위한 풀을 만들고 사용 했다.
LINQ 명령어를 사용하지 않았다. 그들은 중간 버퍼를 할당하는 경향이 있는데, 이는 가비지 컬렉터의 음식이다.
2 – High-Level 스크립트와 네이티브 엔진 C++코드간의 커뮤니케이션 오버헤드에 신경써라.
유니티3D를 사용하여 작성된 모든 게임플레이 코드는, 우리의 경우 Mono runtime을 사용하여 처리되는 C#으로된 스크립트 코드였다. 엔진 데이터와 커뮤니케이션하기 위한 모든 요구사항은 High-Level 스크립트 언어가 네이티브 엔진 코드를 호출하는 것이다. 물론 이 자체로도 오버헤드를 가지고 있고, 게임코드에서 이 같은 호출을 줄이는 것은 두번째 우선순위였다.
씬을 돌아다니는 움직이는 객체는 스크립트 코드가 엔진 코드를 호출하도록 요구하는데, 우리는 게임플레이 코드에서 한 프레임 동안 객체의 변형 요구사항을 캐싱했고, 호출 오버헤드를 줄이기 위해 이 요구사항을 엔진에 딱 한번 보냈다. 우리는 객체의 움직임과 회전이 필요한 곳 외에 다른 유사한 곳에서도 이 패턴을 사용하였다.
지역적으로, 컴포넌트의 참조를 캐싱하는 것은, 매번 게임 오브젝트의 "GetComponent"를 사용하여 컴포넌트 참조를 가져오는 것을 제거할 수 있다. 이는 위에서 봤던 네이티브 엔진 코드 사용을 줄일 수 있는 또 다른 예이다.
3 – 물리학, 물리학, 물리학 그 이상.
물리 시뮬레이션 시간간격을 가능한 한 최소한으로 설정해라. 우리의 경우 16밀리세컨트 이하로 설정하지 않았다.
캐릭터 컨트롤러의 Move 명령어를 호출하는 것을 줄여라. 캐릭터 컨트롤러를 움직이는 것은 동시에 발생하며, 매 호출마다 상당한 성능 비용을 불러올 수 있다. 우리가 한 것은 매 프레임마다 움직임 요구 사항을 캐시하였고 이를 그들에게 딱 한번 적용했다.
"ControllerColliderHit" 콜백에 의존하지 않게 코드를 수정하라. 이들의 콜백은 매우 빠르게 처리되지 않는다는 것으로 드러났다.
좋지 않는 장비들을 위해 천 물리를 스킨드 메쉬로 교체하라. 천 파라미터는 성능에 있어서 중요한 역할을 하고, 미학적인 부분과 성능사이의 적절한 균형을 찾기 위해 많은 시간을 지불한다.
레그돌은 물리 시뮬레이션 루프의 영역이 아니기 때문에 활성화 하지 않았으며, 꼭 필요할 때만 활성화 시켰다.
트리거의 "OnInside"콜백은 신중하게 평가되어야한다. 그리고 우리의 경우, 가능한 이것을 사용하지 않고 로직을 짜기위해 노력했다.
태그 대신에 레이어! 레이어와 태그는 객체에 손쉽게 할당될 수 있고, 특정 객체를 질의하는데 사용될 수 있다. 그러나 충돌 로직에 관해서, 레이어는 적어도 성능에 있어서 확실한 장점을 가진다. 더 빠른 물리 계산과 덜 요구되는 새로운 할당 메모리가 근본적인 이유이다.
메쉬 콜라이더는 절대 해서는 안된다.
레이캐스트와 구 확인(sphere check)같은 충돌 감지 요구 사항을 최소화 하라. 그리고 각각의 확인(Check)로부터 많은 정보를 얻으려고 해라.
4 – AI 코드를 더 빠르게 만들자!
우리는 메인 닌자 영웅을 저지하고, 그와 싸우는 적에 대한 인공지능을 사용한다. 다음의 주제는 AI 성능 이슈에 관해서 다뤄져야 한다.
A lot of physical queries are generated from AI logic like visibility checks. The AI update loop could be set to something much lower than the graphics update loop to reduce CPU load. 시야 확인같이, AI 로직으로 부터 많은 물리적인 질의들이 생성된다. CPU Load를 줄이기위해서 AI 업데이트 루프는 그래픽 업데이트 루프보다 훨씬 더 낮게 설정할 수 있다.(?)
5 – 최고의 성능은 전혀 코드로부터 달성되지 않는다!
아무것도 발생하지 않을 때, 성능은 좋다. 이것은 우리가 지금 필요하지 않는 것에 벗어나게하는 기본적인 철학이었다. 우리의 게임은 횡스크롤 액션게임이고, 그래서 많은 동적 객체들은 씬에서 보이지 않을 때 꺼질 수 있다.
세부 계획된 커스텀 레벨을 사용하여, 멀어질 때 적 AI는 꺼진다.
움직이는 플래폼과 위험요소 그리고 그들의 물리적인 충돌체는 멀어졌을 때 꺼진다.
유니티에 내장된 "animation culling" 시스템은 랜더되지 않는 객체의 애니메이션을 끄는데 사용된다.
동일한 비활성화 메커니즘은 모든 단계의 파티클 시스템에 사용된다.
6 – 콜백! 빈 콜백은 어때?
유니티 콜백은 되도록 많이 감소되어야 했다. 심지어 텅 빈 콜백조차 성능에 영향을 줬다. 빈 콜백을 가져야 할 이유는 없다. 하지만 단지 많은 코드 재작성과 리팩토링을 하면서 코드에 빈 콜백들을 남겨두는 경우가 있다.
7 – 도움에 강력한 아티스트.
아티스트들은 언제나 좀 더 프레임 레이트를 올리기 위해 머리를 쥐어짜는 프로그래머를 매혹적으로 도와줄 수 있다.
유니티에서 게임 오브젝트에 대해 머티리얼을 공유하는 것과 그들을 정적(static)으로 만드는 것은 그들이 함께 배치되도록 하고, 그 결과 감소된 드로우 콜은 모바일 성능에 매우 중요하다.
텍스쳐 아틀라스는 특별히 UI 요소에 대해 많은 도움을 줬다.
적절한 압축을 한 정사각형(2의 제곱승)은 필수였다.
횡 스크롤은 우리 아티스트가 모든 먼 배경 메쉬를 제거할 수 있게 했고, 대신에 그들을 간단한 2D 평면으로 변환했다.
라이트 맵은 매우 소중하다.
우리의 아티스트는 여러 경로사이의 추가적인 정점을 제거했다.
적절한 텍스처 밉 레벨은 다른 해상도를 가진 장비에서 좋은 프레임 레이트를 가지는데 좋은 선택이었다.
매쉬를 합치는 것은 아티스트가 할 수 있는 또 다른 성능 개선 방법이다.
우리의 애니메이터들은 가능한 한 각 캐릭터 사이에 애니메이션을 공유할 수 있도록 노력했다.
파티클에 대한 많은 반복은 미적인 부분과 성능적인 부분의 균형을 찾는 것이 필요했다. emitter의 수를 줄이는 것과 투명도 요구사항을 줄이는 것은 주된 도전중 하나였다.
8 – 이제, 메모리 사용은 감소 되어야 한다!
많은 메모리를 사용하는 것은 성능에 부정적인 영향을 준다. 우리의 경우에, 메모리 초과로 인해 아이팟에서 많은 충돌을 경험했는데, 이는 매우 중요한 문제 였다. 우리의 게임에서 가장 큰 메모리 고객은 바로 텍스쳐였다.
다른 텍스처 사이즈는 각 장비에 사용되어졌는데, 특별히 UI에 사용된 텍스처와 큰 배경이 바로 그것이었다. Shadow Blade는 유니버셜 빌드를 사용하지만, 시작하는 순간에 장비 사이즈와 해상도가 감지될 때, 각 애셋들은 로드 된다.
우리는 사용하지 않는 애셋은 메모리에 올라가지 않도록 해야 했다. 우리는 프로젝트에서, 오직 프리팹 인스턴스에 의해 참조되는 애셋과, 절대 인스턴스되지 않는 애셋들이 완전하게 메모리에 로드되었는지를 확인해야만 했다.
메쉬로부터 여분의 폴리곤을 제거하는 것은 도움이 되었다.
우리는 몇몇 애셋의 수명관리를 다시 해야했다. 예를 들어, 메인 메뉴 애셋, 마지막 레벨 에셋, 게임 음악에대한 로드/언로드 시간을 수정해야 했다.
각 레벨마다 그들의 동적 객체 요구사항에 잘들어맞고, 가장 적은 메모리 사용에 최적화된, 특별한 오브젝트 풀을 가져야 했다. 오브젝트 풀은 유연하고, 개발기간 동안 많은 객체들을 담을 수 있다. 그러나 게임 오브젝트 요구사항이 알려졌을 때, 그들은 구체적이어야 한다.
메모리에 압축된 사운드 파일을 유지하는 것이 필요했다.
게임 성능 향상은 길고 도전적인 여행이며, 우리는 이 여행의 작은 부분을 경험하는 즐거운 시간을 가졌다. 게임 개발 커뮤니티에 의해 공우된 방대한 지식과 유니티에서 제공되는 매우 훌륭한 프로파일링 툴은 shaodw Blade의 목표 성능에 도달을 하게 해주었다.
- Magnitude 보다 sqrMagnitude를 사용하여 비교해서 쓴다. (제곱근 계산 X)
-> Unity 공식 문서에도 써져있다.
--> If you only need to compare magnitudes of some vectors, you can compare squared magnitudes of them using sqrMagnitude (computing squared magnitudes is faster).
- 삼각함수의 값은 상수로 저장하고 사용하는게 좋다.
- 문자열은 readonly 혹은 const 키워드를 사용하여, 가비지 컬렉션으로부터 벗어나도록 한다.
3. 가비지 컬렉터
- 우리가 쓰고있는 MonoBehavior는 메모리 관리에 GC가 자동호출되도록 설계되어 있는데, 이 GC가 프로그래머들한테는 좋을 수도 있고, 안좋을 수도 있다. GC가 실행되는 동안 유저들은 게임에서 갑자기 렉이 걸리며, 그렇지 않기위해 우리는 게임을 GC를 피해 만들어야 한다. (필자한테는 상당히 거리낌이 있다.) 이제 이 GC와 친하게 지내기위해 우리도 몇가지 방법을 써서 길들여야하는데, 그 방법에 대해 서술한다.
- 무엇이든 동적 생성 및 해제는 부하가 굉장히 큰 작업이다. 그래서 위에 언급했다시피 오브젝트 풀 기법을 사용하여 메모리를 관리하도록 하자.
- 오브젝트가 해제되면 다음과정으로는 GC가 동작되서 렉이 걸릴수 밖에 없다. 즉 오브젝트를 만들어 둔 후 활성화 또는 비 활성화를 이용하여 사용하도록 하자.
- 문자열 병합은 StringBuilder의 Append를 사용하면 된다. 왜냐하면 string + string은 임시 문자열을 뱉기 때문에 가비지 컬렉션이 일어나는 환경을 제공한다.
- foreach 대신에 for를 이용하도록 한다. Foreach는 한번 돌리면 24byte의 쓰레기 메모리를 생성시키며 수많이 돌면 더 많은 메모리를 생성시키므로 for을 이용하도록 한다.
- 태그 비교에서는 CompareTag() 를 사용하도록 한다.
객체의 tag 프로퍼티를 호출하는 것은 추가 메모리를 할당하며 복사를 하게된다.
- 모든 비교문에서 .equals()를 사용하도록 하자. == 구문으로 사용하면 임시적인 메모리가 나오게 되며 가비지 컬렉션의 먹이를 준다.
- 데이터 타입은 Class 대신 Struct 를 사용하여 만들어 주면 메모리 관리가 된다. 구조체는 메모리 관리를 Stack에서 하므로 GC에 들어가지 않는다.
using System; using System.Diagnostics; public class DebugX { [Conditional("UnityEditor")] public static void Log(string msg) { Debug.Log(msg); } } // PlayerSettings > Scripting Define Symbols 에 ACTIVE_DEBUG 가 없다면 아래 코드 호출은 아예 처음부터 없었던 것으로 처리됩니다. DebugX.Log( "Hello world" );
클래스 내부에 Conditional 속성이 지정된 static void 함수를 추가합니다.
만약 Conditional 에 따라오는 심볼이 정의됬다면 static 함수는 존재합니다.
중요한것은 static 함수 뿐만이 아니라, 그것을 호출하는 부분 까지 모조리 빌드에서 빠져나가므로 매우 간편합니다.
조건 속성으로 묶인 디버그 함수를 사용한 코드들은 빌드시에 처음부터 존재하지도 않은 것이 됩니다.
다만 유니티 콘솔창에서 로그를 더블 클릭하면, 오류가 난 지점이 아닌 디버그를 랩핑한 코드로 이동하는 사소한 불편은 있습니다.
오디오 (사운드)
오디오 기본 설정
Force To Mono 사용
모바일에서 스트레오는 큰 의미를 가지지 않습니다. Force To Mono 를 사용합시다.
Preload Audio Data
Preload Audio Data는 기본 옵션입니다. 미리 오디오 데이터를 로드하므로, 씬 로드에 조금 부담을 줍니다.
이것을 사용안하면, 오디오를 재생하는 순간에 오디오를 로드 합니다. 그러면 게임 도중에 약간의 오버헤드가 생길 수 있습니다.
Load in Background
엄격하게 재생 타이밍을 맞춰야 하는 경우가 아니라면 체크해도 됩니다.
엄격하게 로드 타이밍을 지키지 않고, 느긋하게 백그라운드에서 로드 합니다.
씬이 시작되자 마자 재생을 시도할때, 조금의 지연시간이 지난 다음에야 재생되게 됩니다. 그래도 로딩 속도를 적게나마 향상시킬 수 있습니다.
오디오 매니저 (프로젝트 세팅에 있음)
스트레오 사운드가 필요없으면 오디오 매니저에서 스피커 모드를 Mono나 Raw로 합시다.
로드 타입
메모리 많이 먹고 빠릿함 vs 메모리 적게 먹고 오버헤드
Decompress On Load
미리 압축을 해제해서 메모리에 적재하기에, 플레이 하는 순간에 오버헤드가 생기지 않습니다.
적은 용량의 효과음에 사용합시다. 압축을 미리 메모리에 풀기 때문에 메모리를 많이 먹기 때문입니다.
Compress On Memory
메모리에 로드할때는 압축되어 있다가 재생시 압축을 해제합니다.
플레이하는 순간에 압축을 푸는 과정이 생기기에, 오버헤드가 생길 수 있습니다. 메모리에 그대로 적재하기는 힘든 큰 용량의 배경 음악에 사용합시다.
오디오 압축 포맷 (Compression Format)
오디오 압축은 기본적으로 아래의 사항에서 적절한 중간 지점을 선택하는 과정입니다.
높은 품질 + 많은 메모리 사용 + 적은 오버헤드 vs 낮은 품질 + 적은 메모리 사용 + 많은 오버헤드
얻는게 있으면 잃는게 있는법이죠.
압축률이 낮을수록 품질도 높고 오버헤드도 적으나, 빌드 용량과 메모리를 많이 먹습니다.
압축률이 높으면 빌드 용량과 메모리를 적게 먹으나, 압축을 푸는 과정에서 재생이 지연될 수 있습니다.
중요: 유니티에 임포트하기전에 미리 손실 압축을 거는 것은 의미 없습니다!
PCM
품질이 제일 높습니다. 무압축 입니다.
압축을 푸는 과정이 없어서 오버헤드가 없고, 재생이 지연 되지도 않습니다.
빌드 용량과 메모리를 제일 많이 차지합니다.
즉시 재생해야 하는 매우 짧은 효과음에 씁시다.
ADPCM
PCM 과 Vorbis/MP3 중간의 퀄리티와 압축률을 가집니다.
PCM 과 비교해서: 높은 압축률, 낮은 품질, 높은 오버헤드
Vorbis/Mp3 와 비교해서: 낮은 압축률, 높은 품질, 낮은 오버헤드
어디까지나 사실상 무압축인 PCM 보다 용량이 낮고, 품질이 나쁘다는 얘기입니다. 일반적인 손실 압축에 비해 품질 유지가 뛰어나고 CPU 오버헤드도 크지 않죠.
PCM 보다는 지연과 오버헤드가 존재하지만, Vorbis/MP3 와 비교할시 지연과 오버헤드 없이 즉시 재생됩니다.
총격 소리와 같이 무압축에 가까운 품질 까지는 필요없지만, 지연시간 없이 자주 반복 재생 되야 하는 경우 적절합니다.
Vorbis/MP3
가장 높은 압축률을 가집니다.
당연히 품질이 제일 안좋습니다. 하지만 용량을 제일 덜 먹어요.
로드 혹은 재생시 압축을 풀기 때문에 지연 재생될 수 있습니다.
무압축으로 할시 용량을 감당할수 없고, 지연 재생 되어도 무방한 일반적인 배경음에 씁시다.
2D 게임 텍스쳐 관리하기
중요! TinyPNG 같은거 쓰지마세요. 유니티가 알아서 손실/무손실 압축합니다.
임포트 하기전에 손실 압축 하는 것은 의미가 없어요.
이미지(텍스쳐) 설정
Generate Mil Maps 해제
카메라와의 거리를 실시간으로 조정하는 게임이 아닌 이상 필요 없습니다.
필터링
도트형 레트로 스타일의 게임에 필터를 사용하면 안됩니다!
도트형 게임은 필터를 적용하지 않는 Point 로 적용 합시다. 외곽선을 부드럽게 꺽기 때문에 비주얼상 더 난잡해 보일 수 있어요. 이외에는 무난하게 Linear 면 적당.
아틀라스 aka 스프라이트 팩킹
반드시 사용해야 하는 이유
이미지는 2의 배수의 정사각형으로 메모리에 적재됩니다. 하나의 이미지에 대해서 많은 여백이 남게되죠. 이 여백을 낭비하지 말고 다른 이미지로 채워서 메모리를 아낍니다.
자주 사용되는 이미지 끼리 하나의 파일로 뭉쳐 한번에 호출하면, 호출을 개별로 여러번 할 필요가 없어서 성능이 절약됩니다.
결론: 메모리와 성능이 절약됩니다.
사용방법
Packing Tag 를 팩킹할 이미지 끼리 같은 이름으로 지정해주면 유니티가 알아서 팩킹해줍니다.