yuchi's Development Home
몇 주전 kasa세미나에서 스크린스페이스에서의 Ambient Occlusion처리 방법에 대한 세미나를 들었다.
사실 난 Ambient Occlusion이 뭔지 몰랐다. 전혀 관심이 없었으니까.
발표자 분이 너무나 쉽게 설명을 잘 해주셔서 개념을 쉽게 이해할 수 있었다.
설명을 듣고나니 스크린스페이스에서 적용할 경우 당장이라도 지금 엔진에 적용할 수 있을것 같았다.
그런데 내 엔진의 경우는 라이트맵을 베이스로 사용하기 때문에 일단 라이트맵 구울때 Ambient Occlusion을 처리하면 리얼타임에서의 처리 비용은 0 이면서도 퀄리티를 높일 수 있다.
스크린스페이스에서의 처리는 나중에라도 할 수 있다.
미리 계산해두는거라면 허불나게 많은 라이트맵 텍셀별로 근처의 삼각형 검출 및 충돌처리를 해야하기 때문에 계산 부하가 무지 크다. 따라서 멀티스레드 프로그래밍과 cuda의 적용이 요구되는데 이는 나름 내 장기이기도 하고 내가 재밌어 하는 분야이기도 하다.
Ambient Occlusion을 계산하는데 병렬프로그래밍을 적용한다면 CPU와 GPU가 모두 100%치는걸 볼 수 있는것이다.
나한텐 확실히 이쪽이 더 재밌다.
그래서 월드 스페이스에서 미리 계산하는걸로 가닥을 잡았다.
대략 처리 수순은 다음과 같다.
1. 툴에서 라이트맵 계산 모드가 되면 어차피 텍셀별로 3차원 공간에 맵핑되는 라이트맵 patch를 가지고 있다.
2. 씬의 삼각형들을 BSP트리에 다 때려넣고 patch에 인접한 삼각형들을 골라냈다.
3. 대략 50cm정도 반경의 헤미스피어에 속하는 점들을 샘플링했다. 현대는 16개의 점을 샘플링했다.
4. patch의 위치로부터 헤미스피어의 샘플링 점까지의 ray들을 만들어서 주변 삼각형에 대해서 교차 테스트를한다.
5. 1 - (충돌회수 / 테스트 회수) 의 상수를 얻어냈다.
6. 24비트 라이트맵을 32비트로 확장하고 알파성분에 Ambient Occlusion계산값을 넣는다.
7. 이걸 보조적인 명암으로 사용.
이런저런 삽질 끝에 대충 결과는 얻었다. 이걸로 실제 적용가능하다는 확신은 섰다.
현재는 멀티스레딩도 cuda도 적용되어있지 않으므로 실제 게임에서 쓰일만한 넓직하고 복잡한 맵이라면 계산하는데 2박3일 걸릴지 모르겠다.
하여간 이젠 가닥을 잡았으니 병렬계산코드를 집어넣자.
윗쪽 스샷은 라이트맵만을 적용. 아래쪽 스샷은 라이트맵+ambient occlusion적용이다.
구석진 부분에선 확실히 차이가 난다.
Only Light Map
Light Map + Ambient Occlusion