이놈의 충돌처리가 단순 연산만으로 작동하는게 아니고 케이스 바이 케이스로 처리할게 많아서 분기가 많다. 그러다보니 병렬화가 어렵다. 나름 죽도록 병렬화 했다고 생각하는데 실제 코드의 50%정도밖에 병렬화가 안되는것 같다.
코드 최적화는 할만큼 한거 같고 나머지는 GPU스펙에 달린듯.
이하는 NV Visual Profiler로 돌린 화면.
컴퓨팅 활용도 72.4%면 할만큼 했다고 생각한다. 매트릭스 연산이나 영상처리가 아닌지라 더 이상은 무리.
여기에 파일을 끌어 놓거나 파일 첨부 버튼을 클릭하세요.
파일 크기 제한 : 0MB (허용 확장자 : *.*)
파일 업로드 중... (0%)
유져모드 메모리 페이징 구현
CUDA충돌처리 응용#2
가칭 프로젝트 E(엡실론) 알파 테스트 간단 후기 [9]
해킨토시 설치 성공 [2]
DoF 결론 [2]
2차 사내 스트레스 테스트 후기 [2]
새로 구입한 책 Programmin Massively Parallel Processors [2]
CUDA로 계산하는 라이트맵
비러머글 맥스8 플러그인 위저드 설정 요령
라이트맵 계산 코드 최적화
64비트 포팅 프로젝트 진척상황
Project ε(프로젝트 엡실론) 2차 알파 동영상
프로젝트 엡실론 3차 알파 테스트 프리뷰 영상
nVidia Parallel NSight 소개
NVIDIA Parallel Nsight 2.2 RC1 릴리즈 [2]
프로젝트 E(엡실론) 알파테스트 동영상 [4]
맥스플러그인 64비트 포팅 프로젝트 [5]
dx11 텍스쳐링
회사 관두고 나서 알게 된 버그 하나
CUDA 충돌처리 응용
로그인 유지