yuchi's Development Home


최근 'CPU트랜스폼과 버텍스 버퍼 캐쉬'를 포기하고 GPU기반으로 코드를 싹 뜯어고쳤습니다.

당연한 얘기지만 캐쉬 히트율이 높을땐 사무실의 모든 PC에서 GPU코드보다 렌더링 속도가 빨랐습니다.

100% 캐쉬 미스시에도 'CPU트랜스폼+버텍스 버퍼 락& 업데이트'가 지포스8600GT이하에선 GPU코드보다 빨랐습니다.

9600GT에선 GPU트랜스폼이 더 빠르더군요. 락을 걸고 버퍼를 갱신하는 오버헤드를 감안할땐 트랜스폼의 자체의 속도는 그래도 CPU가 빠를것으로 추측합니다만.
(참고로 현재 저희 게임은 1920*1080,32비트 컬러 모드에서 테스트시 평균 350-450프레임 정도 나옵니다.)

하여간 퍼포먼스에서 큰 득이 없음에도 불구하고 GPU코드로 전환한 것은 앞으로의 유지보수를 위해서, 또 그래픽 카드의 발전에 맞추기 위해서입니다.

버텍스 버퍼 캐쉬 코드를 짜며 밤을 새던 시절, 혼자서 삽질해가며 SSE 명령어를 학습하던 시절을 생각하면 참으로 버리기 아까운 코드였습니다.

해서 제 홈피에 놀러오시는 분들(64비트 어셈블리와 SSE에 관심있는 분들이 있을까 의문입니다만)에게 약간의 도움이라도 될까 하여 공개합니다.

ML64.EXE로 어셈블할 수 있습니다. 비졀스튜됴에서 링크하는 방법은 이 게시판에서 FSCANF로 검색하면 찾을 수 있습니다.(vs2005이상필요)


소스코드는 .ASM 파일과 데이타 타입을 정의하는 .INC파일로 첨부합니다.

C코드 부에서 사용할 PHYSIQUE_VERTEX의 스트럭쳐 타입은 다음과 같습니다.

#pragma pack(push,4)

struct BONE_LITE
{
        DWORD                        dwBoneObjectIndex;                // 포인터를 대신하는인덱스
        float                        fWeight;
        DWORD                        dwLinearMatrixIndex;
};

struct PHYSIQUE_VERTEX
{
        VECTOR3                                v3Pos;                        // 0
        VECTOR3                                v3Normal;                // 12
        VECTOR3                                v3Tangent;                // 24
        TVERTEX                                tv;                                // 36

        BYTE                                bBonesNum;                // 44
        BYTE                                bReserved0;                // 45
        BYTE                                bReserved1;                // 46
        BYTE                                bReserved2;                // 47
        BONE_LITE*                        pBoneList;                // 48

};
#pragma pack(pop)

그럼 즐거운 프로그래밍 생활들 되시길.



댓글 '2'

jufoot

2008.09.21 08:22:20
*.207.85.52

잘 봤습니다~ :) 그런데 게임이 350~450 프레임이 나오신다니.. ㅎㄷㄷ 하네요.

yuchi

2008.09.21 12:27:16
*.176.255.2

jufoot / 9600GT카드가 꽤 좋더라구요. 캐릭터 많이 나오고 이것저것 더 띄우면 느려지겠죠.
파일 첨부

여기에 파일을 끌어 놓거나 파일 첨부 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
List of Articles
번호 제목 글쓴이 날짜 조회 수sort
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet