yuchi's Development Home


nVIdia 케플러 GK104의 CUDA성능은?

조회 수 2598 추천 수 0 2012.03.17 12:35:38
techpowerup.com 에 GK104의 다이어그램이 올라왔는데요.
약간 실망한 부분도 있고 해서 다이어그램에 대해서 제 생각을 좀 적어봤습니다.

GK104(케플러)의 다이어그램(이미지 출처 http://www.techpower.com )
180e.jpg 180d.jpg


GF110(페르미)의 다이어그램
GF110.jpg

우선 techpowerup.com에 올라온 기사에 오자가 있는것 같습니다.
SM이 16개로 나와있습니다. sm은 다이어그램상으로도 8개이고 8*192= 1536인데요. 16*192 = 3072니까 sm 개수는 8개가 맞는것 같습니다.

다이어그램으로 보면 그냥 딱 게임에 맞췄다고 보는것이 맞을것 같습니다. GPGPU는 아마도 페르미 아키텍쳐와 비슷한 수준일걸로 추측합니다. SM개수가 GTX580의 16개의 절반밖에 안됩니다. 
GPGPU에선 각각 독립적으로 실행 가능한 유닛은 SM단위로 움직이거든요. 다만 SM2.1모델부터 SM한개당 여러개의 워프를 실행할 수 있도록 수정되었기 때문에 성능이 생각보다는 잘 나올수도 있다고 봅니다. SM의 워프스케쥴러가 4개인게 약간 특이한 점인데 SM2.0(페르미)에서 SM당 실제로 작동하는 워프가 1개였던것에 반해 SM당 워프를 4개 동시에 작동할 수 있다는 것으로 보여집니다. 
수치상으로는 CUDA성능도 2배 정도가 가능할지도 모른다는 얘기네요.
그런데 또 SM당 붙어있는 64KB캐쉬가 문제입니다. 64KB캐쉬는 16KB의 L1캐쉬와 48KB의 Shared Memory로 사용하게 되는데 SM당 캐쉬사이즈가 이전과 똑같기 때문에 SM 개수가 절반으로 줄었다는 것은 총 캐쉬사이즈가 GTX580에 비해 절반으로 줄은것과 같습니다. 

SM당 작동하는 워프수를 따져보면
GTX580-SM당 워프 1개 * 16 = 16개 < GTX680- SM당 워프4 * 8 = 32개

SM의 총 캐쉬 사이즈
GTX580 - 1024KB > GTX680 - 512KB

CUDA성능은 기존과 비슷하거나 1.5배정도 향상되지 않을까 추측해봅니다.

다소 실망. 그냥 케플러 무리해서 사느니 GTX580 중고를 사는게 낫지 않을까 싶군요.


댓글 '2'

엠군

2012.03.29 10:16:27
*.110.172.248

ㅇㅇ어제 잘 들었어요.

들은내용좀 정리하려고 구글링하다 보니 여기까지 오게 됬네요 ^^a.

어려움.ㅜㅜ.

여치

2012.03.29 10:28:05
*.168.0.1

안녕하세요. KASA스터디 나오시는 분이군요. 홈피 따라가보고 페북까지 가보고서야 알았습니다.

반갑습니다^^ 페북 친구신청했습니다. 

파일 첨부

여기에 파일을 끌어 놓거나 파일 첨부 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
List of Articles
번호 제목 글쓴이 날짜 조회 수sort
21 3D MMOG Platform만들기 file [2] 여치 2012-01-01 2755
20 NDC 2012 발표자료 - GPGPU(CUDA)를 이용한 MMOG 캐릭터 충돌처리 file 여치 2012-04-25 2725
» nVIdia 케플러 GK104의 CUDA성능은? file [2] 여치 2012-03-17 2598
18 요새 하는 작업 file 여치 2011-11-21 2469
17 이번에 CUDA충돌처리 모듈을 만들면서 깨닫게 된 몇 가지들. [4] 여치 2012-02-10 2452
16 초간단 SIMD(Single Instruction Multiple Data)최적화 성능 테스트 file 여치 2014-04-10 2375
15 Parallel NSight 로 CUDA디버깅시 PC가 멎을 경우 여치 2012-05-17 2218
14 진행중인 프로젝트 Visual Studio 2010 -> Visual Studio 2013으로 이전 [2] 여치 2014-04-10 1866
13 인디게임 FEZ 개발자 필 피쉬, 최근 일본 게임에 대한 평가 - 그리고 내 생각 [2] 여치 2013-07-31 1756
12 TFS에서 Get Latest Version해도 갱신할 파일 없다고 나올 때 여치 2013-08-31 1162
11 Surface RT에서 유선랜 사용하기 여치 2013-10-26 1053
10 win8 sdk에서 ddraw.lib 위치 여치 2013-09-11 991
9 기적같은 디버깅. 컴파일러 버그? 역시나 그럴리가. [3] 여치 2014-05-14 923
8 제가 필요해서 만든 OneDrivePlayer가 윈스토어에 올라갔네요. [2] 여치 2014-08-23 876
7 Windows Phone 8로 게임포팅 중 생긴 난관 - Windows Phone 8 에서 App당 사용 가능한 최대 메모리 file 여치 2013-11-21 834
6 Windows Phone 8과 PC간 네트워크 플레이 여치 2013-11-22 814
5 현재까지 느낀 Windows Phone 8용 게임 개발에 있어서의 장애물. [2] 여치 2013-11-07 679
4 윈폰8 포팅 중단. file 여치 2013-11-19 422
3 Windows Phone 8로 게임 포팅중 #2 여치 2013-11-18 405
2 Windows Phone에 게임 포팅중. 여치 2013-11-17 359
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet