yuchi's Development Home


nVIdia 케플러 GK104의 CUDA성능은?

조회 수 2964 추천 수 0 2012.03.17 12:35:38
techpowerup.com 에 GK104의 다이어그램이 올라왔는데요.
약간 실망한 부분도 있고 해서 다이어그램에 대해서 제 생각을 좀 적어봤습니다.

GK104(케플러)의 다이어그램(이미지 출처 http://www.techpower.com )
180e.jpg 180d.jpg


GF110(페르미)의 다이어그램
GF110.jpg

우선 techpowerup.com에 올라온 기사에 오자가 있는것 같습니다.
SM이 16개로 나와있습니다. sm은 다이어그램상으로도 8개이고 8*192= 1536인데요. 16*192 = 3072니까 sm 개수는 8개가 맞는것 같습니다.

다이어그램으로 보면 그냥 딱 게임에 맞췄다고 보는것이 맞을것 같습니다. GPGPU는 아마도 페르미 아키텍쳐와 비슷한 수준일걸로 추측합니다. SM개수가 GTX580의 16개의 절반밖에 안됩니다. 
GPGPU에선 각각 독립적으로 실행 가능한 유닛은 SM단위로 움직이거든요. 다만 SM2.1모델부터 SM한개당 여러개의 워프를 실행할 수 있도록 수정되었기 때문에 성능이 생각보다는 잘 나올수도 있다고 봅니다. SM의 워프스케쥴러가 4개인게 약간 특이한 점인데 SM2.0(페르미)에서 SM당 실제로 작동하는 워프가 1개였던것에 반해 SM당 워프를 4개 동시에 작동할 수 있다는 것으로 보여집니다. 
수치상으로는 CUDA성능도 2배 정도가 가능할지도 모른다는 얘기네요.
그런데 또 SM당 붙어있는 64KB캐쉬가 문제입니다. 64KB캐쉬는 16KB의 L1캐쉬와 48KB의 Shared Memory로 사용하게 되는데 SM당 캐쉬사이즈가 이전과 똑같기 때문에 SM 개수가 절반으로 줄었다는 것은 총 캐쉬사이즈가 GTX580에 비해 절반으로 줄은것과 같습니다. 

SM당 작동하는 워프수를 따져보면
GTX580-SM당 워프 1개 * 16 = 16개 < GTX680- SM당 워프4 * 8 = 32개

SM의 총 캐쉬 사이즈
GTX580 - 1024KB > GTX680 - 512KB

CUDA성능은 기존과 비슷하거나 1.5배정도 향상되지 않을까 추측해봅니다.

다소 실망. 그냥 케플러 무리해서 사느니 GTX580 중고를 사는게 낫지 않을까 싶군요.


댓글 '2'

엠군

2012.03.29 10:16:27
*.110.172.248

ㅇㅇ어제 잘 들었어요.

들은내용좀 정리하려고 구글링하다 보니 여기까지 오게 됬네요 ^^a.

어려움.ㅜㅜ.

여치

2012.03.29 10:28:05
*.168.0.1

안녕하세요. KASA스터디 나오시는 분이군요. 홈피 따라가보고 페북까지 가보고서야 알았습니다.

반갑습니다^^ 페북 친구신청했습니다. 

파일 첨부

여기에 파일을 끌어 놓거나 파일 첨부 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
List of Articles
번호 제목 글쓴이 날짜sort 조회 수
» nVIdia 케플러 GK104의 CUDA성능은? file [2] 여치 2012-03-17 2964
40 NVIDIA Parallel Nsight 2.2 RC1 릴리즈 file [2] 여치 2012-04-12 3219
39 NDC 2012 발표자료 - GPGPU(CUDA)를 이용한 MMOG 캐릭터 충돌처리 file 여치 2012-04-25 3042
38 Parallel NSight 로 CUDA디버깅시 PC가 멎을 경우 여치 2012-05-17 2414
37 Radiosity Baking 작업중 file 여치 2012-05-28 5541
36 crt힙 메시지 출력에서 xxx.cpp대신 #File error#가 뜰때 여치 2012-05-29 5080
35 KD트리와 RAY충돌처리 코드 다시 만드는중 file 여치 2012-06-02 4266
34 CUDA로 구현하는 Radiosity - KD-Tree를 이용한 Ray충돌처리 [2] 여치 2012-06-09 5157
33 vs2010공백 및 탭 표시 핫키 file 여치 2012-08-08 8868
32 iOS엔진 프로젝트 file 여치 2012-09-15 7515
31 xcode 4.5로 업데이트 후 빌드한 바이너리 오작동 여치 2012-09-21 4234
30 hlsl ddx,ddy 여치 2012-10-12 6692
29 iOS엔진프로젝트 file 여치 2012-10-23 6285
28 Windows Phone 8 SDK 설치 및 간단 테스트 file 여치 2012-11-04 3927
27 요새 작업중인 복셀 관련... file 여치 2012-11-17 4721
26 Windows Store App에서 D3DCompile계열함수 사용 여치 2012-12-23 3607
25 windows 8에서 dxsdk 설치시 s1023에러를 뱉으며 실패할 때 여치 2013-01-12 5600
24 Create .lib file from .dll file 여치 2013-02-02 3767
23 Visual Studio 2012 Compiling Native for ARM 여치 2013-02-02 7576
22 jailbreaking된 Surface RT에 win32 D3D9엔진을 포팅해 보았다. 여치 2013-02-10 10678
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet