yuchi's Development Home


nVIdia 케플러 GK104의 CUDA성능은?

조회 수 2598 추천 수 0 2012.03.17 12:35:38
techpowerup.com 에 GK104의 다이어그램이 올라왔는데요.
약간 실망한 부분도 있고 해서 다이어그램에 대해서 제 생각을 좀 적어봤습니다.

GK104(케플러)의 다이어그램(이미지 출처 http://www.techpower.com )
180e.jpg 180d.jpg


GF110(페르미)의 다이어그램
GF110.jpg

우선 techpowerup.com에 올라온 기사에 오자가 있는것 같습니다.
SM이 16개로 나와있습니다. sm은 다이어그램상으로도 8개이고 8*192= 1536인데요. 16*192 = 3072니까 sm 개수는 8개가 맞는것 같습니다.

다이어그램으로 보면 그냥 딱 게임에 맞췄다고 보는것이 맞을것 같습니다. GPGPU는 아마도 페르미 아키텍쳐와 비슷한 수준일걸로 추측합니다. SM개수가 GTX580의 16개의 절반밖에 안됩니다. 
GPGPU에선 각각 독립적으로 실행 가능한 유닛은 SM단위로 움직이거든요. 다만 SM2.1모델부터 SM한개당 여러개의 워프를 실행할 수 있도록 수정되었기 때문에 성능이 생각보다는 잘 나올수도 있다고 봅니다. SM의 워프스케쥴러가 4개인게 약간 특이한 점인데 SM2.0(페르미)에서 SM당 실제로 작동하는 워프가 1개였던것에 반해 SM당 워프를 4개 동시에 작동할 수 있다는 것으로 보여집니다. 
수치상으로는 CUDA성능도 2배 정도가 가능할지도 모른다는 얘기네요.
그런데 또 SM당 붙어있는 64KB캐쉬가 문제입니다. 64KB캐쉬는 16KB의 L1캐쉬와 48KB의 Shared Memory로 사용하게 되는데 SM당 캐쉬사이즈가 이전과 똑같기 때문에 SM 개수가 절반으로 줄었다는 것은 총 캐쉬사이즈가 GTX580에 비해 절반으로 줄은것과 같습니다. 

SM당 작동하는 워프수를 따져보면
GTX580-SM당 워프 1개 * 16 = 16개 < GTX680- SM당 워프4 * 8 = 32개

SM의 총 캐쉬 사이즈
GTX580 - 1024KB > GTX680 - 512KB

CUDA성능은 기존과 비슷하거나 1.5배정도 향상되지 않을까 추측해봅니다.

다소 실망. 그냥 케플러 무리해서 사느니 GTX580 중고를 사는게 낫지 않을까 싶군요.


댓글 '2'

엠군

2012.03.29 10:16:27
*.110.172.248

ㅇㅇ어제 잘 들었어요.

들은내용좀 정리하려고 구글링하다 보니 여기까지 오게 됬네요 ^^a.

어려움.ㅜㅜ.

여치

2012.03.29 10:28:05
*.168.0.1

안녕하세요. KASA스터디 나오시는 분이군요. 홈피 따라가보고 페북까지 가보고서야 알았습니다.

반갑습니다^^ 페북 친구신청했습니다. 

파일 첨부

여기에 파일을 끌어 놓거나 파일 첨부 버튼을 클릭하세요.

파일 크기 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )
List of Articles
번호 제목 글쓴이 날짜 조회 수sort
161 유져모드 메모리 페이징 구현 여치 2007-09-23 3144
160 새로 만든 서버용 네트웍 컴포넌트 I4DyuchiNET2.0 file [2] 여치 2007-04-01 3154
159 간단한 눈 처리 file [4] 여치 2010-02-21 3180
158 3D엔진 및 네트웍 솔루션 x64 포팅 프로젝트 대충 완료 file [4] 여치 2007-05-05 3189
157 사내 스트레스 테스트 file [16] 여치 2009-04-12 3198
156 TFS Backup Plan 삭제 방법 여치 2011-11-07 3216
155 nVidia Visual Profiler 4.1로 돌린 결과 file 여치 2012-02-21 3222
154 요새 관심사는... [2] 여치 2006-01-10 3238
153 CUDA로 구현한 충돌처리 [5] 여치 2012-01-16 3252
152 주말동안 작업내용 [1] 여치 2008-01-28 3264
151 엔진 64비트 포팅 프로젝트 진척상황 여치 2007-05-01 3266
150 6core Xeon*2 + GTS250 CDUA 라이트맵 렌더링 file 여치 2010-06-15 3278
149 64비트 릴리즈 모드 테스트 여치 2007-07-19 3280
148 라이트맵 엣지 블랜딩 관련 file 여치 2011-11-28 3316
147 계속 개선중인 라이트맵 file 여치 2007-07-24 3341
146 주말동안 작업 내용-라이트맵 관련 file [3] 여치 2008-02-04 3350
145 Depth of Field 구현중 file 여치 2010-11-24 3351
144 프레임 자랑질. file [2] 여치 2010-04-03 3352
143 CUDA 첫 프로그램. 시작은 미약하지만.. file [2] 여치 2010-04-12 3354
142 64비트로 gogo file 여치 2007-03-27 3357
天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet



XE Login

天安門大屠殺 六四天安門事件 反右派鬥爭 大躍進政策 文化大革命 六四天安門事件 The Tiananmen Square protests of 1989 天安門大屠殺 The Tiananmen Square Massacre 反右派鬥爭 The Anti-Rightist Struggle 大躍進政策 The Great Leap Forward 文化大革命 The Great Proletarian Cultural Revolution 人權 Human Rights 民運 Democratization 自由 Freedom 獨立 Independence 多黨制 Multi-party system 民主 言論 思想 反共 反革命 抗議 運動 騷亂 暴亂 騷擾 擾亂 抗暴 平反 維權 示威游行 法輪功 Falun Dafa 李洪志 法輪大法 大法弟子 強制斷種 強制堕胎 民族淨化 人體實驗 胡耀邦 趙紫陽 魏京生 王丹 還政於民 和平演變 激流中國 北京之春 大紀元時報 九評論共産黨 獨裁 專制 壓制 統一 監視 鎮壓 迫害 侵略 掠奪 破壞 拷問 屠殺 肅清 活摘器官 障テ社會 誘拐 買賣人口 遊進 走私 毒品 賣淫 春畫 賭博 六合彩 台灣 臺灣 Taiwan Formosa 中華民國 Republic of China 西藏 土伯特 唐古特 Tibet 達償ワ喇嘛 Dalai Lama 新疆維吾爾自治區 The Xinjiang Uyghur Autonomous Region free tibet