LOADING.

AMD 베가 GPU 심층분석: 500mm2가 넘는 가장 큰 FinFET 공정 기반 GPU – 2개의 HBM 스택, 8GB의 VRAM, 512GB/s의 대역폭

원문 기사 : http://wccftech.com/amd-vega-gpu-pictures-hbm2-official/

AMD Vega GPU Pictured Up Close, Biggest FinFET GPU by RTG, Over 500mm2 – Features Two HBM2 Stacks, Carry 8 GB VRAM, 512 GB/s Bandwidth – WCCFTech
2017-01-06, by Hassan Mujtaba

1
AMD는 공식적으로 자사의 베가 GPU를 CES 2017에서 대중 앞에 공개했다. 아키텍처 프리뷰와 마찬가지로, AMD는 또한 차세대 Radeon RX 500 시리즈 그래픽카드를 담당할 베가 GPU의 다이를 잠깐 볼 수 있게 해 주었다.

AMD 베가 GPU 근접 사진 – 8GB VRAM, 2개의 HBM2 스택으로부터 나오는 512GB/s 대역폭

AMD 베가 GPU는 사실 AMD 테크 서밋에서 선택된 몇몇 언론사들에게는 이미 선보여졌었다. 이 새로운 그래픽 칩은 AMD의 HBM2 표준을 활용한 첫 일반 소비자용 GPU가 될 것이다. 이는 다이 하나당 용량과 핀 하나당 클럭 스피드를 두 배로 올리도록 해 줄 것이다.

2
HBM 1세대를 사용한 그래픽 카드, 그러니까 Radeon R9 Fury X같은 제품들은 4GB의 VRAM을 탑재하고 512GB/s의 대역폭을 갖는 정도로 제한되었다. 이들은 스택당 4층의 구조를 가지고(1개의 레이어에는 256MB 용량이 실장되어 있다), 이러한 HBM 구조는 AMD가 이들 그래픽카드를 게이머들을 위해 가치를 극대화시키는 한, 최신 베가 GPU에서도 계속 사용될 것이다. 이 4-레이어 구조에서, 레이어당 밀도는 더욱 높아진 점을 확인할 수 있었다. 핀의 동작 속도 또한 HBM2로 인해 더욱 빨라졌다. 새로운 메모리는 2Gb/s까지도 속도를 낼 수 있으며 이는 HBM1의 1Gb/s보다 2배 높아진 수치이다.

이렇게 향상된 클럭 스피드는 단지 2개의 HBM2 스택만으로도 4개의 HBM1 스택과 동일한 메모리 대역폭을 가질 수 있게 해 준다. 증가한 밀도는 AMD가 큰 규모의 인터포저(Interposer)를 디자인하는 비용을 줄일 수 있도록 한다. HBM2는 HBM1에 비해 더 큰 다이 사이즈를 갖는데, HBM1이 35mm2 크기를 갖는 반면, HBM2는 92mm2의 크기를 갖는다.

현존하는 AMD의 가장 큰 FinFET GPU 심층분석 – 강력한 베가, 500mm2가 넘는 다이 면적

AMD Vega GPU is compared to other chips from NVIDIA and AMD. (Image Credits: Videocardz)
AMD 베가 GPU와 NVIDIA 및 AMD의 다른 칩들과의 비교. (이미지 출처: Videocardz)

TechReport, Computerbase4Gamer의 GPU에 대한 심층분석에서, 이 GPU는 AMD에 의해 디자인된 것들 중 가장 큰 FinFET 기반 GPU임이 밝혀졌다. VideoCardz 또한 이 거대한 칩과 다른 GPU들, 이를테면 NVIDIA의 GP100, GP102와 AMD의 피지(Fiji) GPU와 비교하였다. 이 칩은 530에서 560mm2 사이에 이르는 다이 크기를 가진 것으로 보이며, 그러므로 이는 무시무시하게 큰 칩 디자인이며 다량의 전력을 요구할 것으로 보인다.

3
4

AMD 역대 GCN 아키텍처들

베가 GPU 아키텍처에서 발전된 것들에는 어떤 것이 있는가?

5

  • 세상에서 가장 발전된 GPU 메모리 아키텍처: 베가 아키텍처는 GPU를 위한 새로운 메모리 계층 구조를 가지게 된다. 이 극단적으로 새로운 방식은 새로운 고대역폭 캐시(Cache)와 그 컨트롤러 안에 형태가 들어 있다. 이 캐시는 첨단을 달리는 HBM2 기술로 제작되었으며 이는 매초마다 테라바이트 단위의 데이터들을 전송할 수 있으며, 이전 세대 HBM 기반 제품에 비해 핀당 2배의 대역폭을 제공한다. HBM2는 또한 GDDR5 메모리의 반에도 못 미치는 면적으로 더욱 큰 용량을 제공할 수 있다. 베가 아키텍처는 매우 큰 용량의 데이터세트를 물 흐르듯 처리하는 데에 최적화되었으며 다양한 형태의 메모리와 최대 512TB의 가상 주소 공간과 함께 사용 가능하다.
  • 차세대 지오메트리 파이프라인: 현세대의 게임과 전문가용 애플리케이션들은 놀라울 정도로 복잡한 지오메트리를 활용하며, 놀라운 수준으로 증가한 해상도를 데이터 수집 장치에서 사용한다. 메쉬(Mesh)에서 프레임당 수천만 개가 할당되어 있는 폴리곤들은 아주 조밀한 수준이어서, 거의 픽셀당 폴리곤 하나가 할당된 수준이다. 베가의 차세대 지오메트리 파이프라인은 프로그래머로 하여금 이러한 복잡한 지오메트리 처리에서도 놀라운 수준의 효율을 뽑아낼 수 있도록 한다. 또한 이전 세대의 라데온 아키텍처들보다 클럭당 2배 이상의 결과물을 만들어낼 수 있도록한다. 베가는 또한 향상된 로드 밸런싱 및 지능적인 부하 분산기를 갖추고 있어 일관된 성능을 제공할 수 있다.
  • 차세대 컴퓨트 엔진: 베가 아키텍처의 핵심 부분은 새로운 차세대 컴퓨트 엔진이며, 이는 유연성 있는 컴퓨트 유닛(CU)로 이루어져 있는데 이들은 클럭 사이클당 네이티브 환경에서 8비트, 16비트(반정밀도), 32비트(단정밀도) 연산을 처리할 수 있다. 이들 컴퓨트 유닛들은 이전 세대에 비해 극적으로 더 높은 동작 속도를 갖도록 최적화되어 있으며, 다양한 데이터타입을 지원할 수 있게 되어 있어 베가 아키텍처를 매우 다양한 부하에서도 동작할 수 있도록 만들어졌다.
  • 진보한 픽셀 엔진: 이 새로운 베가 픽셀 엔진은 ‘드로우 스트림 비닝 래스터라이저(Draw Stream Binning Rasterizer)를 채용하여, 성능 및 전력 효율성을 향상시키도록 디자인되었다. 이 엔진은 픽셀을 “페칭 한 번, 쉐이딩 한 번” 칩에 포함된 캐시를 통해 처리하고 미리 픽셀을 최종 화면에서 컬링(주: 특정 시점(viewpoint)에서 보이지 않는 곳을 정의하는 컴퓨터 그래픽 기법)시킨다. 베가의 픽셀 엔진은 이제 온보드 L2 캐시를 탑재하였으며, 주로 쓰기 이후에 읽기를 수행할 때 자주 일어나는 그래픽 부하에서 오버헤드를 상당한 수준으로 경감시킨다.

AMD 라데온 베가 공식 아키텍처 발표 슬라이드

b1
b2
b3
b4
b5
b6
b7
b8
b12
b13
s1
s2
s3
s4
s5
s6
s7
s8
s9
s10
s11
s12
s13
s14
s15
s16
s17
s18
s19
s20
s21
s22

AMD 베가 10 & 베가 11 GPU 목록

AMD 라데온 베가 GPU: DOOM 구동으로부터 성능 추측하기

8GB VRAM이 탑재된 베가 샘플로 DOOM 구동 테스트를 수행했던 TechReport의 보고에 따르면, 이 샘플은 GTX 1070과 1080의 사이의 성능을 발휘했다고 한다. 나이트메어 세팅으로 설정했을 때, 이 게임은 최대 프레임타임 24.8ms까지 기록했다고 했다. 우리(WCCFTech)는 또한 AMD의 CES 행사에서 베가 샘플을 이용한 DOOM 게임 플레이를 녹화했다.

성능이 그다지 인상적이지 않아 보이지만, 모든 시연 시스템의 흡기구는(그래픽카드의 배기구까지 포함해서) 모두 테이프로 막혀 있었고, 이 칩은 자체적으로 발출하는 폐열로 인해 거의 죽으려고 했던 정도일 것이다. 내 대략적인 추측으로는, 이 초기형 베가 카드는 DOOM에서 GTX 1070과 GTX 1080의 성능 사이 어딘가에 있을 것으로 짐작한다. –TechReport


AMD 베가 GPU는 매우 흥미로운 제품이며, AMD는 그들의 차세대 GPU에 대해 몇몇 핵심 세부사항을 청중들에게 공유했다. 베가 GPU의 출시는 2017년의 상반기로 예정되어 있으며, AMD가 또한 앞으로 몇달 내에 자사의 RYZEN 프로세서를 위한 차세대 AM4 플랫폼을 출시할 것이라는 점을 생각하면 이보다 더 좋은 출시 시점은 없다. 베가 GPU에 대한 더 자세한 사항이 알고 싶다면, 우리의 좀 더 디테일한 포스팅을 보시라.

댓글 남기기

This site uses Akismet to reduce spam. Learn how your comment data is processed.

%d 블로거가 이것을 좋아합니다: