‘볼타’ 기반 ‘테슬라 V100’ 데이터센터 GPU, 전 세대 ‘P100’ 대비 최대 5배 성능 향상

▲ 엔비디아 ‘테슬라 V100’ 데이터센터 GPU

[아이티데일리] 엔비디아(CEO 젠슨 황)는 자사 ‘GPU 테크놀로지 컨퍼런스(GTC)’ 행사에서 인공지능(AI) 및 고성능 컴퓨팅(HPC)의 발전을 위한 강력한 차세대 GPU 컴퓨팅 아키텍처인 ‘볼타(Volta)’를 공개했다고 11일 밝혔다.

젠슨 황 엔비디아 창업자 겸 CEO(Jensen Huang)의 ‘GTC 2017’ 기조연설을 통해 공개된 엔비디아의 7세대 GPU 아키텍처 ‘볼타’는 210억 개의 트랜지스터로 구축됐으며, CPU 100개와 같은 수준의 성능으로 딥러닝을 구현한다. ‘볼타’의 최대 테라플롭스 성능은 엔비디아의 현 세대 GPU 아키텍처인 ‘파스칼(Pascal)’ 대비 5배, 2년 전 출시된 ‘맥스웰(Maxwell)’ 아키텍처 대비 15배 향상됐다. 이는 무어의 법칙으로 예측된 수준을 4배가량 넘어선 성능 개선이다.

기조연설에서는 ‘볼타’ 기반의 첫 프로세서인 ‘테슬라(Tesla) V100’ 데이터센터 GPU도 함께 발표됐다. ‘테슬라 V100’ 데이터센터 GPU는 AI 추론 및 트레이닝에서 요구되는 뛰어난 속도와 확장성을 지원하며, 고성능 컴퓨팅 및 그래픽 워크로드를 가속화한다.

‘볼타’ 아키텍처는 새로운 통찰을 위한 연산 과학 및 데이터 과학 분야에 사용되는 HPC 시스템에 뛰어난 플랫폼을 제공하며, HPC를 위한 새로운 기준을 제시할 전망이다. 5000개가 넘는 쿠다(CUDA) 코어와 640개의 새로운 ‘볼타 텐서 코어(Volta Tensor Core)’를 통합 아키텍처에 결합, ‘테슬라 V100’ GPU를 탑재한 1대의 서버가 기존 HPC에 필요한 수백 개의 일반 CPU를 대체할 수 있다는 게 회사 측 설명이다.

또한 CPU와 GPU, 또는 GPU 간의 초고속 연결을 지원하는 차세대 인터커넥트 기술인 ‘NV링크(NVLink)’의 2.0버전이 적용돼 전 세대 대비 최대 2배가량의 성능을 제공한다. 여기에 삼성과의 협력을 통해 900GB/s 대역폭의 HBM2 DRAM을 탑재, 전 세대 대비 50% 향상된 메모리 대역폭을 제공한다. 이 밖에 쿠다(CUDA), cuDNN, 텐서RT(TensorRT) 등 ‘볼타’에 최적화된 소프트웨어들은 선도적인 프레임워크와 애플리케이션에 쉽게 도입됨으로써 AI 및 연구를 가속화시킬 수 있다.

젠슨 황 CEO는 “AI는 인간 역사상 가장 위대한 기술 발전을 이끌고 있다. AI는 지능을 자동화하고 산업 혁명 후 유례없는 새로운 사회적 진보를 가져올 것”이라며, “학습이 가능한 컴퓨터 소프트웨어를 구축하는 혁신적인 AI 접근법인 딥러닝은 무한대의 프로세싱 파워를 요구한다. 이러한 수요에 대응하기 위해 수천 명의 엔비디아 엔지니어들이 지난 3년여 간 ‘볼타’ 개발에 매진해왔으며, 삶을 변화시키는 AI의 잠재력에 대한 업계의 인식을 제고시켜왔다”고 말했다.

저작권자 © 아이티데일리 무단전재 및 재배포 금지