본문 바로가기
반도체

거대한 인공 두뇌를 만드는 AI 반도체

by 아담스미스 2022. 3. 7.
728x90
반응형

거대한 인공 두뇌를 만드는 AI 칩 메이커

 

전례없는 규모의 컴퓨팅 능력을 제공하는 효율적인 시스템 필요
거대 IT 기업과 스타트업을 중심으로 빠르게 확장되는 AI 칩 시장
인공 신경망에 최적화된 병렬 처리 가능한 특수 AI용 칩 개발

많은 거대 IT 기업과 스타트업들이 인공 지능 기술의 역량을 새로운 차원으로 끌어올리기 위한 특수 AI 칩을 구축하기 위해 경쟁하고 있다. (출처=구글)

AI 칩은 인공지능 기술을 통합하고 기계학습에 사용되는 특수 실리콘 칩이다. 데이터 양이 증가함에 따라 몇 년 전만 해도 상상할 수 없었던 규모의 컴퓨팅 능력을 제공하는 보다 효율적인 시스템의 필요성이 중요해졌다. 많은 기술 대기업과 신생 스타트업들이 인공지능 기술의 역량을 새로운 차원으로 끌어올리기 위해 AI 칩 개발에 중점을 두고 있다.

우리가 생산하는 데이터 양은 기하급수적으로 증가하고 있다. 이러한 엄청난 양의 데이터에서 의미 있는 결과를 도출하기 위해 조직은 컴퓨팅 성능과 메모리 대역폭을 늘려야 한다.

일반적으로 AI 칩은 인공 신경망(Artificial Neural Networks)과 같은 딥러닝 알고리즘을 실행하기 위해 만들어졌다. 인공 신경망에는 대규모의 병렬 단순 산술 연산이 필요하기 때문에 메모리 내부의 산술 블록을 사용하는 범용 칩은 많은 수의 단순 동시 작업을 지원할 수 없어서 딥러닝 기술에 충분한 성능을 제공하지 못한다. AI에 최적화된 하드웨어에는 병렬 처리가 가능하도록 범용 칩에 비해 단순한 로직이 다수 포함되어야 한다. 따라서 병렬 컴퓨팅 기능을 가능하게 하는 AI 칩의 수요가 증가하고 있으며 이러한 추세는 계속될 것이다.

AI용 칩 전문화의 새로운 시대는 원래 게임용으로 개발된 GPU(그래픽 처리 장치)가 딥러닝과 같은 응용 프로그램에 배포되면서 시작되었다. GPU가 사실적인 이미지를 렌더링하도록 만든 아키텍처 덕분에 GPU가 CPU(중앙 처리 장치)보다 훨씬 효율적으로 데이터를 처리할 수 있었다. 2007년 엔비디아가 GPU를 범용 방식으로 프로그래밍할 수 있도록 CUDA 툴킷을 출시하면서 큰 진전이 있었다.

데이터 양이 증가함에 따라 전례없는 규모의 컴퓨팅 능력을 제공하는 보다 효율적인 시스템의 필요성이 중요해졌다. GPU 처리 능력은 빠르게 발전했다. 원래 이미지를 렌더링하도록 설계된 칩은 이제 AI 연구 및 개발을 지원하는 핵심 요소가 되었다. 슈팅 게임 포트나이트를 초당 120프레임으로 실행 하는 데 필요한 많은 선형 대수 루틴은 이제 컴퓨터 비전, 자동화된 음성 인식 및 자연어 처리의 최첨단 응용 프로그램의 핵심인 신경망을 구동하고 있다.

AI 칩에 대한 시장 전망은 공격적이다. 가트너는 AI 칩 매출이 2019년에는 약 80억 달러로 두 배 증가하고 2023년에는 340억 달러 이상에 이를 것으로 예상한다. 

엔비디아의 내부 예측에 따르면 AI 칩 매출은 2023년까지 500억 달러에 이를 것으로 예상된다. 대부분은 딥러닝을 지원하는데 사용되는 데이터 센터 GPU에 대해 예상되는 것이다. 향후 5년 동안 아마존 ARM, 애플, IBM, 인텔, 구글, 마이크로소프트, 엔비디아, AMD 및 퀄컴의 맞춤형 실리콘에 대한 막대한 투자가 결실을 맺는 것을 보게 될 것이다. 함께 10억 달러 이상을 투자 유치한 세레브라스, 그래프코어, 그로크, 미틱 AI, 삼바노바 시스템 및 웨이브 컴퓨팅을 비롯한 많은 스타트업이 경쟁에 참여하고 있다.

구글은 텐서플로우 프로그래밍 프레임워크를 위해 ASIC인 TPU(Tensor Processing Unit)를 특별히 설계하였다. 주로 AI의 두 가지 분기인 머신 러닝과 딥러닝에 사용된다. 구글의 Cloud TPU 는 데이터 센터 또는 클라우드 솔루션으로 신용 카드 크기 정도지만 Edge TPU는 1센트 동전보다 작으며 스마트폰, 태블릿, 데이터 센터 외부에서 우리 모두가 사용하는 장치와 같은 네트워크 에지에 있는 기기를 지칭하는 '에지' 기기용으로 설계되었다. 그렇긴 해도 이 시장을 더 자세히 관찰하는 분석가들은 구글의 Edge TPU가 회사의 자체 스마트폰 및 태블릿에 조만간 탑재되지 않을 것이며 엔터프라이즈 및 고가의 기계 및 장치에 사용될 가능성이 더 높다고 말한다. 최신 iPhone 및 iPad에 A11 및 A12 Bionic 칩을 사용했다. 이 칩은 타사 앱에 액세스할 수 없는 신경망 엔진을 사용한다. A12 Bionic 칩은 50%의 전력을 사용하면서 이전 제품보다 15% 빨라졌다고 한다. A13 버전은 현재 생산 중이며 올해 회사의 더 많은 모바일 장치에 탑재될 것으로 보인다. 

암(Arm)은 애플을 비롯한 모든 주요 기술 제조업체에서 사용하는 칩 IP(Intellectual Property)를 생산한다. 현재 기계 학습 프로세서, 신경망, 텐서플로우와 함께 동작하도록 설계된 프로세서 등 세 가지 주요 트랙을 따라 AI 칩 IP를 개발 하고 있다. 

인텔은 시장에서 가장 큰 선수 중 하나이며 기술 개발의 오랜 역사를 가지고 있다. Xeon 제품군은 실제로 AI에 국한되지 않고 AI를 더 잘 처리하도록 개선된 일반적인 프로세서였다. Xeon을 계속 개선할 수 있지만 인텔은 신경망 프로세서로 설명되는 Nervana 라는 AI 칩도 개발했다. NCS2는 인텔의 최신 AI 칩이며 딥 러닝을 위해 특별히 개발되었다.

엔비디아는 게임 부문에 대한 높은 품질의 칩을 생산 하고 있다. 플레이스테이션 3와 엑스박스 모두 엔비디아 그래픽 어레이를 사용한다. 엔비디나가 시장에 공급하는 특정 AI 칩에는 Tesla, Volta 및 Xavier 등이 있다. 모두 GPU를 기반으로 하는 이러한 칩셋은 특정 시장을 겨냥한 소프트웨어와 하드웨어가 결합된 솔루션으로 패키징된다. 예를 들어 자비에(Xavier)는 자율주행 솔루션의 기반이고 볼타(Volta)는 데이터 센터를  목표로 합니다. Grace는 2023 년에 출시 할 예정인 새로운 AI 칩 모델이다.

엔비디아와 마찬가지로 AMD는 그래픽 카드 및 GPU와 밀접하게 관련된 또 다른 칩 제조업체이다. AMD는 기계 학습 및 딥 러닝을 위한 EPYC CPU 및 Radeon Instinct GPU와 같은 하드웨어 및 소프트웨어 솔루션을 제공한다. Epyc는 AMD가 주로 데이터 센터에서 서버에 공급하는 프로세서의 이름이고 Radeon은 주로 게이머를 대상으로 하는 그래픽 장치이다. AMD가 제공하는 다른 칩에는 Ryzen과 더 잘 알려진 Athlon이 포함된다. AMD는 AI 전용 칩 개발의 비교적 초기 단계에 있는 것으로 보이지만 GPU의 상대적인 강점으로 시장의 리더 중 하나가 될 것으로 예상하고 있다. AMD는 ‘프론티어’라고 불리는 세계에서 가장 빠르고 가장 강력한 슈퍼컴퓨터 중 하나가 될 제품을 구축 하기 위해 미국 에너지부에 Epyc 및 Radeon 시스템을 공급하기로 계약했다 .

세레브라스의 WSE(Wafer Scale Engine)는 기존 GPU크기의 56배라고 한다. (출처=세레브라스)

세레브라스는 이 분야에서 비교적 새로운 선수이지만 이미 영향을 미쳤다. 일반 프로세서는 300 밀리미터 웨이퍼에서 수십 또는 수백개의 칩으로 절단되어 만들어진다. 세레브라스는 웨이퍼 내의 칩 요소간의 통신이 가능하도록 함으로써 전체 웨이퍼를 그대로 유지한 거대한 칩을 만든다.  2021년 4월, 850,000코어와 2.6조 트랜지스터를 보유한 새로운 AI 칩 모델인 세레브라스 WSE-2를 발표했다. 세레브라스는 WSE의 효과적인 기술이 유전 및 게놈 연구를 가속화하고 약물 발견 시간을 단축하기 때문에 아스트라제네카와 같은 많은 제약 회사와 함께 협업하고 있다.

바이두는 주로 인터넷 검색 엔진으로 알려져 있다는 점에서 중국의 구글에 해당한다. 그리고 구글과 마찬가지로 바이두는 무인 자동차와 같은 새롭고 흥미로운 비즈니스 부문으로 진출했다. 물론 여기에는 강력한 AI 기반의 마이크로프로세서가 필요하다. 이를 위해 바이두는 Kunlun을 공개하면서 ‘클라우드 투 에지 AI 칩’이라고 설명했다. 바이두는 검색 순위 및 딥 러닝 프레임워크를 포함하는 기존 AI 생태계에서 Kunlun의 응용 프로그램을 주로 보고 있다. 그러나 이 칩은 자율주행차, 가정용 지능형 장치, 음성 인식, 자연어 처리 및 이미지 처리를 포함하여 바이두가 진출하고 있는 새로운 분야에서 사용할 수 다른 잠재적인 응용 프로그램을 가지고 있다.

그래프코어는 BMW, 마이크로소프트 및 기타 글로벌 기업을 설득하여 현재 약 20억 달러로 평가되는 비즈니스에 총 3억 달러 투자를 유치해냈다. 주요 제품은 Colossus 프로세서를 기반으로 하고 데이터 센터를 대상 으로 하는 지능형 처리 장치,  Rackscale IPU-Pod인 것으로 보인다. 

스마트폰 붐이 시작될 때부터 애플과의 제휴를 통해 성장했던 퀄컴은 애플과 결별 후 미래를 염두에 두고 상당한 투자를 하고 있다. 클라우드 AI 칩을 공개했고, 이를 5세대 통신 네트워크(5G) 개발과 연결하는 것으로 보인다. 이 두 기술은 자율주행차와 모바일 컴퓨팅 장치의 새로운 생태계를 구축하는 데 기본이 될 것이다. 퀄컴이 AI 칩 분야의 후발주자라고 말하지만 모바일 장치 시장에서 광범위한 경험을 보유하고 있어 ‘온디바이스 AI를 유비쿼터스화’ 한다는 목표를 달성하는 데 도움이 될 것이다 .

4천만 달러 이상의 자금을 조달한 미틱(Mythic)은 데이터 센터를 시작으로 전 세계에 ‘국경 없는 AI’ 철학을 구현할 계획이다. 미틱은 자사 시스템이 플래시 어레이 내에서 하이브리드 디지털 및 아날로그 계산을 수행하기 때문에 심층 신경망이 더 이상 기존 로컬 AI에 크게 영향을 미치지 않는 방법을 개발했다고 주장한다. 이는 완전히 새로운 접근 방식이다. GPU는 데스크톱 컴퓨터 성능이 가능하지만 셔츠 단추 크기이므로 대규모 병렬 컴퓨팅을 제공할 수 있다. 이 모든 것은 칩이 소형 저전력의 에지 장치의 성능을 향상시킬 것임을 의미한다.

삼성은 인텔을 제치고 세계 1위 칩 제조사로, 애플을 제치고 세계 1위 스마트폰 회사로 떠오른 삼성은 지금까지 없었던 완전히 새로운 시장을 개척하고자 한다. 그 시장 중 하나는 스마트폰을 위해 온디바이스의  강화된 신경 처리 장치를 갖춘 AI 지원 칩이다. 삼성은 이미 LTE 통신 네트워크용으로 설계된 Exynos 마이크로프로세서를 출시한 바 있다.

IBM Telum Processor는 거래에서 사기를 예방하고 딥러닝 추론에 활용하기 위해 개발되었다.(출처=IBM)

IBM은 예상할 수 있듯이 대부분이 AI와 관련된 모든 방식의 기술에 막대한 자금을 지원하는 연구 및 개발을 보유하고 있다. Watson AI는 실제로 AI 전용 프로세서가 아닌 기존 프로세서라고 부르는 것을 사용하지만 그럼에도 불구하고 상당히 강력하다. 전문화된 AI 칩의 관점에서 IBM의 TrueNorth가 아마도 그 범주에 속할 것이다. TrueNorth는 인간 두뇌를 모델로 한 뉴로모픽(neuromorphic) 칩으로 설명되며 54억 개의 거대한 트랜지스터를 포함하고 있다. 트랜지스터 수와 구성요소의 실제 수가 전부가 아니라 구성요소가 어떻게 사용되는지가 중요하며 IBM은 미래의 AI 칩 환경에서 중심적인 위치를 차지하기 위해 막대한 투자를 하고 있다.

부품 수 면에서 보면 자일링스(Xilinx)는 트랜지스터 수가 가장 많은 마이크로프로세서 제조사라고 한다. Versal 또는 Everest 칩셋에는 500억 개의 트랜지스터가 포함되어 있다. 또한 자일링스는 Versal을 AI 추론 플랫폼 으로 설명한다. 추론은 머신 러닝 및 딥러닝 시스템이 수집하고 처리하는 방대한 양의 데이터에서 도출된 추론을 나타내는 용어이다. 전체 Versal 및 Everest 솔루션에는 다른 회사의 칩이나 최소한 다른 회사에서 설계한 칩이 포함되어 있다. Xilinx는 아마도 독립형 패키지로 이러한 고성능 컴퓨팅 기능을 시장에 제공한 최초의 제품 중 하나일 것이다.

비아(Via)는 AI 칩을 제공하지 않지만 퀄컴 프로세서 및 기타 다양한 구성 요소를 특징 으로 하는 ‘Edge AI 개발자 키트’를 제공한다. AI가 Arduino, Raspberry Pi 등과 같은 다른 모든 저가의 소형 컴퓨터 공급업체에 통합되는 것은 시간 문제일 것이다. 

세계 최대 가전제품 공급업체 중 하나인 LG는 재빠른 움직임을 보이는 거대 기업이다. 최근 LG는 가정용 AI 기기 개발을 가속화할 목적으로 AI 칩인 LG Neural Engine을 공개했다. 그러나 LG는 에지 장치 외에도 데이터 센터와 백룸 시스템에서 칩을 사용할 가능성이 높다.

가상 현실과 증강 현실은 장치에서 실행되는 거의 모든 것보다 더 많은 컴퓨팅 리소스를 사용한다. 구글의 데이터 센터 서버 중 일부는 몇 년 전 포켓몬 증강 현실 게임에 대한 세계적인 열풍으로 인해 중단된 것으로 알려졌다. 따라서 VR과 AR은 데이터 센터와 에지 장치에 AI 칩을 통합해야 할 것이다. 그리고 이메지네이션 테크놀로지스(Imagination Technologies)는 PowerVR GPU로 이를 수행한다. 이메지네이션 테크놀로지스는 최신 PowerVR을 초당 4테라 이상의 연산을 제공하는 AI 칩을 위한 완전한 신경망 가속기 솔루션으로 설명하며 시장에서 평방 밀리미터당 최고의 성능 밀도를 제공한다.

대부분의 회사와 마찬가지로 미디어텍(MediaTek)은 팹리스(fabless) 반도체 회사이다. 즉, 칩 자체를 제조 또는 생산하는 것이 아니라 설계 및 개발만 수행한다. NeuroPilot 기술은 CPU, GPU 또는 AI 처리 유닛 등의 컴퓨팅 기능을 SoC(System on Chip)에 내장한 제품이다. SoC는 컴퓨팅 머신의 모든 구성 요소를 연결하는 집적 회로를 나타낸다.

웨이브 컴퓨팅은 전문 AI 플랫폼 제공업체라고 할 수 있다. 또 다른 SoC인 Triton AI를 출시하기도 했다. 웨이브 컴퓨팅은 Triton이 개발자가 단일 플랫폼으로 광범위한 AI 사용 사례를 해결할 수 있도록 하는 업계 최초의 제품이라고 말한다. 추론과 훈련을 지원하며 새로운 AI 알고리즘을 지원할 만큼 충분히 유연하다. 웨이브 컴퓨팅은 에지 장치에서 서버 및 데이터 센터 랙에 이르는 다양한 AI 솔루션을 제공한다 .

2억 달러 이상을 모금한 이 스타트업 삼바노바(SambaNova)는 고객을 위한 맞춤형 AI 칩을 개발할 수 있는 자원이 매우 풍부하다. 삼바노바는 차세대 AI 컴퓨팅을 주도하기 위해 하드웨어와 소프트웨어를 더한 솔루션을 구축하고 있다. 회사의 주요 투자자 중 하나는 구글이다. 

아마존 웹 서비스 사업부와 함께 클라우드 컴퓨팅 시장을 실질적으로 발명한 아마존이 AI 칩 시장에 진출하는 것은 당연한 것으로 보인다. 특히 데이터 센터가 통합을 통해 더 효율적으로 만들어질 수 있기 때문이다. 세계 최대 온라인 소매업체 아마존은 AWS Inferentia AI 칩을 공개했다. 런칭하더라도 외부 업체에 팔 가능성은 없고, 그냥 아마존 그룹 사업자에게만 공급되는 셈이다.

알라이드 마켓 리서치는 전 세계 AI 칩 시장이 2025년까지 910억 달러에 이를 것이며 그때까지 매년 45%의 성장률을 보일 것으로 예상한다. 시장 동인에는 스마트 홈 및 스마트 시티에 대한 수요 급증, AI 스타트업에 대한 더 많은 투자, 양자 컴퓨팅의 출현 및 스마트 로봇의 부상이 포함된다. 그러나 시장 성장은 숙련된 인력이 너무 적기 때문에 느려지고 있는 것이 현실이다.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(출처:http://www.aitimes.com/news/articleView.html?idxno)

728x90