CPU 칩 최대 25배 효율
엔비디아 넘는 가성비 칩도
보안 힘 준 AI 데이터센터 혁신
아마존웹서비스(AWS)가 ‘자체 AI 칩’ 라인업에 힘을 쏟고 있다. 엔비디아보다 절반 저렴한 인공지능(AI) 칩에 이어, 운영 효율을 25배까지 높인 서버 중앙처리장치(CPU) 칩으로 경쟁을 예고했다.
AWS는 대규모 모델 개발 및 배포 시 불필요한 비용을 줄이는 ‘효율 극대화’로 자체 칩 역량을 강화했다. 연례 글로벌 최대 행사 ‘리인벤트(re:Invent) 2025’에서 AI 반도체 강자인 엔비디아 그래픽처리장치(GPU) 모델을 뛰어넘는 칩과 마이크로소프트(MS) 등 경쟁자 대비 CPU 칩의 성능을 높인 점을 강조했다.
1~5일(현지시간) 미국 라스베이거스에서 연 리인벤트 기간 공개한 신제품 가운데 가장 눈에 띄는 건 단연 AI 칩이었다. AI 모델의 훈련에 쓰이는 ‘3세대 트레이니움’과 CPU 칩 ‘5세대 그래비톤’ 등으로 기존 업계 강자와 비교해 비용은 감축했지만 실행 속도는 빨라졌다.
전 세계 기업의 인공지능전환(AX)을 주도하며 엔터프라이즈급에도 전력 소모 대비 최적의 성능을 발휘한다는 점도 강점으로 내세웠다.
피터 데산티스 AWS 유틸리티 컴퓨팅 수석 부사장은 4일(현지시간) AI 칩 고도화에 대해 "비싼 칩을 쓰지 않아도 까다로운 엔터프라이즈 워크로드와 고성능 컴퓨팅에서 전력 효율 대비 최적의 성능을 자랑한다"며 "현재 테스트 버전인 ‘그래비톤5’를 도입한 글로벌 기업들은 가시적인 성과에 만족감을 표한다"고 말했다.
이날 고객 사례 발표 중 애플은 AWS CPU 칩을 도입해 효용성을 높였다고 밝혔다. 파얌 미르라시디 애플 클라우드 시스템 및 플랫폼 부사장은 “애플 대부분 서비스는 AWS 협력으로 선보이고 있다”며 “성능 향상률은 40%, 비용 절감은 30% 효과가 있었다”고 말했다.
또 다른 글로벌 기업인 어도비와 SAP은 그래비톤 프로세서 적용 후 각 37%, 35%의 배출량 감축으로 이어졌다. 어도비는 수백만명의 사용자를 위한 개인화된 시청 경험을 제공하며 AWS 솔루션을 활용했다. SAP은 하나(HANA) 클라우드 서비스 구축 과정에서 AWS와 협력했다.
그래비톤5는 범용 모델로 클라우드 워크로드별로 맞춤 지원해 이전 4세대보다 컴퓨팅 환경을 최대 25% 높였다. 이러한 기대효과는 개선된 설계 구조에서 나왔다. 아마존 EC2의 가장 높은 CPU 기준인 단일 패키지 당 192개의 코어를 제공한다. 이는 MS 등 경쟁사들과 비교해 많은 코어 숫자다. 코어 간에 데이터 이동 거리를 줄임으로써 통신 지연 시간을 최대 33% 단축하고 대역폭도 늘렸다.
그동안 효율성 향상의 장애물인 L3 캐시도 업그레이드했다. L3 캐시는 고속 메모리 버퍼로 자주 접근하는 데이터를 프로세서 가까이에 보관한다. 이번 기능 고도화로 용량은 이전 버전과 비교해 5배 커졌다. 이전 세대 대비 2.6배 많은 L3 캐시에 접근할 수도 있다.
더 빨라진 메모리 속도를 통해 규모가 큰 데이터셋 처리가 가능하다. 네트워크 및 스토리지 대역폭도 향상됐다. 네트워크 대역폭은 최대 15%, 아마존 고성능 블록 스토어(EBS) 대역폭은 20%까지 개선됐다. 가장 큰 인스턴스의 경우 네트워크 대역폭이 최대 2배 향상됐다. 데이터 전송 속도가 증가하고 백업 시간이 단축되는 효과도 있었다.
자사 6세대 니트로 카드를 활용해 보안 부문도 강화했다. 니트로 시스템은 개인정보 보호에 민감한 정부나 금융기관들이 신뢰할 수 있도록 보안 역량 강화에 집중한다. 가령 다른 시스템이나 사람이 EC2 서버에 로그인할 때, 인스턴스 메모리를 읽고 고객 데이터에 접근할 때 사전에 막는다.
이번에 공개한 자체 AI 칩 중 ‘트레이니움3’ 칩도 있다. 엔비디아 칩과 비교해 AI 학습 비용을 최대 50% 감축한 혁신 모델이다. 이전보다 최대 4배 빠른 컴퓨팅 성능을 발휘하는 새 칩으로 에너지 효율도 4배가량 개선됐다.
AWS는 AI 학습용 칩의 경쟁력을 높이기 위한 다음 전략도 이미 세웠다. 차세대 모델인 ‘트레이니움4’로 운영 비용을 더 아낄 수 있도록 향상된 성능을 내세울 계획이다. 프론티어 훈련과 추론을 지원하기 위해 최소 6배의 처리 성능과 3배의 8비트부동소수점(FP8) 성능, 4배의 메모리 대역폭을 탑재하는 것을 목표로 한다.
AWS는 4세대 트레이니움을 공식 출시하며 엔비디아와 협력을 강화할 방안도 내놨다. 차세대 AI 학습용 칩과 그래비톤 칩, 니트로 시스템에서 엔비디아 NV링크 퓨전 고속 칩 인터커넥트 기술 지원을 구상하고 있다.
인프라 강화 차원에서 AI 데이터센터 경쟁력을 높일 ‘AI 팩토리즈’도 거론됐다. 고도화된 AI 서비스를 도입할 때 따르는 비용 문제를 해소하면서 고객의 도입 절차를 간소화한 것이 핵심이다.
AI 모델 개발 시 필요한 GPU와 이를 활용할 데이터센터, 전력에 투자에 대한 막대한 자금을 각각 쏟지 않아도 보안까지 한 번에 해결할 수 있다. 클라우드 도입 시 깐깐한 규제를 적용받는 정부기관과 금융권을 위한 맞춤 보안 방안도 마련됐다. 특히 더딘 공공 부문의 AI 혁신 속도를 지원하는 방안을 계획하고 있다.
임성원 기자(sone@dt.co.kr)실시간 주요뉴스
기사 추천
- 추천해요 0
- 좋아요 0
- 감동이에요 0
- 화나요 0
- 슬퍼요 0