인텔, 기업 AI 워크로드 처리 위해 데이터센터 현대화 목표로 하는 Xeon 6 프로세서 공개

인텔이 기업 AI 워크로드 가속화를 위해 데이터센터 현대화에 도움을 주는 Xeon 6 프로세서를 공개했습니다. 또한 Gaudi 3 가격도 공개했습니다.

2024년 6월 4일 오전 3:00- 3달 전VENTUREBEAT.COM- Ken Yeung

인텔, 기업 AI 워크로드 처리 위해 데이터센터 현대화 목표로 하는 Xeon 6 프로세서 공개

요약생성

바쁠 때는 리얼라이즈가 내용을 요약해 드려요.

인텔이 점점 더 많은 기업이 AI 앱과 모델을 배포하기 시작함에 따라 데이터센터가 필요한 워크로드를 처리할 수 있도록 Xeon 6 칩을 발표했습니다. 이 프로세서는 효율적인 코어(E-코어)와 성능 코어(P-코어)라는 두 가지 마이크로아키텍처가 함께 제공되며 6700 및 6900 플랫폼 제품으로 제공됩니다. 하지만 6월 4일에 출시되는 것은 6700 E-코어 버전뿐입니다. 6900 P-코어 버전은 2024년 3분기에 출시되고, 다른 버전은 2025년 1분기에 출시될 예정입니다.

인텔의 부사장 겸 총괄 매니저인 Matt Langman은 기자 간담회에서 “이는 업계 고객이 실질적인 비즈니스 성과를 낼 수 있도록 지원하는 것입니다.”라며 “모든 기업이 운영 효율성을 높이거나 제품 개발 효율성을 높이거나 고객 참여 효율성을 높이거나, 아니면 그냥 더 효과적으로 하려고 하든 모든 기업이 AI 기업이 되어가고 있습니다.”라고 말했습니다.

인텔은 Xeon 6 프로세서 외에도 처음으로 Gaudi 2 및 Gaudi 3 가속기 칩의 가격을 공개했습니다. 2022년에 출시된 Gaudi 2가 탑재된 표준 AI 키트는 65,000달러, 4월에 공개된 Gaudi 3는 125,000달러에 판매될 예정입니다.

Xeon 6: 알아야 할 사항

인텔 Xeon 6 성능 코어 프로세서. 이미지 출처: 인텔

인텔은 Xeon 6를 “강력한 컴퓨팅 플랫폼”이라고 부르며, “성능과 효율성 모두에서 탁월한 성능을 발휘합니다.”라고 말합니다. 이 두 가지는 “끊임없이 증가하는 데이터센터의 요구 사항을 충족하는 데” 매우 중요하다고 주장합니다. 이 프로세서는 컴퓨팅 집약적인 AI 및 고성능 컴퓨팅부터 기존 엔터프라이즈 애플리케이션, 전력 효율적이고 고밀도 애플리케이션에 이르기까지 광범위한 사용 사례를 지원합니다.

이 계획은 기업들이 노후화된 데이터센터 시스템을 Xeon 6 칩으로 현대화하여 비용 절감을 높이고, 지속 가능성 목표를 달성하고, 물리적인 공간과 랙 공간을 최적화하고, 새로운 디지털 기능을 창출하는 것입니다.

이전에 코드명 Granite Rapids 및 Sierra Forest로 불렸던 Xeon 6 P-코어 및 E-코어는 하드웨어 플랫폼 기반 및 소프트웨어 스택을 공유합니다. 이 제품들은 증가된 코어 수를 지원하고, DDR5를 사용하여 더 큰 메모리 대역폭을 갖추고 있으며, 다중화된 결합 랭크 DIMM, UPI 2.0을 사용한 향상된 인터소켓 대역폭, Compute Express Link 2.0, 공통 OS 및 펌웨어 등을 제공합니다.

인텔은 데이터센터에 필요할 수 있는 다양한 요구 사항을 언급하며 Xeon 6에 두 가지 마이크로아키텍처를 제공합니다. 핵심은 워크로드와 기능입니다. P-코어는 고성능 컴퓨팅 및 컴퓨팅 집약적인 AI를 처리하는 데 더 적합할 가능성이 높습니다. 하지만 “가장 광범위한 엔터프라이즈 애플리케이션”에도 유용합니다. Langman은 “P-코어의 이점은 높은 단일 스레드 및 코어당 성능 기능에 대한 이러한 사용량을 충족하거나 능가하는 데 도움이 되는 지연 시간에 민감한 워크로드 중 일부입니다.”라고 설명합니다. 하지만 클라우드 네이티브 웹, 마이크로서비스, 디지털 서비스와 관련된 워크로드는 “더 높은 밀도와 향상된 와트당 성능을 활용하는” Xeon 6 E-코어의 이점을 누릴 수 있습니다.

그렇다면 Xeon 6 6700 시리즈와 6900 시리즈의 차이점은 무엇일까요?

Xeon 6 프로세서(6700 시리즈)

  • 최대 144개의 효율적인 코어/86개의 성능 코어
  • 소켓 지원: 1S/2S 및 4S/8S(P-코어만 해당) 지원
  • 최대 TDP: CPU당 최대 350W
  • 메모리 채널: 8채널 메모리, 최대 6400MT/s DDR5 메모리, 8000MT/s MCR DIMM 메모리(P-코어)
  • PCIe/CXL: 최대 88레인 PCIe 5.0/CXL 2.0
  • UPI 링크: 4개의 UPI 2.0 링크, 최대 24GT/s

Xeon 6 프로세서(6900 시리즈)

  • 최대 288개의 효율적인 코어/128개의 성능 코어
  • 소켓 지원: 1S/2S 지원
  • 최대 TDP: CPU당 최대 500W
  • 메모리 채널: 12채널 메모리, 최대 6400MT/s DDR5 메모리, 8800MT/s MCR DIMM 메모리(P-코어)
  • PCIe/CXL: 최대 96레인 PCIe 5.0/CXL 2.0
  • UPI 링크: 6개의 UPI 2.0 링크, 최대 24GT/s

출시가 왜 이렇게 엇갈리나요?

오늘 Xeon 6의 모든 변형이 출시되는 것은 아닙니다. 인텔은 고객이 원하는 바이기 때문에 의도적으로 다양한 프로세서 SKU의 출시를 엇갈리게 하고 있다고 말합니다. 인텔의 E-코어 제품 라인 부사장 겸 총괄 매니저인 Ryan Tabrah는 “Xeon 6으로 지원하는 다양한 고객에게 가장 적합한 것은 지금 보시는 것과 같은 엇갈린 순서입니다. 그리고 흥미로운 점은 첫 번째 제품 출시가 가까워지면서 순조롭게 진행되고 있으며, 시장에서 많은 기대를 모으고 있으며, 이러한 일이 일어나는 것을 지켜보는 것이 즐겁습니다.”라고 설명합니다.

Xeon 6 E-코어의 자랑거리

Xeon 6 E-코어가 처음으로 출시되고 E-코어를 탑재한 최초의 Xeon 버전이기 때문에 인텔은 몇 가지 지표를 제공하면서 2세대 인텔 Xeon 프로세서와 비교하여 미디어 트랜스코딩 워크로드에서 랙 수준 통합을 3 대 1로, 랙 수준 성능은 최대 4.2배, 와트당 성능은 최대 2.6배 향상시킨다고 밝혔습니다.

Langman은 “오늘날의 데이터센터를 살펴보면 일반적인 중간 규모 데이터센터 배포인 약 200개의 랙(약 15kW 랙과 22u 서버)을 예로 들 수 있으며, 2세대 인텔 Xeon에서 초당 미디어 스트림을 제공하는 방식을 살펴보세요. 인텔 Xeon 6에서 와트당 성능과 전반적인 성능 향상을 통해 제공하는 발전을 살펴보면 랙 수준 통합이 3 대 1로 줄어 66개의 랙이 됩니다. 랙 공간과 랙 기능 면에서 엄청나고 놀라운 절감 효과입니다.”라고 말합니다.

“하지만… 랙 절감 효과뿐만 아니라 에너지 절감 효과와 탄소 발자국도 줄일 수 있습니다. 그리고 4년 동안 함대 에너지 사용량을 보면 84,000MWh 이상이 절감되어 상당한 에너지 절감 효과를 얻을 수 있으며, 같은 기간 동안 탄소 배출량도 34,000톤 감소합니다. 따라서 랙 통합의 이점을 얻고 업계의 지속 가능성 목표를 달성할 수 있습니다.”

Gaudi 3: 가격 및 새로운 시스템 공급업체

인텔의 Gaudi 3 AI 가속기. 이미지 출처: 인텔

인텔은 Xeon 6 뉴스 외에도 최신 Gaudi 제품 2종의 가격을 공개했습니다. Nvidia의 H100과 경쟁하기 위해 설계된 이러한 가속기 칩은 더 낮은 총 운영 비용으로 대규모 언어 모델을 학습하고 추론하는 데 도움이 됩니다.

범용 베이스보드가 장착된 8개의 인텔 Gaudi 2 가속기가 포함된 표준 AI 키트를 사용하는 기업은 65,000달러를 지불하게 되며, 이는 인텔 추산에 따르면 유사한 경쟁 제품의 3분의 1 수준입니다. 8개의 인텔 Gaudi 3 가속기가 포함된 유사한 키트는 125,000달러로, 인텔 경쟁업체 가격의 약 3분의 2 수준입니다.

인텔은 가격을 공개했지만, 2024년 3분기에 출시될 예정이라는 점 외에 Gaudi 3의 출시 시기에 대한 자세한 내용은 밝히지 않았습니다.

인텔은 시장 진출 전략을 지원하기 위해 Dell, Hewlett-Packard Enterprise, Lenovo, Supermicro를 포함한 최소 10개의 시스템 공급업체와 파트너십을 맺고 있으며, Asus, Foxconn, Gigabyte, Inventec, Quanta, Wistron이 새롭게 추가되었습니다.

Xeon 및 Gaudi의 AI 사용 사례

Xeon과 Gaudi가 어떻게 함께 작동할 것인지 묻는 질문에 Tabrah는 상호 보완적인 관계라고 설명합니다. 그는 “고객의 데이터센터를 활용하는 것입니다.”라고 말합니다. “고객들은 이러한 전력 병목 현상에 직면하고 있습니다. 데이터센터 자체가 병목 현상이 되어가고 있습니다. 그리고 매우 효율적인 범용 컴퓨팅 아키텍처로 빠르고 쉽게 이동하기만 하면 아무것도 건드리지 않고도 데이터센터를 활용할 수 있고, 나머지 인프라를 통해 더 많은 AI를 수행할 수 있습니다. 정말 대단한 일입니다.”

인텔의 또 다른 부사장인 Anil Nanduri는 이 모든 것이 기업이 데이터를 활용할 수 있도록 돕는 것이라고 지적합니다. 생성형 AI가 도입되면서 조직은 대규모 언어 모델을 활용하여 필요한 워크로드에 적합하고 투자할 수 있는 계산 비용에 가장 적합한 솔루션을 만드는 가장 좋은 방법을 모색하고 있습니다. 그는 “가속기가 여전히 [LLM]을 실행하는 것을 보게 되겠지만, 데이터 세트를 더 최신 상태로 유지하고 지식 검색이나 다른 사용 사례를 수행하는 고객에게 더 나은 결과를 얻을 수 있는 RAG와 같은 사용 사례에서는 Xeon에 벡터 임베딩을 유지한 다음 가속기에서 실행되는 모델에 연결할 수 있습니다.”라고 말합니다. “이것은 Xeon과 Gaudi가 제공할 수 있는 뛰어난 호환성, 성능, 가치를 기대할 수 있는 좋은 사용 사례입니다.”

인텔의 CEO인 Pat Gelsinger는 성명에서 “인텔은 반도체 제조부터 PC, 네트워크, 에지, 데이터센터 시스템에 이르기까지 AI 시장 기회의 전체 스펙트럼에서 혁신을 이끌고 있는 전 세계 몇 안 되는 기업 중 하나입니다.”라며 “당사의 최신 Xeon, Gaudi, Core Ultra 플랫폼은 하드웨어 및 소프트웨어 에코시스템의 강력한 성능과 결합되어 고객이 앞으로 다가올 엄청난 기회를 극대화하는 데 필요한 유연하고 안전하며 지속 가능하고 비용 효율적인 솔루션을 제공합니다.”라고 말했습니다.