logo
뉴스

회사 소식 Nvidia, Vera Rubin 플랫폼용 Groq 3 LPU 포함 7개 칩 생산 발표

인증
중국 Beijing Qianxing Jietong Technology Co., Ltd. 인증
중국 Beijing Qianxing Jietong Technology Co., Ltd. 인증
고객 검토
베이징 첸싱 지에통 테크 주식회사의 영업 사원은 매우 전문적이고 참을성 있습니다. 그들은 빨리 인용을 제공할 수 있습니다. 제품의 품질과 패키징은 또한 매우 좋습니다. 우리의 협력은 매우 매끄럽습니다.

—— 《Festfing DV》LLC

내가 긴급히 인텔 CPU와 토시바 SSD를 찾고 있었늘 때, 베이징 첸싱 지에통 기술 주식회사로부터의 샌디는 나에게 많은 도움을 주었고, 나에게 빨리 필요로 한 제품을 가져다 주었습니다. 나는 정말로 그녀를 압니다.

—— 고양이 엔

베이징 첸싱 지에통 기술 주식회사의 샌디는 내가 서버를 구입할 때 제시간에 나에게 구성 오류를 상기시킬 수 있는 매우 주의깊은 판매원을 있습니다. 엔지니어들은 또한 매우 전문적이고, 빠르게 테스팅 프로세스를 완료할 수 있습니다.

—— 스트렐킨 미하일 블라드미로비치

베이징 첸싱지에통과의 협업에 매우 만족합니다. 제품 품질이 훌륭하고, 배송도 항상 제 시간에 이루어집니다. 영업팀은 전문적이고, 인내심이 많으며, 모든 질문에 매우 친절하게 답변해 줍니다. 그들의 지원에 진심으로 감사드리며, 장기적인 파트너십을 기대합니다. 강력 추천합니다!

—— Ahmad Navid

품질: 제 공급업체와의 좋은 경험. 미크로틱 RB3011은 이미 사용되었지만 매우 좋은 상태로 모든 것이 완벽하게 작동합니다. 통신은 빠르고 원활했습니다.그리고 제 모든 걱정은 빠르게 해결되었습니다.매우 신뢰할 수 있는 공급자

—— 제란 콜레시오

제가 지금 온라인 채팅 해요
회사 뉴스
Nvidia, Vera Rubin 플랫폼용 Groq 3 LPU 포함 7개 칩 생산 발표
Nvidia는 칩 스타트업 Groq와 모든 지적 재산을 200억 달러에 인수한 지 불과 두 달 만에 산호세에서 열린 GPU 기술 컨퍼런스(GTC)에서 주요 하드웨어 업데이트를 발표했습니다. 거래가 최근에 마무리되었음에도 불구하고 Groq의 LPU(언어 처리 장치)는 이미 대량 생산 중이며 Nvidia의 전체 Vera Rubin 칩 스택에 통합되고 있습니다. 여기에는 현재 생산에 들어간 총 7개의 새로운 칩이 포함되어 있습니다.

Groq는 2016년 원래 TPU(Tensor Processor Unit) 팀의 일원이었던 전직 Google 엔지니어들이 설립했습니다. 이 회사는 빠르고 짧은 지연 시간의 AI 추론 처리를 위해 특별히 제작된 맞춤형 ASIC 칩을 설계합니다. Nvidia의 부사장이자 가속 컴퓨팅 총괄 관리자인 Ian Buck은 Rubin GPU의 "극단적인 실패"와 Groq LPU의 강력한 대역폭을 결합하면 AI 워크로드를 위한 독특하고 강력한 솔루션이 탄생할 것이라고 말했습니다.

에 대한 최신 회사 뉴스 Nvidia, Vera Rubin 플랫폼용 Groq 3 LPU 포함 7개 칩 생산 발표  0

Buck은 전날 언론 브리핑에서 “GPU는 대용량 메모리와 강력한 부동 소수점 성능을 갖추고 있어 주류 시장에 높은 처리량과 빠른 토큰 속도를 제공하며 일반적인 AI 작업에 탁월합니다.”라고 말했습니다. "그러나 LPU는 대기 시간이 매우 짧은 토큰 생성에만 최적화되어 초당 수천 개의 토큰을 푸시할 수 있습니다."

“그 정도 수준의 성능에 도달하려면 여러 개의 칩이 필요하다는 것이 트레이드오프입니다.”라고 그는 덧붙였습니다. Buck에 따르면 각 Groq 3 LPU의 SRAM은 Rubin GPU 메모리 용량의 1/500에 불과한 500MB에 불과합니다. "그러나 대역폭은 예외적입니다. Rubin GPU는 최대 22TBps를 제공하는 반면 Groq LPU는 초당 150TB에 도달합니다."

Nvidia는 GPU의 디코딩 작업을 LPU의 저지연 작업과 통합하기 위해 두 프로세서를 결합하여 두 프로세서가 별도의 구성 요소가 아닌 하나의 통합 시스템으로 실행될 수 있도록 하기 위해 노력하고 있다고 Buck은 확인했습니다.

Nvidia가 GTC에서 공개한 Groq 3 LPX 랙은 NVL72 랙과 함께 배포되어 AI 추론 및 에이전트 AI 워크로드를 위한 전용 용량을 제공합니다. Nvidia의 프레젠테이션에 따르면 Groq 3 LPX 랙은 128GB SRAM과 초당 40페타바이트의 SRAM 메모리 대역폭을 갖춘 최대 256개의 LPU 가속기를 수용할 수 있습니다. 랙은 총 초당 최대 640TB의 확장 대역폭을 제공하며 Nvidia는 결국 1,000개 이상의 LPU를 수용할 수 있도록 확장할 수 있다고 밝혔습니다.

Nvidia에 따르면 Groq 3 LPX 랙과 Rubin NVL72 시스템을 결합하면 고객은 400,000개의 토큰 컨텍스트 창을 갖춘 1조 매개변수 GPT 모델에서 단 45달러에 100만 개의 토큰을 생성할 수 있습니다. 이 수치는 Rubin NVL72 시스템이 자체적으로 생성할 수 있는 것보다 35배 더 많은 토큰을 나타냅니다.

에 대한 최신 회사 뉴스 Nvidia, Vera Rubin 플랫폼용 Groq 3 LPU 포함 7개 칩 생산 발표  1

Groq 3 LPU는 Nvidia가 AI 추론 용량을 높이기 위해 활용하는 유일한 새로운 칩이 아닙니다. 이 회사는 또한 Nvidia의 NVL72 및 NVL8 시스템의 핵심에 슈퍼칩을 구축하기 위해 두 개의 Rubin GPU와 쌍을 이루는 ARM 기반 프로세서인 Vera CPU 전용 랙을 발표했습니다.

CPU가 AI 추론 및 에이전트 AI 워크로드의 주요 병목 현상으로 등장함에 따라 기업에서는 점점 더 많은 CPU 리소스를 요구하고 있습니다. 이에 대응하여 Nvidia는 Vera CPU Rack이라는 독립형 CPU 전용 랙을 출시했습니다. 이 랙은 300TBps에서 작동하는 400TB LPDDR5x 메모리에 연결된 256개의 Vera CPU를 갖추고 있습니다.

Vera CPU 랙에는 Spectrum-X 이더넷 스파인과 64개의 BlueField-4 데이터 처리 장치(DPU)도 장착되어 있습니다. 이러한 DPU는 Nvidia의 NVLink-C2C 상호 연결을 통해 NVL72 시스템의 GPU와 조정되어 회사당 PCIe Gen 6 대역폭의 7배인 1.8TBps의 일관된 대역폭을 제공합니다.

Nvidia는 Vera 랙이 22,500개의 동시 CPU 환경을 지원할 수 있어 AI 추론 및 에이전트 워크로드를 원활하게 실행하는 데 필요한 막대한 CPU 수요를 충족할 수 있다고 밝혔습니다. 랙은 액체 냉각을 사용하며 Nvidia의 MGX 참조 아키텍처를 기반으로 구축되었습니다. 이 아키텍처는 80개의 생태계 파트너가 지원하며 Nvidia의 글로벌 파트너 네트워크를 통해 배포됩니다.

Nvidia는 또한 Nvidia가 새로운 AI 슈퍼컴퓨터를 구성한다고 선전한 7개의 새로운 칩 중 하나인 BlueField-4 DPU로 가득 찬 새로운 랙을 발표했습니다. BlueField-4 STX는 GPU 메모리를 HBM에서 기본 NVMe 스토리지로 확장하는 Nvidia의 새로운 CMX(컨텍스트 메모리 스토리지) 플랫폼을 최초로 랙 규모로 구현한 것입니다. 지난 1월 CMX를 공개했으며 몇 주 전 컨퍼런스에서 CMX 스토리지 제품을 소개한 VAST Data와 같은 Nvidia의 스토리지 파트너는 Nvidia STX 참조 아키텍처를 통해 이를 채택하기 시작했습니다.


Buck은 "STX는 에이전트 워크플로에서 생성된 대규모 키 값 캐시 데이터를 저장하고 검색하는 데 최적화된 고대역폭 공유 레이어입니다."라고 말했습니다. "이것은 참조 아키텍처입니다. Nvidia는 이를 직접 제공하지는 않지만 모든 스토리지 파트너와 전체 스토리지 생태계에 [참조 아키텍처]를 제공하여 와트당 성능이 4배, 기업 데이터의 초당 페이지 수가 2배, 에이전트 워크플로우를 실행하는 AI 공장에 필요한 초당 토큰 5배를 제공하는 AI 공장용 차세대 스토리지를 구축할 수 있도록 하고 있습니다."


Nvidia는 Cloudian, DDN, Dell Technologies, Everpure(이전의 Pure Storage), Hitachi Vantara, HPE, IBM, MinIO, NetApp, Nutanix 및 WEKA가 모두 BlueField-4 STX 참조 아키텍처를 기반으로 새로운 스토리지를 구축하고 있으며 CoreWeave, Crusoe, IREN, Lambda, Mistral AI, Nebius, Oracle Cloud Infrastructure(OCI) 및 Vultr와 같은 회사가 이를 채택하고 있다고 말했습니다.


전체적으로 Nvidia는 Vera Rubin 플랫폼에서 AI를 강화하는 역할을 하는 7개의 새로운 칩을 GTC에서 선보일 예정입니다. 여기에는 Vera CPU, Rubin GPU, NVLink 6 스위치, ConnectX-9 SuperNIC, BlueField-4 DPU, Groq 3 LPU 및 실리콘 포토닉스를 통해 200Gbps 연결을 제공하는 새로운 공동 패키지 광학 이더넷 스위치인 SpectrumX CPO가 포함됩니다. Nvidia는 GTC 2025에서 SpectrumX 칩을 발표했으며 현재 생산 중이라고 CEO Jensen Huang이 기조연설에서 말했습니다.


베이징 Qianxing Jietong Technology Co., Ltd.
양샌디/글로벌 전략 이사
WhatsApp/위챗: +86 13426366826
이메일: yangyd@qianxingdata.com
웹사이트: www.qianxingdata.com/www.storagesserver.com


사업 초점:
ICT 제품 유통/시스템 통합 및 서비스/인프라 솔루션
20년 이상의 IT 유통 경험을 바탕으로 당사는 선도적인 글로벌 브랜드와 협력하여 신뢰할 수 있는 제품과 전문 서비스를 제공합니다.
“기술을 활용한 지능형 세상 구축” 신뢰할 수 있는 ICT 제품 서비스 제공업체!


선술집 시간 : 2026-03-18 14:05:18 >> 뉴스 명부
연락처 세부 사항
Beijing Qianxing Jietong Technology Co., Ltd.

담당자: Ms. Sandy Yang

전화 번호: 13426366826

회사에 직접 문의 보내기 (0 / 3000)