久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

英偉達(dá)宣布推出Groq 3 LPU推理芯片

DoNews3月17日消息,在 3 月 17 日美國圣何塞舉行的GTC主題演講中,黃仁勛透露了英偉達(dá)如何利用 2025 年從 Groq 收購的知識產(chǎn)權(quán)來擴(kuò)展 Rubin 的功能。

Rubin 平臺現(xiàn)在包含一款新的芯片——英偉達(dá) Groq 3 LPU,這是一款推理加速器,能夠增強(qiáng)這些系統(tǒng)以低延遲、大批量的方式交付令牌的能力,從而在人工智能模型的前沿實現(xiàn)高交互性。

與大多數(shù)依賴 HBM 作為工作內(nèi)存層的 AI 加速器不同,每個 Groq 3 LPU 都集成了 500 MB 的 SRAM,這種內(nèi)存也用于 CPU 和 GPU 的超高速緩存。

雖然與每個 Rubin GPU 上容量高達(dá) 288GB 的 HBM4 相比,這顯得微不足道,但這塊 SRAM 可提供 150 TB/s 的帶寬,遠(yuǎn)高于 HBM 的 22 TB/s。對于帶寬敏感型 AI 解碼操作而言,Groq 3 芯片帶寬的大幅提升為推理應(yīng)用帶來了誘人的優(yōu)勢。

反過來,英偉達(dá)將構(gòu)建包含 256 個 Groq 3 LPU 的 Groq 3 LPX 機(jī)架。該機(jī)架提供 128GB 的 SRAM 和 40 PB/s 的推理加速帶寬,并通過每個機(jī)架 640 TB/s 的專用擴(kuò)展接口將這些芯片連接起來。

英偉達(dá)將 Groq LPX 設(shè)想為 Rubin 的協(xié)處理器,據(jù)英偉達(dá)超大規(guī)模副總裁 Ian Buck 稱,它將提升“每個令牌上 AI 模型每一層”的解碼性能,并使 Rubin 能夠服務(wù)于人工智能的下一個前沿領(lǐng)域:多智能體系統(tǒng),這些系統(tǒng)需要在推理數(shù)萬億個參數(shù)的模型的同時,在數(shù)百萬個token的上下文窗口中提供交互式性能。

隨著多智能體系統(tǒng)中的人工智能代理越來越多地與其他人工智能進(jìn)行交互,而非與查看聊天機(jī)器人窗口的人類進(jìn)行交流,對響應(yīng)速度的要求也隨之改變。

對人類而言看似合理的每秒token生成速率,對人工智能代理來說卻如同蝸牛爬行。在巴克所描述的未來多智能體系統(tǒng)中,Rubin GPU 和 Groq LPU 的組合將人工智能代理間通信的吞吐量從每秒 100 個token提升到每秒 1500 個token甚至更高。

英偉達(dá)宣布推出Groq 3 LPU推理芯片
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1