对于运行Llama模型的Hopper架构系统,英伟达声称Dynamo可以有效使推理性能翻倍。而对于较大的Blackwell NVL72系统,GPU巨头声称在启用该框架的情况下,DeepSeek-R1相比Hopper具有30倍的优势。
具体到Blackwell系列工作站和服务器 GPU ,英伟达在去年3月发布了AI芯片与超级计算平台Blackwell架构,并推出了GB200芯片。 此外,英伟达还公布了继Hopper、Blackwell之后的下一代GPU架构Rubin——以在暗物质研究领域取得突破性进展的天文学家Vera Rubin命名,以及Rubin Ultra的计划配置。
3月17日到21日,英伟达年度 GPU 技术大会(GTC)召开。公司发布了全新的Blackwell Ultra GPU,以及在此基础上衍生的应用于推理、Agent的服务器SKU,也包括基于Blackwell架构的RTX全家桶。其中值得注意的是几款新产品的路线图,包括GB300以及Vera Rubin(包括标准版Rubin以及Rubin Ultra)。
为了提升效率,英伟达在软件上也有创新,提出了「AI 工厂的操作系统」——NVIDIA Dynamo。它是一个「分布式推理服务库」,而且是一个开源解决方案,解决的是用户需要 token 但无法提供足够 token 的问题。据介绍,Dynamo ...
(以下内容从中国银河《通信:CPO有望大幅降低能耗成本,运营商经营稳健》研报附件原文摘录) 一周通信板块指数下跌,北斗导航子板块相关标的表现较好。本周上证指数涨跌幅为1.60%;深证成指跌幅为2.65%;创业板指数跌幅为3.34%;一级行业指数中,通信板块跌幅为3.85%。根据我们对于通信行业公司划分子板块数据,北斗导航子板块相关标的表现较好,板块涨幅为2.76%。通信板块个股中,上涨、维持和下跌 ...
1 天
至顶头条 on MSN深入解析 Nvidia 的 AI 推理"操作系统"DynamoNVIDIA 在 GTC 大会上发布了 Dynamo 软件框架,这是一个专为解决大规模 AI 推理挑战而设计的开源系统。CEO 黄仁勋将其比作"AI 工厂的操作系统",它能够优化 TensorRT LLM 等推理引擎,实现跨多 GPU ...
英伟达早在2022年GTC大会就公布了基于光纤的NVLink计划。公司内部已建成至少一个此类集群,但由于重定时光模块功耗过高,未能大规模推广。虽然去除DSP是重要进步,但仍需持续技术突破。这也解释了英伟达为何冒险押注MRM等新技术。鉴于Scale-up能力对AI集群的重要性,英伟达可能正在研究一系列创新光学技术。 NVLink ...
在近期于美国举办的英伟达开发者大会(GTC)首日,英伟达的首席执行官黄仁勋向全球宣布了一个重要消息:继Blackwell之后,下一代名为Vera Rubin的AI数据中心芯片计划将于2026年下半年正式面世。这款全新的GPU架构,得益于NVLink ...
美国当地时间3月18日,英伟达开发者大会(GTC)首日,英伟达 CEO黄仁勋公布了Blackwell之后下一代GPU架构Rubin AI数据中心芯片的计划面世时间。英伟达预计,名为Vera ...
在科技狂潮中,英伟达再一次引领风骚!2025年3月18日是一个值得铭记的日子——英伟达开发者大会(GTC)首日,CEO黄仁勋在会上宣布了Blackwell之后的下一代GPU架构Rubin的辉煌计划!这颗名为Vera Rubin的新芯片预计将于2026年下半年正式面世,所配备的NVLink 144技术将使其性能较前代翻倍,速度则是去年Blackwell架构的两倍!
一些您可能无法访问的结果已被隐去。
显示无法访问的结果