NVIDIA Output - 搜索 News

9 天on MSN

NVIDIA GeForce RTX 5080 评测：新高端卡降临，DLSS 4 表现出色

在 CES 2025 大展上，NVIDIA 推出了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。近期，IT 之家拿到了其中的 NVIDIA GeForce RTX 5080 Founders ...

4 小时

我们应如何看待DeepSeek的557.6万美元训练成本？｜甲子光年

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

15 小时

我们应如何看待DeepSeek的557.6万美元训练成本？

10 天on MSN

技嘉 GeForce RTX 5080 GAMING OC 16G 评测：DLSS 4 技术加持

在 CES 2025 大展上，英伟达推出了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。IT 之家已经拿到了技嘉 GeForce RTX 5080 GAMING OC 16G。这款显卡采用了全新一代的 ...

5 天

CCF的研讨会实录：解构DeepSeek-R1！

中国计算机学会青年计算机科学与技术论坛（CCF YOCSEF）近期组织了一场研讨会，邀请了复旦大学教授、清华大学刘知远长聘副教授、清华大学教授以及上海交通大学戴国浩副教授四位专家，从不同角度深入解析了 DeepSeek-R1 的技术突破与未来影响。

腾讯网1 天

DeepSeek用的GRPO占用大量内存？有人给出了些破解方法

选自oxen.ai作者：Greg Schoeninger编译：陈陈、泽南RTX 3080 移动版能训练哪种大模型？本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 ...

5 天

解构DeepSeek-R1：一场AI效率革命背后的技术突破

科技圈从来不缺新闻，但 DeepSeek-R1 的出现，却像一颗石子投入平静的湖面，激起了层层涟漪。这家来自中国的 AI 初创公司，以其开源的推理大模型 R1，正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 OpenAI o1 ...

腾讯网8 天

线性扩散模型LiT来了，用极简线性注意力助力扩散模型AIPC时代端侧部署

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，欢迎投稿或者联系报道。投稿邮箱：liyazhou@ ...

8 天

一场关于 DeepSeek 的高质量闭门会：比技术更重要的是愿景

2. DeepSeek 有好口碑的原因在于是第一个把复现 MoE、o1 等发出来，胜在做的早，但能不能做到最好，空间还很大。后面新的挑战在于资源有限，只能把有限的资源放在最亮眼的地方。这个团队的 research 能力、团队文化还是很好的，如果再给 ...

FIRSTonline10 天

OpenAI 指控 DeepSeek 盗窃，中国人涉嫌通过蒸馏“复制”ChatGpt：方法如下

OpenAI accusa la startup cinese DeepSeek di aver utilizzato i suoi modelli per sviluppare una tecnologia AI open-source, ...

腾讯网11 天

86 条 DeepSeek 的关键思考｜Best Ideas 开源

DeepSeek 以始料未及的速度引发了全球AI社区的狂热：R-1 的讨论还没降温，今天凌晨， DeepSeek 又发布了开源多模态模型 Janus-Pro。2 天前，拾象组织了一场聚焦于 DeepSeek的「Best Ideas 闭门讨论会」，在长达 3 个小时的讨论中，我们和顶尖AI 研究员、AI 开发者和投资人一起围绕 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果