搜索优化
English
全部
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
搜索
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
9 天
on MSN
NVIDIA GeForce RTX 5080 评测:新高端卡降临,DLSS 4 表现出色
在 CES 2025 大展上,NVIDIA 推出了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。近期,IT 之家拿到了其中的 NVIDIA GeForce RTX 5080 Founders ...
4 小时
我们应如何看待DeepSeek的557.6万美元训练成本?|甲子光年
简单来说,DeepSeek-V3仅使用了2048块英伟达H800 GPU,耗费了557.6万美元就完成了训练,相比同等规模的模型(如GPT-4、GPT-4o、Llama 3.1),训练成本大幅降低。
15 小时
我们应如何看待DeepSeek的557.6万美元训练成本?
简单来说,DeepSeek-V3仅使用了2048块英伟达H800 GPU,耗费了557.6万美元就完成了训练,相比同等规模的模型(如GPT-4、GPT-4o、Llama 3.1),训练成本大幅降低。
10 天
on MSN
技嘉 GeForce RTX 5080 GAMING OC 16G 评测:DLSS 4 技术加持
在 CES 2025 大展上,英伟达推出了基于 Blackwell 架构的 GeForce RTX 50 系列游戏显卡。IT 之家已经拿到了技嘉 GeForce RTX 5080 GAMING OC 16G。这款显卡采用了全新一代的 ...
5 天
CCF的研讨会实录:解构DeepSeek-R1!
中国计算机学会青年计算机科学与技术论坛(CCF YOCSEF)近期组织了一场研讨会,邀请了复旦大学教授、清华大学刘知远长聘副教授、清华大学教授以及上海交通大学戴国浩副教授四位专家,从不同角度深入解析了 DeepSeek-R1 的技术突破与未来影响。
腾讯网
1 天
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法
选自oxen.ai作者:Greg Schoeninger编译:陈陈、泽南RTX 3080 移动版能训练哪种大模型?本文为那些 GPU 资源有限时使用 GRPO 训练的开发者提供了宝贵的指导。自 DeepSeek-R1 ...
5 天
解构DeepSeek-R1:一场AI效率革命背后的技术突破
科技圈从来不缺新闻,但 DeepSeek-R1 的出现,却像一颗石子投入平静的湖面,激起了层层涟漪。这家来自中国的 AI 初创公司,以其开源的推理大模型 R1,正在搅动全球 AI 格局。R1 不仅拥有媲美甚至超越 OpenAI o1 ...
腾讯网
8 天
线性扩散模型LiT来了,用极简线性注意力助力扩散模型AIPC时代端侧部署
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传播。如果您有优秀的工作想要分享,欢迎投稿或者联系报道。投稿邮箱:liyazhou@ ...
8 天
一场关于 DeepSeek 的高质量闭门会:比技术更重要的是愿景
2. DeepSeek 有好口碑的原因在于是第一个把复现 MoE、o1 等发出来,胜在做的早,但能不能做到最好,空间还很大。后面新的挑战在于资源有限,只能把有限的资源放在最亮眼的地方。这个团队的 research 能力、团队文化还是很好的,如果再给 ...
FIRSTonline
10 天
OpenAI 指控 DeepSeek 盗窃,中国人涉嫌通过蒸馏“复制”ChatGpt:方法如下
OpenAI accusa la startup cinese DeepSeek di aver utilizzato i suoi modelli per sviluppare una tecnologia AI open-source, ...
腾讯网
11 天
86 条 DeepSeek 的关键思考 |Best Ideas 开源
DeepSeek 以始料未及的速度引发了全球AI社区的狂热:R-1 的讨论还没降温,今天凌晨, DeepSeek 又发布了开源多模态模型 Janus-Pro。2 天前,拾象组织了一场聚焦于 DeepSeek的「Best Ideas 闭门讨论会」,在长达 3 个小时的讨论中,我们和顶尖AI 研究员、AI 开发者和投资人一起围绕 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈