Technical Report - 搜索 News

2025年这个春节，DeepSeek一举改写了全球AGI大叙事。在万般热闹之际，我们特别想沉下来做一些基础科普工作。在《商业访谈录》89集节目中，我邀请了加州大学伯克利分校人工智能实验室在读博士生潘家怡，为大家对照解读了春节前的DeepSeek-R1-Zero、R1、Kimi发布的K1.5，以及OpenAI更早发布的o1技术报告。这些模型聚焦的都是 ...

腾讯网3 天

DeepSeek风暴卷起，“特斯拉们”会被颠覆吗？

春节期间最火爆的事件，就是DeepSeek掀起的AI滔天巨浪。DeepSeek的开源AI大模型DeepSeek ...

腾讯网4 天

漫谈DeepSeek及其背后的核心技术

为了在负载均衡和模型性能之间取得更好的平衡，DeepSeek开创了一种无辅助损失的负载均衡策略：为每个专家引入一个偏差项，并将其添加到相应的亲和力分数中以确定top-K路由，具体来说：如果其对应的专家过载，我们将偏差项减少γ；如果其对应的专家负载不足 ...

9 小时

涉案2410亿！小马表弟、菲众议长被控贪污及伪造立法文件

近日，菲律宾众议院议长罗穆亚尔德斯及另外三名众议员被控违反《反贪污和腐败行为法》及《修订刑法》第170条，涉嫌在2025年国家预算案中非法插入2410亿比索（约310亿元人民币）的预算条目。

4 天

吴恩达：DeepSeek 启示

大约一周前，DeepSeek 发布了 DeepSeek-R1，这是一款性能对标 OpenAI o1 的杰出模型，且以 MIT 许可协议开放权重。通过 Qwen（我的团队已使用数月）、Kimi、InternVL 和 DeepSeek ...

2 天

我们应如何看待DeepSeek的557.6万美元训练成本？｜甲子光年

简单来说，DeepSeek-V3仅使用了2048块英伟达H800 GPU，耗费了557.6万美元就完成了训练，相比同等规模的模型（如GPT-4、GPT-4o、Llama 3.1），训练成本大幅降低。

See Hua Daily News4 天

林德宜：美国能阻挡中国AI新星DeepSeek吗？

2025年1月20日，当西方科技巨头齐聚特朗普的总统就职典礼时，一家名不见经传的中国人工智慧（AI）公司——DeepSeek（深度求索)，悄然发布了其R1模型的人工智能开源版本，并附上技术报告及不受限制的商业使用许可证。这不仅仅是普通的AI应用程式。其在多项核心指标上可以OpenAI的Cha ...

证券之星6 天

Solid results despite supply chain constraints; expect for another strong year in 2025

Solid results despite supply chain constraints; expect for another strong year in 2025 ...

3 天

DeepSeek为何老少皆宜：只因有三宝

如何跟不了解科技行业的亲朋好友简单易懂地讲清楚 DeepSeek，颇花费了我一番脑汁，但效果还不错，比如我妈听完后一拍大腿表示：八成懂了！（咳咳，有一说一，回答这个问题还是比“为什么不结婚/生小孩”，简单多了……ㄟ (▔,▔)ㄏ ...

SHINE3 天

Ski mountaineering to make debut at Asian Winter Games

Ski mountaineering, a blend of alpine skiing and mountain climbing, is set to make its official debut at the 9th Asian Winter ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果