site:www.51cto.com - 搜索 News

5 小时

千问给我的答案非常简单，基于我的伪代码做了简单的润色，生成的结果有点呆，假如是以前的我，会觉得也能接受，但当我体验完 DeepSeek 之后，我的选择有了方向。

15 小时

它是一种模型压缩技术，通过将一个复杂的、计算开销大的大模型（称为教师模型）的知识“蒸馏”到一个更小、更高效的模型（称为学生模型）。这个过程的核心目标是让学生模型在轻量化的同时，尽量保留教师模型的性能。

15 小时

DeepSeek 横空出世，一下子受到全球关注，1 月 27 日美股闪崩，AI 第一股英伟达最高跌幅达 17%，国内 AI 用户这个春节都在体验 DeepSeek，DeepSeek 服务器甚至卡到宕机。这到底是什么力量在推动呢？

8 天

为此，Scale AI和CAIS推出了名为「人类最后的考试」（Humanity's Last Exam）的多模态基准测试，旨在成为这类封闭式学术基准测试的最终版本，覆盖广泛的学科领域。

7 天

微软已通过发布更新版本的 fvevol.sys 驱动程序解决了此漏洞。该补丁引入了一种验证机制，确保 dumpfve.sys 仍然列在 DumpFilters 注册表值中。如果它丢失或损坏，Windows ...

8 天

就说这个本周刚发布的 DeepSeek R1，它没有任何监督训练的纯强化学习路线令人震撼，从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力，似乎是很快达成的事。

13 天

就在刚刚，Kimi发布了k1.5 多模态思考模型。这是继去年 11 月他们发布 k0-math 数学模型，12月发布 k1 视觉思考模型之后，连续第三个月带来 k 系列强化学习模型的重磅升级。

7 天

测试时训练等价于原强化学习，这个视角提供了多方面的有价值见解：（1）优化测试时计算资源时，与信息增益相关的中间过程奖励的作用；（2）模型崩溃和预训练初始化在学习meta策略中的作用；以及（3）缺乏外部反馈的情况下，不对称性如何成为测试时改进的驱动力。

7 天

近日，据著名安全博主Krebs爆料，支付巨头万事达卡（MasterCard）存在一个持续近五年的DNS配置错误，差点让这艘戒备森严的金融巨轮陷入万劫不复的深渊。

8 天

3、独特的公司文化和人才战略： DeepSeek保持着一个完全自下而上的组织结构，为研究人员提供无限的计算资源，优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才，而非海外招聘。

11 天

值得一提的是，Forrester Research的2024年AI现状调查，为我们带来了新的思路与启示。调研显示，三分之二的受访者认为其组织的AI项目投资回报率即使未达到50%，也可以认为是成功的。对于初创企业而言，无疑是一个积极的信号。

10 天

本次推出的 SmolVLM-256M-Instruct 仅有 2.56 亿参数，是有史以来发布的最小视觉语言模型，可以在内存低于 1GB 的 PC 上运行，提供卓越的性能输出。 SmolVLM-500M-Instruct 仅有 5 ...

一些您可能无法访问的结果已被隐去。