搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
过去 30 天
时间不限
过去 1 小时
过去 24 小时
过去 7 天
按相关度排序
按时间排序
5 小时
DeepSeek 实现任务调度分片算法 , 灵性十足,远超预期
千问给我的答案非常简单,基于我的伪代码做了简单的润色,生成的结果有点呆,假如是以前的我,会觉得也能接受,但当我体验完 DeepSeek 之后,我的选择有了方向。
15 小时
硅谷掀桌!DeepSeek遭OpenAI和Anthropic围剿,美国网友都看不下去了
它是一种模型压缩技术,通过将一个复杂的、计算开销大的大模型(称为教师模型)的知识“蒸馏”到一个更小、更高效的模型(称为学生模型)。 这个过程的核心目标是让学生模型在轻量化的同时,尽量保留教师模型的性能。
15 小时
DeepSeek 火爆了,主打高性能低价格!
DeepSeek 横空出世,一下子受到全球关注 ,1 月 27 日美股闪崩 ,AI 第一股英伟达最高跌幅达 17%, 国内 AI 用户这个春节都在体验 DeepSeek,DeepSeek 服务器甚至卡到宕机。这到底是什么力量在推动呢?
8 天
人类最后一次考试,AI惨败正确率<10%!数百顶级专家联手出题 ...
为此,Scale AI和CAIS推出了名为「人类最后的考试」(Humanity's Last Exam)的多模态基准测试,旨在成为这类封闭式学术基准测试的最终版本,覆盖广泛的学科领域。
7 天
请尽快更新:新漏洞可攻破微软 Windows 10 / Windows 11 BitLocker 加密防线 ...
微软已通过发布更新版本的 fvevol.sys 驱动程序解决了此漏洞。该补丁引入了一种验证机制,确保 dumpfve.sys 仍然列在 DumpFilters 注册表值中。如果它丢失或损坏,Windows ...
8 天
物理测试暴击AI圈,DeepSeek R1稳超o1、Claude,我们已进入RL黄金时代
就说这个本周刚发布的 DeepSeek R1,它没有任何监督训练的纯强化学习路线令人震撼,从去年 12 月 Deepseek-v3 基座发展到如今堪比 OpenAI o1 的思维链能力,似乎是很快达成的事。
13 天
Kimi硬刚多模态满血版o1,首曝训练细节!强化学习scaling新范式诞生
就在刚刚,Kimi发布了k1.5 多模态思考模型。这是继去年 11 月他们发布 k0-math 数学模型,12月发布 k1 视觉思考模型之后,连续第三个月带来 k 系列强化学习模型的重磅升级。
7 天
28年AGI撞上数据墙,以后全靠测试时计算?CMU详解优化原理
测试时训练等价于原强化学习,这个视角提供了多方面的有价值见解:(1)优化测试时计算资源时,与信息增益相关的中间过程奖励的作用;(2)模型崩溃和预训练初始化在学习meta策略中的作用;以及(3)缺乏外部反馈的情况下,不对称性如何成为测试时改进的驱动力。
7 天
万事达卡爆出致命DNS错误配置
近日,据著名安全博主Krebs爆料,支付巨头万事达卡(MasterCard)存在一个持续近五年的DNS配置错误,差点让这艘戒备森严的金融巨轮陷入万劫不复的深渊。
8 天
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿 ...
3、独特的公司文化和人才战略: DeepSeek保持着一个完全自下而上的组织结构,为研究人员提供无限的计算资源,优先看创造热情而不是证书。他们的突破性创新来自年轻的本土人才——中国本土的应届毕业生和年轻技术人才,而非海外招聘。
11 天
助力初创企业破局:NVIDIA 2025年预测洞察AI未来关键趋势
值得一提的是,Forrester Research的2024年AI现状调查,为我们带来了新的思路与启示。调研显示,三分之二的受访者认为其组织的AI项目投资回报率即使未达到50%,也可以认为是成功的。对于初创企业而言,无疑是一个积极的信号。
10 天
Hugging Face 最小 AI 视觉语言模型登场:2.56 亿参数,内存低于 1GB PC 也 ...
本次推出的 SmolVLM-256M-Instruct 仅有 2.56 亿参数,是有史以来发布的最小视觉语言模型,可以在内存低于 1GB 的 PC 上运行,提供卓越的性能输出。 SmolVLM-500M-Instruct 仅有 5 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈