Sonnet 1 Model - 搜索 News

7 天on MSN

在近日的大模型竞技场中，一款来自中国的AI模型引起了广泛关注。这款名为Qwen2.5-Max的模型，由阿里巴巴公司推出，成功超越了多个国际知名模型，包括DeepSeek-V3、Claude 3.5 Sonnet以及Llama 3.1 ...

腾讯网4 天

对DeepSeek和智能下半场的几条判断

作者：李广密编辑：penny，Siqi从 24Q3 开始我们就一直在讲 AI 的下半场，虽然 OpenAI o1 提出了 RL 叙事，但因为各种原因没有破圈，DeepSeek R1 解了 RL ...

IT之家20 天

字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet

全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。目前，Doubao-1.5-pro 已在豆包 App 灰度上线，同时开发者也可在火山引擎直接调用 API 。据字节跳动官方介绍，豆包大模型 1.5 Pro ...

51CTO20 天

字节跳动豆包大模型 1.5 Pro 发布，综合得分优于 GPT-4o、Claude 3.5 Sonnet

字节跳动旗下豆包大模型 1.5 Pro 正式发布，全新 Doubao-1.5-pro 模型增强了综合能力，在知识、代码、推理、中文等多个测评基准上，综合得分优于 GPT-4o、Claude 3.5 Sonnet 等模型。 1 月 22 日消息，字节跳动旗下豆包大模型 1.5 Pro 今日正式发布，全新 Doubao-1.5-pro 模型 ...

腾讯网4 天

DeepSeek之后的几个判断

先说下，我们昨天在公众号和星球都说了Deepseek 3000万DAU，不同渠道验证了下，没毛病。数据还在涨，而且没算外围间接用户。这说明一件事：中国依然是那个最大的to ...

搜狐7 天

杭州超越杭州：阿里Qwen2.5-Max反超DeepSeek-V3！网友：中国AI正在快速 ...

同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型 ... 并遥遥领先于Llama 3.1-405B。至于base model，Qwen2.5-Max在大多数基准测试中，也都展现出了显著 ...

4 小时

DeepMind也酸了？CEO怒喷 DeepSeek 成本是炒作：很多技术都来自谷歌和DeepMind

就在最近，谷歌 DeepMind 围绕 DeepSeek 模型成果及其低成本所发表的看法再一次受到关注与热议。2 月 9 日，谷歌 DeepMind 首席执行官 Demis Hassabis 在一场活动上表示，DeepSeek 的人工智能模型 ...

20 天

豆包发布大模型 1.5 Pro ，实测后我发现这个国产 AI 用最「笨」的方法 ...

今天，字节跳动旗下的豆包大模型 1.5 Pro 正式亮相，不仅全面升级了模型的核心能力，也融合并进一步提升了多模态能力，在多项公开评测基准中也是全球领先水平。这次发布的豆包大模型 1.5 系列产品线包括： ...

来自MSN21 小时

什么是DeepSeek-R1精炼模型？

什么是蒸馏？模型蒸馏是机器学习（ML）中一种将知识从大型、复杂模型（通常称为教师模型）转移到较小、较简单模型（称为学生模型）的技术。目标是创建一个较小的模型，在保持较大模型大部分性能的同时，在计算资源、内存使用和推理速度方面更加高效。

1 天

AMD Instinct数据中心GPU第一时间支持DeepSeek！FP8高性能提升显著

据介绍，DeepSeek-V3是一种强大的开源混合专家MoE模型，共有6710亿个参数，是目前开源社区最受欢迎的多模态模型之一，凭借创新的模型架构，打破了高效低成本训练的记录，获得整个行业交口称赞。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果