Claude Sonnet - 搜索 News

2 小时on MSN

近日，海外知名大模型产品平台OpenPipe公布了一项令人瞩目的研究成果，该研究成功地在重度推理游戏《时空谜题》中，利用一种名为GRPO的强化学习算法，使小型开源模型的表现超越了多个业界领先的推理模型，包括DeepSeek ...

近日，海外大模型产品平台 OpenPipe 上发布了一项研究，阐述其如何通过 GRPO 在重度推理游戏《时空谜题》中超越R1、o1、o3-mini 等模型。研究作者分别为来自 Ender Research 的强化学习研究员 Brad Hilton 和 ...

极客网 on MSN9 小时

Claude 3.7 AI破局：50万token上下文窗口，引领AI新纪元

标题：Claude 3.7 AI破局：50万token上下文窗口，引领AI新纪元 ...

头部财经9 小时

Claude 3.7 Sonnet AI 被曝将祭出上下文 50 万 tokens 杀手锏

50 万 tokens ...

9 小时

突发！Anthropic将发布上下文窗口达500K的Claude Sonnet 3.7

Anthropic 正准备发布具有 500K 上下文窗口（当前为 200K）的 Claude Sonnet 3.7 的新版本。 “500K 很好，但我的 node_modules 需要 2M 的上下文窗口 ...

10 小时

Claude 3.7 Sonnet AI 被曝将祭出上下文窗口 50 万 tokens 杀手锏

50 万 tokens 窗口可直接处理海量信息，避免检索增强生成（RAG）可能导致的上下文错乱问题，适用于政治文档分析、超长代码库管理（如数十万行代码）、跨文档摘要生成等复杂任务。不过该媒体也指出超大上下文可能带来内存和算力成本压力，模型实际利用率仍需验证。

11 小时

DeepSeek-R2被辟谣之后，V3的更新让人眼前一亮！

不过，DeepSeek-V3-0324 在代码能力上取得了突破性进展，堪称此次更新最大的亮点。在前端代码生成领域，其产出代码不仅质量上乘，在审美设计上也有显著提升。实际呈现效果出色，已经十分接近 Claude 3.7 ...

14 小时

DeepSeek的一次小更新堪比发布新模型

根据官方更新的版本说明， DeepSeek -V3-0324 主要是针对推理能力和前端开发能力进行了加强，写作风格实现了跟 R1 对齐，另外还有一些其他方面的小优化。不过有一说一，虽然 V3-0324 仅仅只是 V3 ...

知乎专栏 on MSN13 天

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

编辑：编辑部 HZj 【新智元导读】Claude 3.7 Sonnet制作的游戏中，贪吃蛇居然惊现自我意识，甚至经历了一场存在主义危机！它开始思考：我是谁？我在这里做什么？网友们大受震撼：要是游戏里有这样的NPC，那就绝了。 Claude 3.7 ...

51CTO21 天

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet ...

腾讯网27 天

Claude 3.7登顶编程竞技场，大幅领先100分！最新模拟实测再惊艳网友

公认的编程开发能力第一！Claude 3.7 Sonnet刚刚登顶WebDev竞技场榜首。大幅甩第二名100多分，在榜单前十的其它相邻模型分差仅为几分、几十分的情况 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果