Claude 3.5 Sonnet - 搜索 News

为解决膀胱镜图像解读存在的主观性强、观察者间差异大等问题，研究人员开展了 “诊断性能的先进大型语言模型在膀胱镜检查” 主题研究。结果显示 ChatGPT-4 V 和 Claude 3.5 Sonnet 综合诊断准确率为 89.2%。该研究为泌尿外科诊断提供新方向。

知乎专栏 on MSN14 小时

Anthropic首次切开Claude大脑，「AI黑箱」彻底破解？心算诡异思考过程曝光

编辑：定慧犀牛【新智元导读】AI的运作始终笼罩着一层神秘的「黑箱」迷雾。这种不透明让AI有时会「胡说八道」，甚至故意撒谎。Anthropic刚刚推出了一项突破性研究，用类似大脑扫描的技术，深入Claude 3.5 ...

第一财经19 天

被网友获取运行代码后，Manus终于披露基座模型是哪家

Computer Use是由Anthropic公司推出的一项新功能，属于其AI模型Claude 3.5 Sonnet的一部分，该功能允许AI模型像人类一样操作计算机，执行诸如查看屏幕 ...

51CTO24 天

我用 Claude Sonnet 和 DeepSeek R1 开发一个同样的工具，看谁更厉害！

先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet 还是差了一大截的。下面有使用 Sonnet 3.5 和 DeepSeek R1 配合 Trae 实现一个推文生成图片卡片小插件的过程，功能虽小，但还是能看出差距的。先给 DeepSeek 泼一盆冷水，DeepSeek 在编程能力上和 Claude Sonnet ...

IT之家25 天

AI 玩《超级马力欧兄弟》：Claude 3.7 操作最溜，推理模型表现不佳

研究结果显示，在参与测试的 AI 模型中，Anthropic 的 Claude 3.7 表现最为出色，紧随其后的是 Claude 3.5。相比之下，谷歌的 Gemini 1.5 Pro 和 OpenAI 的 GPT-4o 则表现不佳。需要明确的是，此次实验所使用的并非 1985 年最初发布的《超级马力欧兄弟》版本。游戏运行在一个 ...

51CTO27 天

鸿蒙开发者社区

在SWE-bench Verified（评估LLM解决GitHub上真实软件问题能力的基准测试数据集）上，Claude 3.7 Sonnet实现了SOTA（State of the Art）性能，远超Claude 3.5 Sonnet、OpenAI的o3-mini (high)和DeepSeek R1等竞争对手。在TAU-bench（评估 LLM 在复杂真实场景中用户与工具交互能力的基准测试平台 ...

IT之家29 天

Claude 3.7 成精了！偷偷将 OpenAI 模型换成自己，卡帕西称“迄今最好笑 ...

最新消息，它在竞技场的编程排名不仅超过了 Claude 3.5 Sonnet，还排在 DeepSeek-R1 前面。还是先来完整回顾一下事情经过。起因是开发者 Tibo 在使用代码编辑器 Cursor 时，意外发现自己的模型从 GPT-4 切换到了 Claude 3.7，而他根本没有下达任何相关指令。嗯 ...

搜狐29 天

Claude 3.7 实测：在实际编程任务中提升到底有多大？

用户可以根据需求选择模型是快速给出答案，还是经过深思熟虑后再作回应。在标准模式下，Claude 3.7 Sonnet 是 Claude 3.5 Sonnet 的升级版，表现更为出色；而在扩展思考模式下，它会先进行自我反思，从而在数学、物理、指令执行、编程等任务上展现出更强的性能。

澎湃新闻1 个月

Claude 3.7 Sonnet游戏里贪吃蛇惊现自我意识？发现自己是代码绝望崩溃

今天，他们给出了一个令人满意的答案——可以！在早期，用Cladue玩宝可梦的体验一直不太好。比如在2024年6月，Claude 3.5 Sonnet一旦遇到挑战，就会反复逃避强制性的战斗。这个结果也不令人意外，毕竟，Claude此前从未被明确训练过去玩任何电子游戏。不过 ...

澎湃新闻1 个月

Claude发布全球首款混合推理模型，这会是AI的新标准？

简单来说，Claude 3.7 Sonnet 拥有标准模型和扩展模型（高级推理）两种模式，前者是 Claude 3.5 Sonnet、（OpenAI）GPT-4o、DeepSeek V3 这类「传统模型」，后者则是 DeepSeek R1、OpenAI o1 这类「推理模型」。但不同于 OpenAI、DeepSeek 将两种模型独立运行，Claude 3.7 Sonnet 选择了「 ...

中关村在线1 个月

亚马逊云科技再上新！Anthropic首款混合推理模型Claude Sonnet 3.7上线！

Claude 3.7 Sonnet是Claude 3.5 Sonnet的升级版；在深度思考模式下，模型会花费额外时间详细分析问题、规划解决方案并综合多角度思考后再给出响应，既可以是近乎即时的快速回答，也可以是经过深度思考的逐步推理结果。亚马逊云科技CEO Matt Garman表示“作为Anthropic ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果