搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
华尔街见闻 on MSN
2 天
最新全球模型榜单:阿里 Qwen2.5-Max超DeepSeek V3
在最新的全球大模型榜单中,阿里的最新大语言模型Qwen2.5-Max排名第7,领先于DeepSeek V3、O1-Mini和Claude-3.5-Sonnet等顶级专有大语言模型,在数学和编程方面排名第一,在处理复杂任务的硬提示(hard ...
腾讯网
14 小时
千万不要尝试 Qwen2.5-Max,你会因此忘掉 DeepSeek V3
就在 DeepSeek v3 发布一个月后,老牌霸主阿里云通义千问团队放出了 Qwen2.5 系列的最强旗舰模型——Qwen2.5-Max,在难以作弊的 Arena 榜单上,超越 DeepSeek V3。这里多扯一嘴,Arena ...
腾讯网
1 天
反超 DeepSeek-V3,新发布的 Qwen2.5-Max 到底有多牛?
内容编辑丨特工少女模型测评丨特工小鹏春节假期期间,除了万众瞩目的 DeepSeek 之外,还有一款模型的发布也不容忽视,它就是 Qwen2.5-Max。https://qwenlm.github.io/blog/qwen2.5-max/该模型采用 ...
2 天
on MSN
阿里Qwen2.5-Max大模型竞技场夺魁,中国AI实力获赞快速赶超
在近日的大模型竞技场中,一款来自中国的AI模型引起了广泛关注。这款名为Qwen2.5-Max的模型,由阿里巴巴公司推出,成功超越了多个国际知名模型,包括DeepSeek-V3、Claude 3.5 Sonnet以及Llama 3.1 ...
2 天
最新全球模型榜单:阿里Qwen2.5-Max超DeepSeek V3!又一国产大模型海外 ...
Qwen-Max是阿里云通义团队对MoE模型的最新探索成果,新模型展现出极强劲的综合性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中,Qwen2.5-Max比肩C ...
3 天
又一中国模型赶超OpenAI!Qwen2.5-Max数学编程能力全球出众
在全球人工智能竞争愈演愈烈的背景下,4日凌晨,三方基准测试平台ChatbotArena公布了最新的大模型盲测榜单,这一消息引发了广泛关注。来自阿里云通义团队的Qwen2.5-Max在这次测试中表现出色,以1332分位列全球第七,是非推理类中国大模型中 ...
2 天
全球第一:阿里云宣布通义千问 Qwen2.5-Max 数学及编程能力登顶最新 AI ...
IT之家 2 月 5 日消息,1 月 29 日新年之际,阿里云公布了其全新的通义千问 Qwen 2.5-Max 超大规模 MoE 模型,号称在多个基准测试中超越 DeepSeek V3 等竞争对手。 阿里云今日宣布,Qwen2.5-Max 在 ...
wap.stockstar
3 天
超DeepSeek V3!阿里云Qwen2.5-Max闯入全球盲测榜单前十
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek ...
3 天
中国模型崛起!阿里Qwen2.5-Max数学及编程能力全球第一
2月4日凌晨,三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,一周前刚发布的Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,也是非推理类的中国大模型冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hard prompts)方面排名第二。
sinchew
8 天
阿里巴巴发布Qwen2.5-Max 号称比Deepseek与ChatGPT更强
(北京29日法新电)中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3及OpenAI的AI技术模式GPT-4o等其他模型。阿里云周三凌晨在微信公众号宣布,Qwen ...
Lianhe Zaobao
9 天
阿里云初一发布通义千问旗舰版模型Qwen2.5-Max
中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。
每经网
3 天
中国模型崛起!阿里Qwen2.5-Max数学及编程能力赶超OpenAI
Qwen2.5-Max是阿里云通义团队约一周前发布的最新MoE模型,展现出极强劲的性能。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等主流基准测试中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈