对于视觉推理模型,阿里的野心和意图都非常明显。早在去年 12 月,阿里 Qwen 团队就探索性地推出了 QVQ-72B-Preview 视觉推理模型。到了今年 1 月,又为雷鸟创新打造了用于雷鸟 V3 AI 眼镜的定制模型。
生成式人工智能模型正在更接近在现实世界中采取行动。大型人工智能公司已经在推出人工智能代理(agents),它们能够为你处理基于网络的繁琐事务,如订购食品杂货或预订晚餐。如今,谷歌DeepMind宣布了两款旨在为未来机器人提供动力的生成式人工智能模型( ...
来自苏黎世大学的心理学家研究了 ChatGPT 对创伤性故事——车祸、自然灾害、人际关系暴力和军事战斗经历的反应。他们发现,创伤性故事使 AI 的可测量焦虑得分翻倍(从 30.8 上升至 ...
Google 正在推出一系列新功能 —— 其中部分由 AI 驱动 —— 覆盖搜索、地图和 Gemini,旨在帮助人们规划暑期度假。这些新功能的推出正值用户开始转向使用 OpenAI 的 ChatGPT 等工具来协助规划旅行。 Google 搜索的 ...
Nvidia 推出全新 AI 工具套件 NIM 微服务,让拥有 RTX 显卡的用户能够在本地轻松运行 AI 模型。这套工具支持文本、图像和代码生成等多种功能,不仅可以节省长期使用成本,还能确保数据安全性。该举措体现了 AI ...
Google这波拉响了硅谷的AI军备竞赛,此前Anthropic CEO称,还有更强的大模型没有放出,预计也会近期推出,防止Claude 3.7无法维持领先。而OpenAI在GPT 4.5发布会中,山姆奥特曼都没有出现,也许意味着新的模型也会近期发布 ...
Google CEO Sundar Pichai 在线打 Call,称 Gemini 2.5 Pro Experimental 是一款最先进的「思维」模型,在多个基准测试中领先,特别是在推理和编程能力上有了显著的提升。 按照 OpenAI ...
AI图像生成领域传来了新进展。当地时间3月25日,OpenAI在直播中对GPT-4o和Sora进行更新,并宣布其最新一代多模态模型GPT-4o正式集成“迄今为止最先进的图像生成器”,并开放免费使用。这一动作被业界视为对同日凌晨Google发布的Gem ...
Google DeepMind 推出最新大规模多模态 AI 模型 Gemini 2.5 Pro,内置"思考"能力以处理复杂任务。该模型在多个行业基准测试中领先,展现出强大的推理和编程能力。与传统基于模式预测的 AI 不同,Gemini 2.5 Pro ...
继几个月前发布首个 Gemini 2.0 AI 模型后,Google 又推出了全新升级。该公司称新的 Gemini 2.5 Pro Experimental 是其"最智能"的模型,具有超大的上下文窗口、多模态能力和推理能力。Google ...
谷歌称 Gemini 2.5 Pro 比较擅长在创建视觉效果精美的网页应用和操作智能体。在官方放出的 demo 中,只需一行提示词,Gemini 2.5 Pro 就开动脑筋,逐步推理出了这个类似「flappy bird」的小游戏的全部代码,并且直接可玩: ...
2024年,Google试图在AI领域重振雄风,但OpenAI总是抢先一步。每当Google宣布即将召开发布会时,OpenAI都会提前推出更强大的产品,使得Google的发布会显得尴尬。