根据谷歌博客展示,Gemini 2.5 Pro 在创建视觉上吸引人的 Web 应用程序和智能体代码应用方面表现尤为出色。例如,它能够利用其推理能力,从一行提示中生成完整的视频游戏可执行代码。在专业代码评估基准 SWE-Bench Verified 上 ...
生成式人工智能模型正在更接近在现实世界中采取行动。大型人工智能公司已经在推出人工智能代理(agents),它们能够为你处理基于网络的繁琐事务,如订购食品杂货或预订晚餐。如今,谷歌DeepMind宣布了两款旨在为未来机器人提供动力的生成式人工智能模型( ...
Gemini Robotics系列模型特别强调了空间意识和三维物理理解能力,例如,能够预测物体轨迹和从不同角度识别同一物体。该模型不仅基于 海量数据 进行训练,还通过数千小时的实际远程操控进行了优化。测试表明,采用Gemini Robotics系列模型的机器人在熟悉和不熟悉的任务上的表现均超越了当前顶尖竞争对手,特别是在处理像折纸这样的精细任务时,采用Gemini ...
各个科技公司正不断推出新的应用场景和能力。尽管最初被OpenAI刺激而被动反应,但凭借深厚的技术积累和广泛的用户基础,Google正逐渐重新确立其在AI领域的领导地位。在这场AI竞赛中,Google用Gemini的亮眼表现证明了自己依然是绝对的主力选手,而且底子依然足够厚,正在展示出赢得这场比赛的实力和决心。
这次演示是来自 Google、Meta 等科技巨头以及 Figure AI、Agility Robotics 等初创公司新一波人形机器人浪潮的一部分。这些机器人被定位为物流和家务的未来解决方案。除了 飞行汽车 ...
回望两年多前,2022 年年底,形势却截然不同。当时,OpenAI 发布 ChatGPT 引发全球轰动,谷歌内部陷入罕见的恐慌。一家在 AI 基础研究领域长期领先的科技巨头,突然发现自己在面向大众的 AI 产品竞争中落后了。如今,Gemini 2.5 ...
谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。 谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。 据谷歌介绍,其中一款名为Gemini Robotics,是一款视觉-语言-行动模型,能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务 ...