生成式人工智能模型正在更接近在现实世界中采取行动。大型人工智能公司已经在推出人工智能代理(agents),它们能够为你处理基于网络的繁琐事务,如订购食品杂货或预订晚餐。如今,谷歌DeepMind宣布了两款旨在为未来机器人提供动力的生成式人工智能模型( ...
回望两年多前,2022 年年底,形势却截然不同。当时,OpenAI 发布 ChatGPT 引发全球轰动,谷歌内部陷入罕见的恐慌。一家在 AI 基础研究领域长期领先的科技巨头,突然发现自己在面向大众的 AI 产品竞争中落后了。如今,Gemini 2.5 ...
谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。 谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。 据谷歌介绍,其中一款名为Gemini Robotics,是一款视觉-语言-行动模型,能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务 ...
4 天
至顶头条 on MSNAI 机器人即将到来,但世界尚未做好准备虽然当前展示的重点是机械臂而非完整的人形机器人,但其底层技术与下一代人形机器人所使用的技术是相同的。Google 表示,其 Gemini Robotics 模型旨在"轻松适应不同类型的机器人",目前已在 Apptronik 的人形机器人 Apollo ...
根据谷歌博客展示,Gemini 2.5 Pro 在创建视觉上吸引人的 Web 应用程序和智能体代码应用方面表现尤为出色。例如,它能够利用其推理能力,从一行提示中生成完整的视频游戏可执行代码。在专业代码评估基准 SWE-Bench Verified 上 ...
Teradyne Robotics 在 NVIDIA GTC 2025 上推出的 AI 加速器解决方案,是协作机器人技术的一次里程碑式突破,也为 Physical AI 的商业化落地提供了生动注脚··· NVIDIA GTC 2025 大会上,Teradyne Robotics 携手旗下 Universal Robots (UR) 和 Mobile Industrial Robots (MiR ...
Gemini Robotics系列模型特别强调了空间意识和三维物理理解能力,例如,能够预测物体轨迹和从不同角度识别同一物体。该模型不仅基于 海量数据 进行训练,还通过数千小时的实际远程操控进行了优化。测试表明,采用Gemini Robotics系列模型的机器人在熟悉和不熟悉的任务上的表现均超越了当前顶尖竞争对手,特别是在处理像折纸这样的精细任务时,采用Gemini ...
各个科技公司正不断推出新的应用场景和能力。尽管最初被OpenAI刺激而被动反应,但凭借深厚的技术积累和广泛的用户基础,Google正逐渐重新确立其在AI领域的领导地位。在这场AI竞赛中,Google用Gemini的亮眼表现证明了自己依然是绝对的主力选 ...
虽然利用AI Agent完成任务并非Manus独创,但它把多智能体协同做成产品,将多个AI能力整合进产品当中,并通过简易化人机交互来完成复杂任务,其产品的设计思路值得我们每一位从业者去思考,这一点不光聚焦在大语言模型范畴,对于机器人行业亦是如此。
潇湘晨报 on MSN6 天
“大脑”升级后,机器人“闭眼”扣篮编译 | 李木子 日前,谷歌DeepMind已将大型语言模型(LLM)Gemini应用于机器人。该公司表示,借助该模型,机器人无须观察其他机器人的动作就可以完成某些任务。例如,将迷你篮球“扣”入桌面上的篮筐。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果