生成式人工智能模型正在更接近在现实世界中采取行动。大型人工智能公司已经在推出人工智能代理(agents),它们能够为你处理基于网络的繁琐事务,如订购食品杂货或预订晚餐。如今,谷歌DeepMind宣布了两款旨在为未来机器人提供动力的生成式人工智能模型( ...
谷歌宣布推出两款基于Gemini 2.0的新型人工智能(AI)模型,旨在开发更灵活、可互动的机器人,有望推动机器人在更多场景中的应用和普及。 谷歌表示,最新的AI模型是为各种形状的机器人设计的,包括人形机器人和工厂、仓库中使用的其他类型的机器人。 据谷歌介绍,其中一款名为Gemini Robotics,是一款视觉-语言-行动模型,能够通过物理动作输出结果,使机器人可以理解自然语言指令并执行复杂任务 ...
Gemini Robotics系列模型特别强调了空间意识和三维物理理解能力,例如,能够预测物体轨迹和从不同角度识别同一物体。该模型不仅基于 海量数据 进行训练,还通过数千小时的实际远程操控进行了优化。测试表明,采用Gemini Robotics系列模型的机器人在熟悉和不熟悉的任务上的表现均超越了当前顶尖竞争对手,特别是在处理像折纸这样的精细任务时,采用Gemini ...
谷歌DeepMind称,这个新模型在构建有用机器人的三个关键领域取得了进展:通用性、交互性和灵活性。除了能够对新场景进行泛化之外,Gemini Robotics在与人及其周围环境的交互方面表现更佳。它还能够执行更精确的物理任务,比如折叠一张纸或者拧开瓶盖。
谷歌 DeepMind 近日推出了两款基于 Gemini 2.0 的新型机器人 AI 模型:Gemini Robotics 和 Gemini Robotics-ER。 ● Gemini Robotics-ER 则专注于增强空间理解能力,支持跨平台应用并提升安全性,为未来机器人在日常生活中的广泛应用奠定了基础。
谷歌本次发布的Gemma 3有四个版本,最小的版本有10亿个参数,最大的版本有270亿个参数——但这也算是一个相当“瘦身”的AI大模型了。谷歌公司称,Gemma 3是该公司迄今为止开发的“最先进、最好用而且开发得最负责的一款开源大模型。” ...
盖世汽车讯 据外媒报道,谷歌DeepMind宣布推出两款用于控制机器人的新型人工智能模型:Gemini Robotics和Gemini Robotics-ER。该公司声称,这些模型将帮助各种形状和大小的机器人更有效、更细致地理解世界,并与物理世界互动 ...
点评:Anuttacon是蔡浩宇“退休后”的神秘创业项目,去年8月底才正式曝光。据悉,Anuttacon的目标是用AI为游戏玩家带来前所未有的体验,突破互动娱乐的界限。团队创立之初就有不少大佬加入,包括前微软全球研究合伙人童欣、前B站副总裁王宇阳等。目前,领英资料显示,Anuttacon团队规模不到50人,成员来自米哈游、微软、亚马逊、字节跳动等知名企业。
但相比之下,其 DeepMind AI 团队目标更为宏大。 该团队专门开发了 两个全新的 Gemini 模型,专为机器人设计。 Gemini Robotics:赋予机器人视觉、语言与动作能力 第一个模型名为 “Gemini Robotics”,它是一个先进的 视觉-语言-行动(VLA)大模型,基于 Gemini 2.0构建。
【新智元导读】谷歌DeepMind推出了Gemini Robotics和Gemini Robotics-ER两款AI模型,基于Gemini 2.0打造,这对「机器人大脑」在泛化能力、交互性和灵巧性上全面突破,让机器人能理解复杂环境、执行精细任务,甚至适配各种形态。 就在昨天,谷歌DeepMind推出了新一代专为 ...
机器人领域,谷歌来好消息了, 谷歌DeepMind团队在把大模型的能力往机器人行动上用,用得很好,名字叫做Gemini Robotics。 一看名字就知道基础模型肯定是Gemini 模型了。 稳定性和精确性符合工业级别的标准。 尽管各式各样的机器人均表现出在柔性上大幅超过机械 ...