神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:ChatGPT 的爆发让人们期待机器人技术迎来类似的拐点,但机器人行业的发展并非能依赖单一突破性时刻。机器人产业的成熟,需靠 AI 工具协同、硬件迭代、场景实操积累稳步推进,这场技术革命注定是循序渐进的长期探索。本文来自编译,希望对您有所启发。
不要指望靠一次奇迹般的突破就能攻克机器人领域难题,行业进步离不开脚踏实地的长期深耕。图片按顺时针依次来源:AGILITY ROBOTICS; EVERYDAY ROBOTS; PHILLIP FARAONE/WARNER MUSIC GROUP/GETTY IMAGES; ZHANG HAOFU/XINHUA/GETTY IMAGES; KYODO NEWS/GETTY IMAGES
本文由两位机器人领域资深专家执笔:乔纳森・赫斯特是AGILITY机器人公司联合创始人、机器人首席技术官,同时担任俄勒冈州立大学机器人专业教授。汉斯・彼得・布隆德莫在 2016 至 2023 年间任职谷歌 X 实验室副总裁,创立并主导日常机器人项目。
未来数十年,数十亿台人工智能自主机器人将走进各行各业。它们在工厂作业、在仓库处理繁杂工作、照料老人、深入危险灾区开展救援、上门配送餐食包裹,最终还会走入千家万户协助日常家务。机器人外形各不相同,有的酷似人类,更多则形态迥异。可以确定的是,无论外观如何,机器人都高度依托人工智能,才能在现实场景中创造实际价值。
2025 年,机器人企业融资总额创下 407 亿美元的历史新高,占到全部风险投资的 9%。一个价值千亿级的核心问题随之而来:人工智能机器人要具备怎样的条件,才能真正对经济发展产生重大影响?如今不少机器人与人工智能企业放出豪言,宣称人形机器人很快就能走进家庭,但理想与现实之间依旧存在巨大鸿沟。
机器人陪伴人类生活工作,长久以来只存在于科幻作品之中。尽管众多研发人员努力将设想落地,但现实世界错综复杂,传统程序代码难以应对层出不穷的各类状况。借助人工智能技术,机器人不再依靠固定程序指令运行,而是通过自主学习适应真实环境。经过不断训练,机器人能够感知、认知周遭事物,依托逻辑判断完成各类实用、稳定且安全的作业任务。
过去十年,本文的两位作者始终深耕人工智能与机器人前沿领域。一位任教高校并创办机器人企业,另一位曾负责谷歌 X 实验室前沿机器人项目。多年实地落地智能机器人的经历,让我们清晰认清人工智能在复杂机器人系统中的实用价值边界,也分清哪些技术仍停留在科幻构想阶段。我们认可人工智能会推动机器人产业迎来发展拐点,但产业腾飞依靠的是多款人工智能工具协同配套、精密统筹应用,而非类似 ChatGPT 那样单一的技术突破。
人工智能发展前景充满机遇,同时也伴随诸多未知。以下五条客观现实,将决定机器人领域人工智能的发展走向。
多年来,网络上随处可见人形机器人的精彩演示视频,它们灵活跳舞、穿越障碍赛道。业内有个共识:永远不要轻信网上的机器人演示画面。精心编排剪辑的表演机器人,和能在无固定规则的人类生活环境中稳定干活的实体机器人,性能差距悬殊。
近期备受关注的是 2026 年央视春晚中宇树人形机器人的节目。表演场面十分震撼,但这类演出均经过全程周密编排设计。机器人的动作把控、同步配合都做到极致,可其智能与自主程度,仅等同于工厂造车的工业机器人,距离真正走入普通家庭还有很远的距离。
精彩的表演也让人产生疑惑:机器人既能空翻跳舞、施展武术动作,为何迟迟没能大规模进驻工厂?也无法在家中帮忙洗碗收拾?答案很简单:研发能在各类生活场景中通用作业的智能机器人,难度依旧极大。春晚这类亮眼技术展示,容易让人误以为技术已近成熟。但演示里的人工智能,仅用于基础肢体平衡控制,远远达不到人类生活复杂环境下通用机器人的技术要求。
ChatGPT等大语言模型,最初依托海量互联网文本数据完成训练。2022 年末,ChatGPT 横空出世,人工智能得以流畅运用文字与人交流,可探讨各类话题。大模型具备优秀的泛化能力,如今还能接收文字、图片、视频等多类信息,并生成多元化输出内容。这类训练数据体量庞大,且全部由人类创作,是人工智能训练的优质范本。
给人工智能赋予实体机器人躯体,使其在现实中与人互动协作,至今仍是一大未解难题。通用机器人人工智能模型,需要在无规则、动态变化的环境里运行,同时兼顾物理形态、空间结构、时间节奏等多重相互制约的限制条件。想要提升模型通用性,就要采集高维度场景数据,涵盖画面光影、机械活动幅度、动力强度、安全边界等诸多要素,并且数据必须覆盖现实里无穷多变的实际场景,保证样本质量。
目前符合标准的优质数据储备严重不足,行业只能通过远程操控、影像分析、人体动作捕捉、虚拟仿真与实地自主探索等方式采集数据,工作量极为庞大。举例来说,谷歌日常机器人团队 2022 年在仿真系统中运行 2.4 亿次机器人模拟程序,只为训练垃圾分类模型。每一项实用技能,都需要同等规模的数据支撑训练,现阶段机器人能力依旧达不到人类水准。
短期内,无法依靠单一人工智能模型,打造出可以全方位陪伴人类生活工作的通用机器人。
机器人形态五花八门,有轮式、足式结构,机械臂数量各不相同,还有飞行、水下作业、道路行驶等不同机型。现实世界场景纷繁复杂,机器人还要应对人类与各类生物带来的变量。想要一套模型适配所有场景、保障机器人安全稳定运行,现阶段根本无法实现。
我们认为,未来引领机器人技术突破的,将是智能体人工智能。这类高阶统筹模型具备思考规划、工具调用、复盘学习的能力,能够在少量人为干预下完成复杂任务。智能体主控模型会调动各类专用小模型,适配不同作业需求。往后多台机器人也能依托自身搭载的智能模型互相配合协作。
各类人工智能工具不断挖掘机器人的潜能,催生出全新技术方案与商业市场。不少模型逐步对外开放,部分还开源共享,如同互联网普及带来行业质变一样,技术开放也会推动机器人快速发展。随着技术门槛降低,机器人复杂作业能力将迎来普及化发展。
机器人结构精密繁杂,所有零部件都需要高度协同运转。想要保障机器人实用可靠、运行安全,感知系统、中控程序、动力传动部件都必须默契配合。
动力马达与传动齿轮这类驱动部件,就是典型的技术短板。现有量产工业机器人的驱动装置,无法适配人居环境作业。这类机器人一旦不慎碰撞外物,冲击力强、极易造成设备损坏。而人类肢体活动灵活柔韧,接触外界物体时能顺势调整姿态,借助触碰反馈完成动作。
以插钥匙开锁为例,人类不会刻意精准对准锁孔,而是凭借触感摸索位置、晃动钥匙完成插入。机器人想要实现同等灵活度,必须配备力感应驱动部件,柔和适配外界环境。这类柔性驱动配件虽已问世,但还无法大规模应用于家用及日常场景机器人。
炫酷表演和具备实际收益的工作任务有着本质区别。这也契合莫拉维克悖论:人类觉得棘手的计算类工作,机器人轻松就能完成;孩童随手做出的简单肢体动作,对机器而言却难度极高。
服务客户最能检验技术真实水平,用户只关注实际问题能否解决。落地商用的机器人方案,必须优于传统作业模式,同时保证性能稳定、运行安全。AGILITY机器人将人形机器人投入商用后,最先遇到的就是安全难题。在人居空间移动、搬运物品的机器人,会带来全新安全隐患。项目初期只能设置物理防护隔离,团队耗时数年优化整机设计,依托人体识别、行为管控类人工智能技术,全力破解安全隐患。
谷歌日常机器人团队 2019 年推出办公服务机器人,可自主清理餐桌、分类垃圾。实地应用后才真切体会到,现实环境杂乱多变,对机器人运行挑战极大。这些实操经验,既优化了人工智能架构,也积累了真实场景数据,结合仿真数据一同迭代升级模型。
只有贴合客户实际需求打造产品、落地真实场景测试运行,才能稳步完善人工智能体系,循序渐进拓宽机器人应用范围。不存在一蹴而就的技术飞跃,也没有万能算法,脱离大量实地实操经验,单凭海量数据也无法研发出成熟通用机器人。
毋庸置疑,人工智能正借助机器人走进现实生活,智能设备产业即将迎来爆发式发展。人工智能并非单一技术,而是庞大的技术体系,持续挖掘全新能力,深刻影响未来经济格局。
行业不会出现一次性的颠覆性拐点,而是会依靠大大小小的技术革新逐步成长。智能机器人先在部分基础工作中创造价值,再不断拓展应用领域,撬动多个千亿级产业,切实提升大众生活品质。
译者:Teresa