人形机器人,正在硬科技圈里掀起一阵新热潮。
几天之后,特斯拉的首款人形机器人,代号Tesla Bot(特斯拉机器人)或Optimus(擎天柱),将在特斯拉人工智能日上亮相。特斯拉CEO埃隆·马斯克在科技圈几乎有“点石成金”的魔力,从智能电动车到SpaceX和星链无一例外。
人形机器人能否接棒成为下一个产业风口?引起了国内智能产业界的关注和讨论。
人形机器人也称仿人机器人,顾名思义,是指具有类人的外观、感知、决策、行为和交互能力的机器人。就像《星际穿越》中的机器人塔斯,能聊天讲笑话、能跑能救人,代表了人们脑海中机器人的理想形态。这是一个相当高技术、高投入的综合性领域,从日本阿西莫到波士顿动力阿特拉斯,每一个机器人都成本高昂,与商用化落地有一定距离。特斯拉、戴森等科技巨头的入局,无疑为产业带来了新转机。
当下,人形机器人发展情况如何?又会因科技巨头的入局产生什么新变化?相比于国际水平,国产人形机器人又处于什么段位?近期,我们联系到优必选科技人形机器人创新中心负责人付春江,与他就这些问题进行了深入探讨。
创立于2012年的优必选科技研发人形机器人已超十年之久,是国内首家实现人形机器人商业化落地的企业。付春江是人形机器人产业10年老兵,曾就职于本田公司阿西莫(ASIMO)团队,那里诞生过全球首台独立行走和独立奔跑的双足机器人。
从特斯拉的人形机器人版图聊起,付春江为我们带来了关于人形机器人技术和产业的更多真相。
一、特斯拉做人形机器人,就像IBM将商用电脑PC化
在去年8月的特斯拉人工智能日上,一个身着白衣、头戴黑面纱的真人扮演的机器人登场,用一段滑稽舞蹈,向全世界宣布了特斯拉要“造人”的消息。一年后,在10月1日的新一届特斯拉AI日,这个特斯拉机器人就要正式亮相。
根据预告,特斯拉机器人的身材苗条,身高约172cm,重量仅56.6kg,皮肤比人还光滑。按照马斯克的畅想,其人形机器人早期定位代替人们从事枯燥、危险性的工作,未来则进入千家万户,做饭、修剪草坪、照顾老人。
在今年4月一次采访中,马斯克直接透露,特斯拉机器人预计售价2.5万美元(约合人民币17万元左右),可能比特斯拉汽车便宜得多。
“马斯克做的事情大都很宏大长远,并且在科技难度、维度上是有上升的,也往往是一个国家科技部、产业部布局的方向。发达国家缺乏劳动力,马斯克是对发展中国家这种丰富劳动力的一种对标。”付春江告诉智东西,“类似于1981年IBM推出世界上第一台个人电脑,将电脑从政府军工市场推向消费市场,特斯拉入局人形机器人,有望把人形机器人‘PC 化’。”
作为机器人皇冠上的明珠,人们长期以来期待人形机器人达到更高的智能水平。为了满足需要,人形机器人第一是不需要重新适应人所在的环境,第二是可以使用人所用的工具,第三是与人进行情感交互。显然,特斯拉的入局让产业看到机器人形态逼近这一目标的更大可能。
根据特斯拉的预告,特斯拉机器人内部搭载40个电机,双腿内含力量感应装置,移动速度可达8公里/小时,可负重20公斤的物品。
视觉和大脑是人形机器人的关键系统。按照预告,特斯拉机器人将基于特斯拉的FSD(完全自动驾驶)的计算机模组和方案,面部采用了八个Autopilot 的摄像头,最远监测距离可达250米;“大脑”运用了特斯拉的超级计算机系统Dojo,通过AI大数据进行神经网络训练,其核心是算力极强、带宽超高的“D1”芯片,25个芯片组成一个训练单元,算力可达9千万亿次。
付春江对此表示期待,他认为,特斯拉有望相较同代产品实现较大改进。
特拉斯造人形机器人或许要追溯到四年前,彼时,马斯克谈及了其工厂“过于依赖机器人”。比如,2018年时绒毛机器人造成了Model 3量产速度放缓,这是因为绒毛机器人主要负责将绒毛材质的玻璃纤维垫放到Model 3电池组顶部,但机器人并不擅长拾取绒毛,造成产品线常常失灵。
卡内基梅隆大学机械工程教授Aaron Johnson说,绒毛机器人是“一个有趣的例子”,它充分说明了一点,即自主性很难推广,看似简单的处理柔软的绒毛材料的任务会遇到巨大的问题,因为它不像刚性部件那样可预测。
迄今为止,特斯拉已经雇佣了数百个专门为生产汽车而设计的机器人,但有不少任务机器人表现远不如人类。特斯拉机器人如果能解决这些机器人工作的难题,有望促进人形机器人的产业化落地向前进一大步。
根据公开信息可知,目前,特斯拉正在疯狂招聘人形机器人的工作人员,发布了大约20个职位,包括设计“驱动器”等机器人关键部件的工作。
其中一份招聘启事称:“你编写的高质量代码将在全球数百万人形机器人上长期运行。”此事透露出来马斯克将要部署数百万台的人形机器人,足以看出其对人形机器人领域的野心和他强大的行动力。
这也解释了为什么,特斯拉被期待像IBM将商用电脑PC化一样,促进人形机器人走向广大消费者。
二、价格低于一辆汽车,背后是三大技术流派融合
售价2.5万美元,约合人民币17万元左右,特斯拉机器人的预告定价几乎低于一辆车的水平。有传言称,这一价格最早在2023年投入生产就能实现。
对此,付春江判断在2025~2030年之间,达成这个价格的可能性还比较小。
人形机器人是一个高技术、综合性工程,对比市面上热门的四足机器人来看——人形机器人基本上有四十个以上的关节,四足机器人可能只有八个关节;人形机器人到现在为止还没有全面开源,四足机器人有相关的开源。市面上做四足机器人的企业已经很多,但产品化的人形机器人目前仍是少数玩家的游戏。可以看到,人形机器人的难度远大于四足机器人。
日本本田公司的阿西莫人形机器人曾是该公司的形象代言人,但在经过20多年的发展后,仍未商业化。通用汽车和美国宇航局携手开发的用于太空探索的人形机器人R2,也已停止研发。像Rethink Robotics这样的几家机器人初创公司也因为未能将产品商业化而倒闭。
人形机器人研发需要学习人体结构,主要涉及人体骨骼系统、人体肌肉系统、大脑和神经系统三个层次。付春江说,目前,机器人大多停留在对人体骨骼系统的简单模仿上;人体肌肉系统涉及驱动,当下主要用舵机,未来可能会用柔性仿人肌肉的方式;在控制领域,人形机器人对大脑和神经系统有很多借鉴,但目前仍是一个黑箱。
回顾人形机器人发展历程,最早可以追溯到1967年。彼时,日本早稻田大学加藤一郎教授发布双足机器人WL-1;1992年,本田公司推出仿人机器人P2则开启系统高度集成人形机器人的新时代,其在2000年又推出能上下楼和跳舞的阿西莫(ASIMO)机器人,代表了当时最高水平。进入2011年,新一代阿西莫的奔跑速度可达9km/h,而仅仅2年后的2013年,波士顿动力发布Atlas则开启了一个新时代。其采用液压控制,将高动态运动推向极致,单脚站立、碎石行走都不成问题。2020年至今更是不断推出三级跳、前滚翻、倒立等高难度动作。
技术的发展往往有一个从特殊到一般的过程,人形机器人的发展也不例外。付春江谈道,从软件算法来看,人形机器人玩家可粗略分为以下三大技术流派:
1、控制主导。典型代表是最早做出自制型人形机器人的本田公司,主要基于简化解析模型控制方法,快速分解各种动作及动作组合,支持人形机器人运动。在算力受限时代,这一方法能快速实时地处理任务。
2、优化主导。典型代表是波士顿动力公司,它没有找到可以解析化的分解模型,而是找到了可分解的运动控制规律经验。但这种方法难以量化与动作组合,因此波士顿动力在推出第一款人形机器人之后沉寂多年,直到后来采取直接优化的方法才重回巅峰。
3、硬件刚柔混合配合学习算法。典型代表是美国敏捷动力公司,它没有采取控制主导与优化主导路径,而是尝试新的硬件控制程式,通过串并联、硬柔软这种混合结构实现控制。
付春江告诉我们,现在人形机器人技术流派正走向融合,这也是特斯拉入局人形机器人的背后技术驱动力。
根据业界推测,特斯拉推出的人形机器人或许会用一套神经网络搭建一个统一架构,一统视觉感知、认知乃至运动控制系统,并依托大算力及智能电动车中积累的视觉感知能力。其控制框架可能很多都上位基于模型预测控制,下位直接基于全身力控,然后再利用学习或者仿真解决一下场景化的问题,从而取得比较好的结果。
也就是说,特斯拉将可能推出一款将过往几十年研究成果集大成的跨代产品。
亚利桑那州立大学人类系统工程学教授Nancy Cooke认为,要想成功,特斯拉需要让机器人完成多种无脚本的动作。在没有明确指示的情况下,人形机器人很难在现实中自由走动。但特斯拉可以利用其在人工智能和关键芯片方面的专长,大规模开发和生产成本更低的智能人形机器人,促进人形机器人的商品化。
付春江也有类似的期待,特斯拉开发自动驾驶所积累的神经网络经验及架构、AI算法、数据,可以迁移到人形机器人上。“与机器人相比,自动驾驶处理的任务对实时性要求更高,速度放到人形机器人上有性能冗余;但机器人与人体、与环境的交互大不相同,在处理触碰问题时如何将过去的架构做调整,这是令人好奇的。”
“特斯拉有能力在短时间内建一个大规模的开发团队,在动作多样性上加大开发,在算力上加大投入。同时,特斯拉在开发自动驾驶汽车时开发了各种芯片、算法平台化能力,并打造了一体化的生产制造方式,都可以应用于人形机器人;人形机器人在舵机、速器、电池热管理等方面与自动驾驶共用产业链,特斯拉的供应链掌控力也可以复用。此外,特斯拉在航天卫星积累下来的材料优势也可以用于人形机器人。”
也就是说,除了技术路线上的前瞻性,特斯拉积累的许多技术可以被复用,使其成为扛起人形机器人创新大旗的不二人选。
三、国内产业链或迎来“春天”,人形机器人仍面临四大挑战
“特斯拉、戴森等巨头的入局,对人形机器人产业来说是一个重大利好。”付春江告诉智东西,“我们知道,过去人形机器人除了技术原因方面之外,相关成本与售价问题也是一个难点。特斯拉等大型企业进来,有望通过造几十万台上百万台量级的机器人,大大带动上下游的产业链发展。”
人形机器人涉及到电机、减速器、结构件、电池、传感器、机器人壳体等产业链环节。以人形机器人关节为例,数量多达25-50个,成本占比高达整机的50%。电机作为关节里的核心驱动部件,影响关节的输出力大小和运动性能。根据中信建投报告,人形机器人规模量产有望带动电机需求快速爆发,新增电机市场规模有望近千亿元,这势必促进国内厂商生产更加物美价廉的产品。
实际上,面对人形机器人产业技术大融合趋势,国内公司和科研人才也在国内看到了产业新机会。看准国内经济实力、科研成果、制造能力条件具备,众多科技人才纷纷选择回国发展。曾就职于本田阿西莫机器人团队的付春江是其中之一。
“国内科研成果方面形成了巨大的蓄水池,提高了整体产业势能。比如,现在我们想找一个什么前沿技术,在国内基本都能找到。同时,国内也有大量的人才资源,各个门类的人才能撑起创新产业发展。”付春江说。在过去10年的研究生涯中,付春江主要围绕人形机器人的稳定性、运动的鲁棒性,以及环境适应性、动作多样性展开研究。
恰逢2021年特斯拉机器人传出消息前夕,付春江回国,而后选择加入有十余年研发经验的优必选科技。资料显示,优必选科技已经布局了包括高性能伺服驱动器、机械传动、运动规划与控制、计算机视觉与感知、智能语音交互、SLAM与导航、人机交互和手眼协调等核心技术,同时推出了机器人操作系统应用框架ROSA。2022年,其大型人形机器人Walker作为中国硬科技的代表,在迪拜世博会中国馆累计工作超过1200个小时,完成了1000个场次的接待任务。
付春江透露,优必选科技持续在攻坚人形机器人相关技术,公司正在电子皮肤、并联结构、整机优化、降低成本上下功夫。
但他也坦言,国内人形机器人产业发展也面临肉眼可见的挑战。
首先,人形机器人需要过技术产品这一关,最大难点在于让机器人灵活地与物体或环境接触,在稳定性、动作自然性、动作多样性还有待提高。
在稳定性方面,这要求机器人企业设定多级的稳定性策略,比如包括步态周期调整、脚底接触面调整、摔倒爬起机制等多个策略;在动作自然性方面,需要通过动力学模型进行高维度动作探索;动作多样性方面,则需要通过模仿人的动作或参考人做动作的相关依据,促进人形机器人探索更多高难度动作。
动作泛化是另一大人形机器人产品需要攻克的难题,简单来说,就是如何让机器人举一反三。从全球人形机器人发展格局来看,一个方案是像波士顿动力一样建立足够大的库,调用各种动作;另一个方案则是取决于大型通用AI的发展,通过通用AI让机器人识别任务,实现各种动作,就不需要建大型的库。
当下,人形机器人的限制性条件一个是通用AI技术的发展,另一个还要回归到成本。
人形机器人成本何时能降到接近一辆车的价格?这决定其是否能真正进入家庭。目前,大多数知名人形机器人产品的成本均在100万元以上。优必选是国内首家将硬件成本降至10万美元/台的公司,但付春江认为,近年有望继续降到5万美元/台。
在人形机器人的成本地图中,成本最高的主要是舵机,包括电机减速器、编码器、电机结构件等,占成本1/3~1/2;另外一部分是各种电子传感器与算力板,占到将近1/4~1/3;除此之外还有整机结构件等。付春江谈道,随着量产,人形机器人的整机结构件和舵机成本将大大降低,结构件则需要靠材料和加工技术的升级。他认为,量产后整机成本降低50%是完全有可能实现的。
最后,付春江谈及了生态合作的重要性。
“人形机器人牵扯的方面非常复杂,不是一个人、一个团队能做好的事,因此需要覆盖产学研的生态合作,在技术、资金、实验平台、基础接口等方面都需要进行合作,以避免重复造轮子。”
结语:抢滩人形机器人赛道,考验长期技术积累
让人形机器人来帮我们做重复、单调、危险的工作,是人类科技发展的星辰大海。如果特斯拉机器人本次真的惊艳行业,那么星辰大海离我们又近了一步。“到2025年,人形机器人在半结构化场景将对一些工作岗位进行辅助;2030年,能对很多岗位的人力进行替代,让人们解放出来去做有创造性、感兴趣的事情。”付春江说。
当下,随着我国经济实力、科研实力、制造业的发展,技术蓄水池的积累和创业热情吸引一大批科技工作者回国投入新事业。人形机器人是一项极其复杂系统化的工程,这需要企业具备综合科技硬实力,也需要整个生态汇聚力量,甚至由国家推动,坚持通过长期研发解决成本、通用智能等方面的关键问题。
来源: 智东西
1,368 views