2月5日,在湖北“新春第一会”开始之前,10款“湖北造”人形机器人在武汉洪山礼堂亮相,一款名为“天问”的人形机器人甚至能与人握手。
这款“天问”机器人问世只用了不到半年,由武汉大学刘胜院士团队联合11个学科资源研发,仅用6个月便实现了从立项到行走的技术突破,其灵巧手可精准抓取易碎物品,膝关节扭矩高达460牛·米,性能国内领先。
近年来武汉加速抢占人形机器人领域。数据显示,武汉市每年至少投入40亿产业基金,支持包括人形机器人在内的未来产业。
“天问”机器人到底是什么样的?它是如何研发生产的?未来产业人才在武汉如何发挥价值?
对此,九派新闻邀请到了湖北省“天问”人形机器人项目负责人,武汉大学副教授、博士生导师李淼,以及
灵巧手的成本不到100美金
想攻占咖啡零售、商超
九派新闻:“天问”机器人灵巧手的自由度非常受关注,它与国际其他团队的差异在哪些方面?
李淼:人形机器人的灵巧手有一个所谓的黄金标准,那就是人的手。人的手有21个自由度,我们手上的触觉能够感受到最轻的是绒毛、头发丝。同时,我们的手能操作很复杂的东西,比如魔方。人手最大的力量是可以单手撑起整个身体,攀岩运动员在极限状态下可以用单手指把自己给撑起来。我们行业所有人都想去做出类似于人手的灵巧手。而最简单的灵巧手类似于吸盘,在工业上用的,它没有所谓的自由度,只能去吸一个物体,把物体给抓起来。从最简单到最复杂,到底哪种手是更合适的,其实它没有定论。我们目前考虑的是,做出来的灵巧手是否适合我们想去攻克的商业场景。
在工业场景下,我们可能需要金属三爪卡盘,在商业服务上,我们可能需要柔性的手,在家庭环境下,需要一个更柔性的手。
每一家公司对灵巧手的策略不一样。比如,特斯拉想做一个非常类似于人的手,所以他们的灵巧手一共有接近22个自由度,但是它的造价很高。同时,它没办法集成触觉传感器,可靠性也没得到大量验证。就使得它在某些商业服务场景下是冗余的。
我们想攻克的是咖啡零售、商超,我们的灵巧手在自由度和价格的比值上,应该是最高的,单自由度的灵巧手成本不到100美金。但是如果换算成特斯拉的手,它有22个自由度,成本就是2200美金。但实际上它的价格可能是在一万美金或者是两万美金以上。这就相当于,我们在这个事情上比他节省80%。未来,我们希望自由度逐步从少做到多,一步步去增加。而不是按照特斯拉的战略,一下子做22个,再逐步去优化。我们两者的打法是不一样的。
九派新闻:在洪山礼堂的展示中,很多观众对机器人递话筒、握手的反响很强烈。我们当时对技术的预设和它实际表现是否一致?
李梦德:肯定是有偏差,因为我们设计动作之初有自己理想的场景,根据这个场景去设定程序。实际情况是,握手的光线可能会改变,环境可能很嘈杂,握手的角度可能比较刁钻,这都会导致机器人握手出现偏差。面对这个问题,一种方法是优化算法,让我们这个握手操作具有自适应的能力,根据环境进行反馈、调整。
九派新闻:有网友问,如果“天问”参加奥运会,哪个项目能夺冠呢?
李梦德:这个问题确实很有意思。我觉得它在举重的项目上是很厉害的,因为“天问”的一个亮点就是膝关节的扭矩非常大,能够达到460牛·米。举重主要靠的是腿部力量,“天问”腿部的力量会非常强,而且不需要休息,只需要充电就能一直保持极佳的状态,越举越重,越举越快,不会累。
李淼:我认为肯定是射击。它只要在那里站得稳,它的眼睛理论上比人的眼睛要瞄得准很多,我只要把机械臂放在那里不震动,只要把它结构做到足够好,站得很平稳,它的射击肯定是能够做到枪枪都是十环。
九派新闻:听说二代“天问”机器人还能做西红柿炒鸡蛋?
李淼:“天问”2号实际上是集成了多模态大模型,它的眼睛是能看的,同时能够做任务的拆解,更重要的是,它的手臂操作能力会比一代要好很多。这就把炒菜变得简单。我跟陈斐教授合作过一篇文章,让机械臂学习到双臂颠勺技能。当时这个文章的影响力还是蛮大。我们当时是做了双臂,现在就想着把这个工作无缝迁移到人形机器人上去,那它就真的可以去做更复杂的事了,这是非常有前景的,我充满信心。
元宵节时,我们的机器人其实简单做了一下舀汤圆的动作,还直播了。市面上很多人说,这个机器人动作不够丝滑,但我们可能就在三个小时之内把这个需求完成了,其实还是很不错的。
这个舀汤圆的动作和做西红柿炒鸡蛋本质上一样,就是拿着一个工具,在锅里的物体之间去做这样一个操作,这恰恰是我们机器人最大的强项,因为我们的手是刚柔耦合的,有这样一个柔性的操作能力。
同时,它有视觉多模态大模型,能够判断这个饭菜是什么水平。当然这里面还有其他的东西,我们还不具备。比如嗅觉传感器。人做饭的时候,能闻到这个东西是香的,或者这个饭菜煳了。这些传感器是我们下一步要去做的集成,这也是我们工作非常非常大的亮点。全世界范围内,目前我还没看到任何一个人形机器人能够集成嗅觉传感器、味觉传感器。
九派新闻:“天问”2号的手是用高分子和微结构材料去制作的,这个材料的选取有哪些考虑?
李梦德:主要是有三个方面。因为我们选用的高分子材料很轻,我们就舍去了强度。我们的高分子材料偏软,它可能就不像金属打印的那么耐磨。我们选择的高分子材料内部是采用微结构制作的,相当复杂的,制作难度也挺高,所以它在前期的成本是很高的,而且对工艺要求也很高。
这个手做出来之后,也有一些没预想到的问题。比如说,它是一个柔性的手,我们在控制精度上就很难把握,做力控难度上,也对算法的要求非常高。
九派新闻:团队计划想在“天问”机器人里面去注入情感表达的功能,它的难点是什么?
李梦德:人类的情感其实是非常丰富和微妙的,所以我们很难用数学模型来衡量。目前可能借助大模型来做情感的表达会显得比较自然,因为它可以理解这个环境是什么样子的,能理解上下文,借助这个,它就可以进行更合适的情感表达。现在除了国外的GPT,国内的大模型基本都尝试过,比如豆包、DeepSeek。
“天问”机器人做咖啡。 受访者供图
团队跨11个学科
院士带队项目攻关忙到大年三十
九派新闻:“天问”团队整合了武大的11个优势学科的资源,这种跨学科的协作模式如何突破传统院系的壁垒?
李淼:这个问题非常好。机器人,尤其是人形机器人这两年是国际竞争的热点,它涉及多个学科,有机械、电子、人工智能、计算机、遥感等。所以一开始我们就组建了人形机器人的大群,拉了相关学院的老师、学生。
中间,针对每一个具体的问题,很快在群里面就做出反应。这么快速的整合资源,也不是一时就形成的,武汉大学有一个项目叫“关键核心技术的复合型人才培养方案”,在那个项目里面,我们探讨过复合型人才集中攻关。
武大在工科上没有那么长的历史,相对来说比较灵活,所以我们去年成立了武汉大学人工智能学院,也在筹划成立武汉大学的机器人学院、集成电路学院、微电子学院等。不管成立什么样的学院,其实本质上都是打破固有的学科分布过于精细的缺点。
我们实验室的研究方向,尤其是涉及机器人的抓取和灵巧操作方向,它要懂算法、硬件、传感、软件、AI,保证大家朝一个目标去努力奋斗。
九派新闻:第一代“天问”机器人从研发到立项到落地,好像才用了三个多月的时间。
李淼:我们整个实验室的氛围比较好,可能有很多的实验室分工比较细化,但我们团队的所有老师对学生第一要求都是奔着共同的梦想,或者毕业后想在这个行业继续下去,无论在学校还是去企业。
之所以能在三个月做成,主要是实验室各个学生都牺牲了所有的节假日时间。大家其实都是想快速看到,如果按照市面上的主流方法去做人形机器人,天花板到底在哪里,所以我们就非常迫切。我们团队的总顾问刘胜院士工作强度挺大的,在这个项目最后的攻关阶段,大年三十还在跟同学们探讨工作,一起去吃年夜饭。
九派新闻:面对不同学科之间的差异,你们是如何沟通,最终突破技术瓶颈的?
李梦德:我们内部有一套比较高效的沟通机制。首先是频繁开讨论会,在分享技术时也尽量用大白话,让大家都能懂。第二个就是多用项目管理软件,比如用飞书,把每个人做的东西写好注释,大家能看到别人的问题。时间久了,大家就熟悉了,很有利于项目进行。
九派新闻:梦德,你在这个团队里面是负责哪一个环节的?你个人遇到最具挑战性的是什么?这样一个学科交叉的环境会不会对你的职业规划产生影响?
李梦德:我在做机器人上肢的操作,里面最大的挑战集中在技术难度的融合上,因为我们有十几个学科交叉,有机械的和计算机的,其实思维差异很大。第一个难点就在于如何把他们的思维方式给交叉融合在一起,共同完成这一个软件和硬件结合的人形机器人。第二个就是,确实时间非常紧迫,我们大概只有不到半年的时间,要从无到有打造出这样一台人形机器人,然后去部署算法验证,最后完成一些检验,这些都很困难。
这种学科交叉也确实改变了我的一些职业规划。我一开始思维比较局限于传统的机械,在“天问”项目中接触到了计算机的同学,还有人工智能、算法的知识,看到了跨学科融合的巨大潜力和广泛场景。我就意识到,我以后肯定不会再局限于单一学科。
九派新闻:在“天问”落地的经验里,有哪些可以让大学生来借鉴?
李梦德:首先,做一个产品需要明确市场的需求和定位,要进行大量的调研,而不是胡乱去做。还有,我觉得想做一个很高科技或者很有用的东西,跨学科合作和资源整合也是很重要的,再有很重要的一点,就是持续创新与迭代。
调试中的“天问”1号人形机器人。 九派新闻记者秦轲 摄
政府或推订单式人才培养,有望成立“天问”班
九派新闻:“天问”机器人有80%的核心零部件都是和湖北企业合作的,实现了“鄂研鄂产”,您怎么看待这个问题?
李淼:这个问题也非常好。传统的机器人灵巧手都是钢结构的,或者说金属结构的。我们在做“天问”设计的时候,对它的定位是面向极端环境的多模态的人形机器人,既然是多模态,就涉及跟人的交互,包括在一些场景下做的操作。
所以我们当时就觉得,如果做一个刚性的手,那去做交互的时候,这个模态的信息就没法去提审。毕竟,如果人的手是铁的,那我们的触碰其实对环境的损害是蛮大的。所以我们当时就创新性地去想,这样一个手能不能做到柔性的。
第二,如果我们服务的对象是一个商业的客户,其实它就不应该是那么高的成本。
这两个出发点就使得我们有创新的设计,在中国甚至在世界上都没有人这么设计过。那就意味着这个产业链是不存在的。既然不存在,我们当然可以在湖北把它创造出来。这不是说我们强行要去搞“鄂研鄂产”,是因为它本质上是创新的东西,它才能够满足“鄂研鄂产”的条件。
如果这个产业已经在长三角、珠三角根深蒂固,已经做到物美价廉,那我们没必要强行去搞。我们这个项目里面80%的“鄂研鄂产”,就意味着它几乎是有80%创新的东西,且都是实现了根本性的创新。
九派新闻:湖北最近将机器人列为重点产业,“天问”团队如何借助地方政策去推动技术转化?
李淼:正月初八的展示让我们获得被媒体曝光的机会,那次之后,湖北很多大家熟悉的公司都来寻求合作。这让我们知道真实的市场需求是什么样的。
其实我们也在积极筹划去孵化一些核心零部件以及整机的公司,让实验室里的技术和原型能够走出去,得到应用。
怎么样把这些机器人给用起来,在用这件事情上面,我觉得湖北是真的敢为天下先。这些跟我对接的这些公司,他们甚至都没有去看我的机器人到底能够做什么,是不是真的能够稳定工作,他们给我的一个最深的体会就是,先用了再说,在用的过程中去迭代。我其实是非常感动的。我相信,本月大家就可以看到一次非常惊艳的集体亮相,是在商业场景下第一次落地应用。
九派新闻:“天问”机器人一号自我介绍里面有一句话,它说它是一个土生土长的湖北人。像这样的地域认同感,是如何建立的呢?
李淼:我觉得这个是非常好的问题。湖北有很好的科教资源,有很多相关领域的专家,包括我自己,其实都在机器人领域做了很久。但对于能不能干出人形机器人,尤其在这么短的时间内,最开始我们是没有信心的,尤其还要把供应链建立在湖北,把产业留在湖北。但在做的过程中,我们还是挖掘出一些优质的合作伙伴、供应商。我有一个最深的体会,以前我不知道什么叫敢为天下先,但他们就是给我一种感觉,这事干了再说。
我们正月初八要去做一个展示,但是初七需要一个结构件,当时非常紧急,需要初七早上加工,加工厂还没有完全上班。这时候,我们团队负责下肢结构的郭老师给对应的这个工厂负责人打了一个电话,对方一家人就从外地赶回武汉,连夜帮我们把事情给干了。这是一个很小的事,那个加工件也不贵,可能就几千块钱。但是他能够立马二话不说就赶回来,当天就把东西给交付了,这就体现了这个事情为什么能够在湖北干出来。
九派新闻:湖北制造的供应链对机器人的成本控制和技术适配会不会有独特的助力?
李淼:这也是一个非常好的问题。实际上湖北在制造成本上比江浙沪、深圳要高一些。因为制造业讲规模效应,规模没上去,成本降不下来。我们的零部件采购的单价成本,或者说制造加工成本比那边略高。但同时,越来越多的湖北企业也意识到,如果我们每个人都不愿意牺牲短期内小规模的利益,那可能永远都没办法去协助这个生态做大。所以这次我跟合作伙伴的沟通和几年前完全不一样了。以前大家都不愿意放弃短期的利益,现在我感觉到越来越多的湖北合作伙伴都愿意放弃,共同追求长期规模化,把产业链给做起来。
九派新闻:武汉最近几年推出了不少大学生留汉政策,“天问”团队是否会受益于本地人才政策?
李淼:其实我们项目进行到一定阶段的时候,省里和东湖高新区就已经意识到这个问题,怎么样让这些人才留在湖北。后期,政策陆续都会出台。我估计这次的政策是有史以来力度最大的,针对学生这个层面。
现在竞争更加激烈了,可能要把硕博学位和工作完全打通。甚至要制定人才档案库,对这些人才毕业的日子以及他的家属想去哪里都要摸得一清二楚,及时让专人去跟进。
后面可能政府会有一些订单式的学生培养,就有点类似于华为班、小米班。现在我们就可能成了“天问”班。这些人从一开始就是为了“天问”人形机器人来做研发和产业化的。
虽然我们这个团队已经有越来越多的学生进来,但总体上看,这个数量还不足以支撑一个省的人形机器人产业。
九派新闻:作为武汉高校培养的人才,留汉的吸引力怎么样?相比一线城市,武汉的机器人产业又有哪些优势?
李梦德:我在武汉也待了很多年。它的交通非常便利,因为地处中部,去哪里都很方便。我们要买原材料,买深圳的、上海的,一天两天都能发过来。武汉确实也有很大的政策支持,比如说给毕业大学生优惠,武汉创业创新氛围非常好,比如近年来在光谷打造的一系列科技园区,吸引了大量高科技产业入驻。如果和一线城市比优劣,首先武大、华科,还有理工大、华师,这些教育资源很丰富,这是武汉的优势。还有一个优势,就是刚才说的光谷科技园区和政策扶持。劣势可能就是在薪资待遇上没办法和北上广深相比。
未来希望“天问”应用在养老、医疗、太空领域
九派新闻:“天问”机器人好像已经在跟一些咖啡企业谈应用了,为什么选择从这个行业切入?
李淼:这个是非常好的一个问题。目前的学术界和产业界对于机器人的落地场景一直都有争议。大家比较能想象的是机器人进厂拧螺丝,做家务,但很少有人想象机器人进入咖啡等商业服务场景,我们其实基于以下几点去考虑。
第一,大模型增加了人形机器人两个核心能力,一个是对任务的理解能力,第二个就是增强了人机交互,就是情感表达能力。这样两个能力就使得他能进行一些复杂的任务。以前的工厂机器人,比如ABB的工业机械臂,它一辈子只干一件事。
现在,因为大模型,它对任务的理解能力更多了,不仅能抓手机还能抓水瓶,而且它的人机交互能力也会变强。
我就发现,它的能力能够满足的区间,实际上只有商业场景。因为工厂太结构化了,要实现高度自动化,要流水线分工。我们不希望机器人一边干活,一边做一个话痨。在家庭环境下,涉及的物体的种类太多了,交互太多了,目前人形机器人在操作和交互上都满足不了。而商业服务场景,既有交互的需求,有一定的结构化,但也不是那么结构化。
我们可以看到,无论是星巴克还是瑞幸,每个店看起来似曾相识,但不完全一样,所以这恰好是人形机器人的非常好的落地场景。你买咖啡的时候,总需要和店员之间进行一些简单的互动,而这个互动恰好又在人机交互的能力范畴之内。
九派新闻:未来您希望“天问”机器人应用在哪些场景?
李淼:我其实更想让它利用在商业服务场景,包括咖啡零售、商超、社区养老食堂等。民以食为天,能解决吃喝问题,那基本上就解决人类社会的一大半的问题。
世界上有些非常优秀的机器人公司,它的机器人能够跳舞、跑步,但就是不能干活,它最终提供的是情绪价值。但是让你一整天都盯着杂耍,也会无聊。如果有个机器人真的能够做一些非常简单的事,比如洗碗、折衣服、做咖啡,那它是节省我们时间的。而市面上的一些机器人,实际上是在占用我们的时间。我们走的是两个不同的象限,一个是为我们节省时间,一个是占用我们的时间。
九派新闻:“天问”和现在比较火的宇树机器人相比,技术路线和应用前景有没有差异?
李淼:我觉得双方在定位上有本质的差别,很多人都想着去做通用的机器人平台,但从一开始我就表达这样一个观点,机器人的使用是和场景紧密地结合在一起的。
在工厂里拧螺丝的机器人,在家里做饭的机器人,和在音乐厅弹钢琴的机器人,它们本质上是三种不同的机器人。但目前市面上的机器人,他们实际上是希望把三种机器人用同样一种机器人去代替了。
这是一个非常美好的愿望,但实际的情况是,这样一定会带来冗余,冗余的设计就使得它的成本不可能比专有的行业机器人更低,所以我们认为,从下面往上面去生长更符合这种商业迭代趋势。
九派新闻:如果“天问”机器人未来真的具备了我们所畅想的能力,团队希望它最先去解决哪些社会问题?
李淼:我觉得养老可能是一个非常大的问题。因为人口老龄化,到时候照顾老人的工种是非常稀缺的。目前很少有老师去研究机器人做饭,但是这件事情其实很重要,如果解决了,那以后的养老问题就解决了一大部分。
第二是医疗问题。优秀的医生一直短缺,如果人形机器人以后能够进入医疗场景,其实它和现在的医疗设备或者医疗机器人是有本质区别的。因为人形机器人本身取代了医生,它让这些医生拥有更多分身。一个优秀的主任医师如果把他的技能赋予人形机器人,就会有无数个主任医师。那这个价值其实也非常大了。
第三可能是我个人比较天马行空,其实我是希望机器人能够到太空里面去做探索的,因为机器人其实本质上它是打破了人类固有的一个非常重要的概念,就是它没有时间概念。只要它有电,它就可以永存,它所有的数据都可以一直进行大的迭代和学习,进行太空探索。
人类的生命和寿命其实是有限的。那机器人如果能做这件事情,它其实可以持续100年,甚至200年,去更远的地方,这个价值其实也是非常非常大的。
九派新闻:之前刘胜院士提到过,“天问”未来想走向深海、深地、深空场景,这对机器人设计提出了哪些要求?
李梦德:我们分场景说。比如说深海这个场景,随着海水深度的增加,首先压强会非常大,所以对机器人的耐压性要求非常高,
第二,如果密闭不好,海水进入机器人内部可能会腐蚀一些重要的零部件,导致机器人失灵。还有一个就是通讯和定位的问题,因为海水对电磁波有一定的吸收和散射作用,会影响到通信。在深空场景下,遇到太空辐射,机器人得有抗辐射的能力。太空环境可能有极高或极低的温度,所以它还要有耐高温和低温的能力,它得有给自己供能的能力,因为我们没办法再给它充电或者换电池了。
九派新闻:咱们刚刚也聊到很多对“天问”未来的畅想,这些畅想和它的名字有关吗?
李淼:这也是非常好的问题。我们当时取“天问”这个名字,是想让这个机器人有更多的楚文化特点。楚文化最有代表的可能就是屈原的《楚辞》,《楚辞》第一个就是“天问”。它的意思其实也非常好,就代表着人类不断向大自然,或者向这个世界进行了一些思考。
在AI企业崛起的当下,大模型回答问题会比我们优秀太多。只要大模型的网络带宽是足够的,那它可以组织更大的语料来回答问题。那我们人类还剩下什么?其实就是《楚辞》“天问”告诉我们的,人类剩下的只有我们如何向这个世界问问题,如何去问好一个好问题,这其实会比解决一个问题更加重要。
(九派新闻记者秦轲 制作:曾金秋)