波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产 力”
8月24日下午,2024世界机器人大会上,举行了一场期待已久的中国、美(měi)国“具身智能”与人(rén)形机器人领域(yù)学者的“世界对谈”。
大名鼎(dǐng)鼎(dǐng)的“机(jī)器狗之父”、美国波士顿动力创始人Marc Raibert(马克·雷伯(bó)特)首次来(lái)到北京。他说,“我简直(zhí)不(bù)敢相信,不仅是机器人(rén)的数量,难(nán)以置信,还有这么多热情的人参加了(le)展(zhǎn)览。中国对机器(qì)人的兴奋和热情很(hěn)高(gāo)。”
而此次与Marc对(duì)谈的四位CEO所在的公司也不寻常:除了(le)宇树科技之(zhī)外,星动纪元、银(yín)河通用、北(běi)京(jīng)具身智能机器人创新中心都成立不足2年,一(yī)出(chū)道就是具身智能和人形机器人行业的“顶流”。
而且,星动纪元、银河通用(yòng)背后也站着中国最高学府:北大和清华,代表着中国前沿(yán)科技创新的重要来源。
其中,星动纪元由姚期智带领(lǐng)的清华大学交叉(chā)信息研究院孵化成立的,星动纪元创始人陈建宇现(xiàn)在还是(shì)清华大(dà)学交叉(chā)信息研究院助理教授,公司融(róng)资超亿元,联想创(chuàng)投已(yǐ)加入其中。
银河通用机器人创始人的(de)王鹤则是(shì)北京大学助理教授(shòu),也是北京智源人工智 能研究院(yuàn)具身智能研究中心主任,过去(qù)半年,银(yín)河通用完成天使(shǐ)轮融资共计7亿元人(rén)民(mín)币,刷新了国内人形机(jī)器人领域单轮融资规模,美团战投、北汽产(chǎn)投、商汤国香基金、讯飞(fēi)基金、启明创投、蓝驰创投、经纬创(chuàng)投、源码资本、IDG资本等头部财务机构都参与其中。
而北京具身智能(néng)机器人创新中心则(zé)是北(běi)京市发(fā)起成立的机器人“国家(jiā)队”机构。北京具(jù)身智能机器(qì)人创新中心总经理熊友军,目前还是(shì)“人形机器人第一股”优必选科 技CTO。
Unitree Robotics(宇树科技)也是当(dāng)下人形机器人行业(yè)的明(míng)星企业。公(gōng)司创始人、CEO、CTO王兴兴毕业于上海大学,取得了机械工程硕士,具有近10多年足式机器人(rén)研发经验,拥有(yǒu)产(chǎn)品从0-1-100的(de)研发与商业化落地能力,100+项 机器人相关专利。
此次圆桌(zhuō)由德国慕尼黑工(gōng)业大(dà)学(xué)教授 Alois.C.Knoll主持,美国波士顿动力创始人Marc Raibert(马克·雷伯特),与中(zhōng)国(guó)四大AI机器人(rén)企业领军者(zhě)——陈建宇、王兴兴、王鹤、熊友军(jūn),五人(rén)围绕机(jī)器人行业、AI 大模(mó)型驱动机器人(rén)发展等议题展开讨论。
一个多小时的圆桌当中,Marc表示,未 来5年,机器人硬件发展仍(réng)将非常重要,但同时,能够打破语义理解障碍的基础(chǔ)模型或其他 AI 方法也将对机器人(rén)技术产生更大的影响。不(bù)过(guò),要想取得机器人领域真正的进步,就需(xū)要更高(gāo)的可(kě)靠性和安全性,未(wèi)来(lái)人们需要投入大量资源努力解决此类问题。
Marc非常不看好人(rén)形机器人(rén)行业。他(tā)认(rèn)为(wèi),工业机器人已经非常(cháng)成(chéng)熟,而且能够商业化,目前人形机器人(rén)“在某种程度上是一(yī)种炫耀,而不是一种生产力”。
陈建宇(yǔ)表(biǎo)示,过去10年AI发展很快,从简单的图像处理,到深度学习、强化学习,再到ChatGPT技(jì)术,这对于未来“具(jù)身智能(néng)”产生(shēng)很大的影(yǐng)响(xiǎng)。未来几年,AI、具身智能会与人形机器人(rén)不断融合,去训(xùn)练(liàn)一个通(tōng)用模型。他相信(xìn)未(wèi)来5年,我(wǒ)们将迎来“机器人的ChatGPT时(shí)刻”。
王鹤指出,当前(qián) AI 大模型在机器(qì)人上仍(réng)有巨大的局限,尤其是“泛化的开瓶盖”技能还没(méi)有训练(liàn)出来,但同时,这也是大模型带来了重要机(jī)会(huì),一旦(dàn)大模型涌现能力不断加强,他认为未来5年,依然有一个(gè)至少(shǎo)做操作任务的通用机器人机会。
熊友军(jūn)表(biǎo)示,当前关节性能提升、高的能量(liàng)和电池密度的(de)提升非常快,使得机(jī)器人的运动控制能(néng)力、电(diàn)机等方(fāng)面(miàn)提升(shēng)非常快。未来5年,机器人关节(jié)和能量密度会持续提(tí)升。毕(bì)竟和人类相比,现在机器人的能量执行效率还是(shì)有非常大的差距。
以下是钛媒体AGI编辑对此(cǐ)次圆桌全文整理:
问:您能否向观众简单介绍(shào)一(yī)下您的(de)工作:您为什么(me)以及什么时候(hòu)开(kāi)始对人形机器人(rén)感兴趣的?
Alois:我从 2001 年开始担任慕尼黑大(dà)学的(de)教授。我(wǒ)对人类噪音的一个方面产生了(le)兴趣,那就是具象化,对吧?我的朋友 Pfeiffer 和我们一起从大学毕(bì)业。苏黎世退休了,不幸的是,我们(men)坚信具象化。所(suǒ)以我们认为,在我(wǒ)们的人类类型中(zhōng),智力(lì)只会在以非常自然的方式与世界相连的人类类型身体中(zhōng)发展(zhǎn)。所以身体应该(gāi)有(yǒu)同样的动力,同样的尺寸,等等(děng)。否则(zé),就很难做到这一点,你在这里看到的 Kronos 系列机器人,左边,左下角的 Roll Boy2024 就是(shì)这种信念的(de)结(jié)果之一。
Marc:我认为你贴出的那(nà)张图(tú)片对我回答(dá)这个(gè)问题很有帮助(zhù)。如果人形机器人意味(wèi)着两只胳膊(bó)、两条腿直(zhí)立向前,那么直到最近我(wǒ)才对此感兴趣(qù)。事实(shí)上,我一直认为现在的公司(sī)注重功能性,作为一名教授(shòu),我认为功能性才是最(zuì)重(zhòng)要(yào)的,机动性、灵巧性(xìng)、感知力和智能,而外形和外观(guān)则是次要的。另一方面(miàn),如果(guǒ)人形机器人意味着像腿一样的动态生命,我会把它(tā)与世界互(hù)动(dòng)。我(wǒ)一(yī)直是人(rén)形机器人的粉丝,尽管我建造的第一个(gè)机器(qì)人是弹簧单高跷(qiāo)的东西。我(wǒ)认(rèn)为人形机器人的许多基本要素都在那些(xiē)弹簧单高跷的东(dōng)西中。确实,当我们开始建造机器人时,波士顿(dùn)动力公司是直立的,有两条腿,两只(zhǐ)胳膊。有时领先。如果你看看公众的反应,你会发现 YouTube 点击量增加了(le) 10 倍(bèi),我非常关注这些点击量或评论(lùn),或者只是人们的态度。人们非常感兴趣(qù)。普通的非科学家,比(bǐ)如说,非工程师,他们对人形机器人很(hěn)感(gǎn)兴趣,而(ér)狗惹恼(nǎo)机器人却得不到同样的赞誉。
熊友军:我(wǒ)是从读博士的时候,2000年开(kāi)始做机器人的研 发,当时读博士的时(shí)候(hòu),那(nà)时候更多的是做工业领域(yù)、特种领域的一些机器人,用在一些危险的环境里面,因为那时(shí)候(hòu)机器人技术还是非常不成熟,但在(zài)很(hěn)多特种领域和危险场景里面,是需要(yào)用机器人去完成(chéng)工作了,然而那时候(hòu)机器智能实际上(shàng)是很差的(de)。所以(yǐ)我(wǒ)们当时想的办法,是将机器人的智能跟(gēn)人的智能结合起来(lái),所(suǒ)以做了一些机器人要操(cāo)作的一些事情。
但在遥控(kòng)操作完成这些工作的过程中(zhōng),我们发现有很(hěn)多的场景,实际上用轮式的工业机械手臂是解决不(bù)了的(de),尤其是有时候在一些特种场景环境(jìng)比(bǐ)较狭(xiá)小,然(rán)后环境比较复杂的轮式,然后履(lǚ)带式实际上根本(běn)就进(jìn)不(bù)去,但是人是(shì)可(kě)以进去。还有一种,是要试用很多工具去完成那些工作。
所(suǒ)以当(dāng)时我们就(jiù)觉得,如果说(shuō)有微型(xíng)机器人的话,实际上应该是能够提(tí)供很好的解决(jué)工具,或者(zhě)一种解决方案(àn),但是我们当时那(nà)时候也看到了(le)日本本田ASIMO,给我们提供了很多的一些启发,所以那(nà)时候我就 对人形机器人非常(cháng)感兴 趣(qù)。后面毕业之后,一直在(zài)做机器人相(xiāng)关的工作,
2012年,我跟优必选(xuǎn)科技CEO周(zhōu)剑先生(shēng)创立了公司,做人形机器人(rén)研(yán)发工作,去年从深圳到北 京开(kāi)始筹建具身智(zhì)能机器人创新中心,现在也是一直在聚焦人形(xíng)机器人方面的研发(fā),主要的想法是希望说能够(gòu)解决人形机器人方面(miàn)的一些共(gòng)性、关键的技术(shù)问题,比如本体的一些基础研发不足,其(qí)实我们现在微型机器人在本体在关键(jiàn)的核(hé)心器件,然 后在一些(xiē)传(chuán)感器方面其实上有非常多要攻(gōng)克的(de)地方。另外在运动控制,实际(jì)上我们也(yě)做了非常多的运动控制的(de)技(jì)术研发,采用深(shēn)度学习强化学习的这种运动控制的方式,包(bāo)括现在也用(yòng)一(yī)些融神经(jīng)网络的一些(xiē)方式用去做运(yùn)动控制,同 时其实(shí)我们现在还在做关(guān)于智能方面(miàn)的(de)一些研发,比如说把用(yòng)现(xiàn)在具身智能的方式,做一些基础性工作,比如建它的数据集,研发机器人大模型(xíng)框(kuāng)架等。所以这就是(shì)现在我在做的一 些事(shì)情。
陈(chén)建宇:其实这个(gè)兴趣(qù)是很小的时候(hòu),就(jiù)一直对智能机器人非(fēi)常(cháng)感兴趣(qù),我印象很深刻,刚刚兴(xīng)兴说她10岁的(de)时(shí)候,我估计也是差不多类似的时间,不过当时看的不(bù)是波士顿动力,当时关注的是ASIMO系列机器人,当时我就非常的去着迷。然后(hòu)我觉得,创业这件(jiàn)事其实是充满了挑战性(xìng)的,marc创办了波士顿动力做了(le)40多年,其实我是非常尊敬的,就是说你没有一个发自内心 的、天生热爱的话,其实很难去(qù)坚持下来的。所(suǒ)以对我来说,对这类机器(qì)人的热爱,我 觉(jué)得某种(zhǒng)程度(dù)上是从小(xiǎo)就(波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”jiù)具备就拥有的。
那(nà)么真正开始做机(jī)器人(rén)其实是本科的时候。当时在(zài)学校(xiào)里面(miàn),我就接触真正意(yì)义上的机器人的研究,当时接触了双足机器人,主要(yào)是做的(de)就是捕获点步态规(guī)划相关的研究(jiū)。后来,博士阶段继(jì)续做机器人(rén),虽然不是人形机器人,但是也是相关(guān)的一些机器人的领域,控制它的学习,包括无人车和(hé)机械臂。而真正的去全力做人形机器人,是在我回国之后(hòu),然后在现在(zài)清华正式投入去做人 形机器人,还(hái)孵化(huà)了星动纪元公司,如今我们已经做了最(zuì)新一代(dài)、第六(liù)代机器人了,然后我们也在展会上面带来了我们(men)机器人的实物,欢迎大家去(qù)关(guān)注。
王兴兴:大家好,我是宇树科技创(chuàng)始人王兴兴,刚(gāng)才有提到我大概(gài)可能10岁的时候(hòu)就 看过marc先(xiān)生在MIT实验(yàn)室做的双足,还有单条(tiáo)腿的(de)机器人,然后印象非常深,在09年、10年的时候,大概大一寒假,我就做过一个小的人形机器人(rén),然后(hòu)当时做的不是特别满意,然后后来的话(huà),就在研究生期间做了XDog这(zhè)款机器人,差(chà)不多(duō)在13年到15 16年,这款机器人的话又采用了比较低成本的硬件,然后运动性能非常好,可以直接实现关节的力控以(yǐ)及整机的力控。
后来的话,一开始我对人体机器人的技(jì)术还是跟相(xiāng)对(duì)来说比较悲观的,但是(shì)后来的话在2022年左右,整个的机器人、AI技术的进步,然后再加上ChatGPT出来(lái)以后,大家都看到人形(xíng)机(jī)器(qì)人和AI结合的可能性(xìng),所以(yǐ)说我们公司又(yòu)重新开始做(zuò)人形机器人(rén)。说实在的,其实我真 正(zhèng)感兴趣的并不是(shì)说人形机器人,而是新的一(yī)个智(zhì)能(néng)体(tǐ)机器人的形(xíng)态。而(ér)人形机器人可能只是说目前大家比较公认的、一个最(zuì)有可能(néng)性的通用机器人和通用AI的结合体,但(dàn)是这可能并不是个唯一的,我(wǒ)真正希望能诞生甚至更(gèng)比(bǐ)人更高(gāo)级(jí)的一个智能体形(xíng)态,可以大大推动整个人类工业的变革,推动新(xīn)的工业革命(mìng)。
王鹤:我是(shì)北京大学计算机学院助理教授,也是北大(dà)银河通用具身智能联合(hé)实(shí)验室的主任王鹤,那么,我跟人形机器人、具身(shēn)智能结缘,主要是从我在斯坦福大学开始(shǐ)读博的时候。那么2016年的时候,当时深度学习技术已(yǐ)经(jīng)出来了,也应用在(zài)很多图像识别分类这些任务当中。那(nà)么当时作为一(yī)个(gè)前沿研究,我们试图去理解人类是如何把(bǎ)感知思考还有(yǒu)交互(hù)的能力融合在(zài)一起的。
所以我博士期间的第(dì)一个工作,就用(yòng)一个视觉模型(xíng)来看桌(zhuō)面上人的动(dòng)作(zuò)和物体的一个运(yùn)动,然后推理人下一步想(xiǎng)要什么,这是一个语言模型 。
最后再用一(yī)个简单的机器人,智能的(de)马(mǎ)克杯去响应人的(de)动作,那么(me)这个工作获得了欧洲图形学的最佳 论文提名,但是我们认(rèn)为它非常的不足,就是我们的一个马克(kè)杯只(zhǐ)能在桌面上移(yí)动响应人(rén)的动作,它没有跟人(rén)交互的(de)能力,我(wǒ)们的视觉只能(néng)看有限的几一种物体,那么我们的语言模型只能根据这个人跟这些桌面东西的一些动作来做简单的推理。
那么通过(guò)过去8年我们的研究(jiū),在怎么样把机器人(rén)的操作能力搞(gǎo)得(dé)更泛化,什么东西都能抓,都能(néng)够放置,那么还有跟现在的(de)多模态大模型技术结合(hé),真的明白人(rén)类(lèi)想让你干什么,那么言出法随(suí)的去(qù)执行,所以去年我们就孵化了北京银河通用这家(jiā)人形机器人公司(sī),我(wǒ)们现在也是把(bǎ)视觉、语言、动作这三(sān)种不同的模态融合到大模型当中,真正的赋能人形机器人,让人形机器人能(néng)够走进千行百业、千家万户,这是我们的愿景(jǐng)。
问:你认为,我们(men)今天拥有的哪些重(zhòng)要技术是 10 年前没有的,但对(duì)于实用的人形机器人来说(shuō)却(què)至关重要?它们在未来 5 年将如何发展?
Marc:我认(rèn)为硬件开(kāi)发仍将非(fēi)常重要。如果(guǒ)我们谈论未来 5 年,毫无(wú)疑问,能够打破语义理解障碍的基础模型或其他人工智能(néng)方(fāng)法将产生最大的影响(xiǎng)。
我认为(wèi),人类可以(yǐ)做的就是,概括和理解(jiě)他们所看到事物的含义,而(ér)目前还无法真正捕捉到这些含义。我相信,如果人工(gōng)智(zhì)能能够在这方面取得进(jìn)展,我认(rèn)为 它将产生巨大的影响。
实际上,过去十年(nián)来,每个(gè)人(rén)都在计算机、传(chuán)感器、感知、控制等(děng)方面取得了巨大进步。电池,我(wǒ)认为人们忘记了电池。虽然电池(chí)是工业时代的产物,但是它们确实(shí)非常重要。是的,所以在电机(jī)方面过去 5 年里(lǐ),人们做得很好,我(wǒ)认(rèn)为电机已经取得了长足的(de)进步,当然,我们将看到更多。
陈建宇:我从AI的视角来讲一讲,觉得(dé)非(fēi)常大的一个不同。如果按照10年前的话,其实是2014年左右,当时是DeepLearning刚刚出来不久,它其实解决了很大一部分,比如图像处理等等一些(xiē)问题。
那么后面,其实有我(wǒ)认为两个最重要的里程碑:一个是(shì)以16年阿尔法狗为代表的深度学习,紧接着把它用 在 了强化学习(xí)上面,做(zuò)深(shēn)度强化学习,解决了一些(xiē)问题;第二个是以ChatGPT为(wèi)代表的大语言(yán)模型,所(suǒ)以这点我认为是过去10年没有的,但又(yòu)对未来我们人形机器人,或者是具身智能起到非常大的决定(dìng)性作用的两个(gè)因素(sù)。
那么可能在接下来的这几(jǐ)年时间(jiān),这两项技术会非常深度的跟人(rén)形机器人、具身智能融合起(qǐ)来,但他们也分别需要经过一定程度(dù)的训练,从(cóng)而能(néng)训练比较通用的 一(yī)个模型,那么我们也能解决(jué)更加丰富的物理世界的数(shù)据程序。那么我相信,在接下来的5年(nián),这几项技术(shù)都能起到非常大的一个进 展,我们可能会在5年内(nèi)迎来“机器(qì)人的ChatGPT时刻”。
王(wáng)兴兴:对过去10年最大的,还是AI技术带来(lái)的各种事情有更多的信心。我觉(jué)得除了(le) AI技术本身最大(dà)的点,对于人形机器人,对(duì)于整个(gè)社会共识的增加也是非常关键(jiàn)的,就是目前大家更加相信AI,更加相信人形机器人可以诞生更(gèng)多价值,这在10年前是完(wán)全不(bù)能想象的,那时整个社会基本上对此都完全没有信心。
另外一点的话,我觉得在未来5年,总体上(shàng)是肯定整个 AI 机器人(rén)、AI模型变化会非常快,因为目(mù)前的(de)AI真的是日新月异,大家可(kě)以用AI集成技术,去(qù)搭建各种自己的模型(xíng)去做训练(liàn),这整个已经(jīng)变(biàn)成一个非常(cháng)的扁平 化,以及容易操作的过程(chéng),其实很多人大家都(dōu)可以参与进来,去做机器人模型并且去做训练(liàn),所以我觉得。未来5年这块的各种AI模型创新,包括更新的一些神经网络模型,包括脉(mài)冲(chōng)神经网络等都有很大(dà)的一些机会(huì)。
王鹤:我觉(jué)得10年好快,10年前是2014年(nián),其(qí)实我们已经看到inbody的AI,甚至不是一个在西方的学(xué)术界比(bǐ)较popular的词汇,那么过去(qù)的十年,我觉得一大技术的进展,就是我们在具身智能里头(tóu)已经有一些技能(néng)实现了非常强的泛化性。
那么以我个人的研究举例,在抓(zhuā)取问题上,我们取得了(le)比较(jiào)长(zhǎng)足的(de)进步,那么我们从只(zhǐ)能(néng)抓方块圆的这些特定形状的物体,到基(jī)于三维视觉传感器,我(wǒ)们可以抓不(bù)透明、不反(fǎn)光,也就(jiù)是在深度传感(gǎn)器里头能完美成像(xiàng)的这些物体,到我们最近的技术能(néng)够预测透明、高反光、金属、吸光这(zhè)些非常有(yǒu)挑战材质的物体,基于它去做泛(fàn)化抓取操(cāo)作。
那么(me)在今天的展厅,我们都接受观众给我们的(de)各种形状,各种材质随便堆叠乱七八糟的物体,我们的机器人都展示了非常泛化和高成功率(lǜ)的抓取能力,那么现在的问题是(shì),像这样 的(de)每一个技能,大家都(dōu)在分分别的去做(zuò)开发,那么很多人(rén)会提问你能(néng)帮我抓水瓶,你能不能帮我把瓶盖给(gěi)拧开?我 非常不好意思的说,现在泛化的开瓶盖技能我们还(hái)没有训练出来,这个就是大模型能(néng)够(gòu)带给(gěi)我们的机会(huì),那么大语言模型涌现,也就是这(zhè)种紧急行为紧急行为(wèi),他能够在只见一次或(huò)者是第一次零(líng)次的演示的情况下,他都理解你要生成什么样的(de)文字,我们相信未来的5年给我们(men)的机(jī)会(huì)就是(shì)发展机器人(rén)基础大模型,它(tā)能够实现涌现能力,它吞(tūn)吐足够(gòu)量的数据后,有灵巧手,它能够抓(zhuā)能够加、能够拧,能够掰各种基本的手的各种运动能力(lì)都有了(le)以后(hòu),他能涌现,我们给他看一个视(shì)频,他就能理解这个活怎(zěn)么干,到那个时候我们真(zhēn)正的就有一个通用的、至少做操作任务的的机器人了,这是(shì)我认为未来5年的一个机会。
熊友军:我觉得这一(yī)轮的机器人(rén)技术的进步主要(yào)是由(yóu)AI来驱动的。毫无疑问, AI驱动我觉得体现在几个(gè)方面。
第一个(gè)就是它人机交互性能得到了极大的提升(shēng)。我记得(dé)10年 前我们做人工智能、做机器人(rén)的时候的那些交互,如果说我要加语音加视觉,第成 本非(fēi)常高,第二个我们要做(zuò)大量的研发的工作,我们需要几(jǐ)个博士、硕士带着一(yī)个团队(duì),花很长的时间才能够完成一些(xiē)物体识别、语音(yīn)合成(chéng),自然语言理解NLP,还有 甚至是TTS、语音合(hé)成等方面的一些(xiē)工作,甚(shèn)至包括导航,但是我觉(jué)得,现在随着(zhe)技术的进(jìn)步,我们现在做人形机器人的大模型,我们直接一个(gè)端到端的直接语音给指定给他,然后很快他就可(kě)以有比较好的行为(wèi)输出,有很(hěn)好的意图理解,然后做任务规划等。这是一方面,我觉得这一轮对人(rén)机交互、对动物的规(guī)划、对执行等方面都有巨大提(tí)升,在(zài)10年前基本上都很难去想象。
然后第二个(gè)现在的这些硬件方面也有极大的(de)提升,体现在两个方向,第一个现在关节的性能的提升是(shì)非常快的,大家可以看(kàn)到(dào)很多公司机器人(rén)可以开始去(qù)做一些非常动态的、剧烈的运动,实际上离不(bù)开关节(jié)性能的提升、高能量密度(dù)比,然后高的转速、高性能 等(děng)这些技术的提升,实际上,在10年前我觉得是很难去做到的。当然了这也有运(yùn)动控制能力的提(tí)升、电机的提升,现在其实也有采用(yòng)更(gèng)多(duō)结构(gòu)设计的方式,更适(shì)合(hé)它的布局等(děng)方面都有非常大的进步,包括把腿的转成惯量(liàng)、把电机往上提等等,有各种各样的结构设计的技术(shù)的(de)变(biàn)化。
另外,刚才还提到能量,其(qí)实早前我觉得10年前我们做(zuò)机器人 的时候,一个电池就像我们背后要背一个非常巨大的电池(chí)包能源(yuán)包,而且能够持续的时间很短(duǎn)。但是这几年随着新能源汽车对电池技术的推动作用,其实(shí)我们看到它 的电(diàn)池能量密度大幅提升,我现(xiàn)在一个比较小的电池,可以支持比较长的时间,我觉得这是一个非常重要的(de)技术突破。
未来(lái),我(wǒ)觉得5年之后,这几个可能还是一个(gè)重大、要突(tū)破的方向,像刚才说的人机(jī)交互方(fāng)面,我们希望大模型能提(tí)供更长期的任务(wù)规划,然后做意(yì)图理解等等方面,我觉得我们能只要给他一个非常模糊的(de)指令,他就可以给我们输出我们很(hěn)标准的很自然的这种交互的结果。第二方(fāng)面,可(kě)能就是在规划实施任务方面是一个非常重大、要攻克的方向,我们环境会经常变,面对(duì)的是一个动态环(huán)境,然后机器人能够(gòu)根据环境变化(huà),能够实(shí)时(shí)去改变它的一(yī)些执行策略等。当然,像能量方(fāng)面我觉(jué)得是一个(gè)持续要提(tí)升的,它毕竟(jìng)现在(zài)能量执行效率和我们人相比,还是有非常大的一(yī)个差距。
问:大规模部署人形机器人需要完成哪些任务?
Marc:但是如果(guǒ)你现在从(cóng)更宏(hóng)观的角度来看,我刚才说了(le)如果你想致(zhì)富你现在就不会着手开公司,但是如果你想生存下(xià)去。你至少(shǎo)也得收支平衡。
我想这是一(yī)个更长远的计划(huà),我(wǒ)认为要想取得真正的进(jìn)步,你必须暂停,或者我不(bù)是说你必须暂停,我们在我的研究所暂停,让机(jī)器人更可靠(kào)的本地目标(biāo)将是一件关(guān)键的事情,如果我能指(zhǐ)出(chū)旧金山的自动驾驶汽车,他们杀死了一个(gè)人,这实际上甚至不是(shì)自动驾驶汽车的坠落。然后克鲁兹完全退出了旧(jiù)金山。我知道现在还有很多事情在进(jìn)行,但(dàn)这(zhè)在机器人领域很容易发生。因(yīn)此,可靠性是一个关键(jiàn)因素,这是人们投入大量资源(yuán)努(nǔ)力解决的问题之一。但这无助于解决,将我们带入下一代的更大问题(tí)。当我说(shuō)我不认为(wèi)每个人都必须专注于你所说的真正有用(yòng)的东西时。
陈(chén)建宇(yǔ):要(yào)做到(dào)大规模应(yīng)用的话,有非常重要 两个事情:一个是能不能找到(dào)大规模的需(xū)求,另一个(gè)能不(bù)能有我们技术,足够去(qù)实现、满足需求。
其实现在有(yǒu)很多零散的(de)表演需求,如果需要真的(de)达到(dào)max(大规模)的(de)话(huà),我觉得主要还是看劳动力,非常密集的一些产业,比如 三个阶(jiē)段,一个(gè)是工业、商用和服(fú)务。
大体(tǐ)我认为,技术也基本(běn)上是按照这样一个方向去成(chéng)熟发(fā)展,其中我觉得给我的感受,我认为工业的话可能(néng)会比较快就能够(gòu)去用上(shàng)了。其(qí)实刚才Marc的报告中里面也已经展现出(chū)来了,不管是人形,还是一(yī)些轮式的机器人,在工厂搬运的这一类(lèi)的环境里面,已经是达到了(le)非(fēi)常(cháng)接(jiē)近人类(lèi)的一个节点,那么在未来,它可能会更快(kuài)更强大,然后以及(jí)成本更(gèng)低,达到这个时候的话(huà),其实它的第一个大规模应用的点就到了。
王(wáng)鹤:我觉得具身智能今天不能讲完全成熟,但是我们今天GPT能力搭配人形(xíng)机器人,其实已(yǐ)经能够在很多场合干事情了。
像我们今天在展台展示了(le)就是在一个零售(shòu)的场景,那么用户可以下(xià)单,我们的机器(qì)人可以根据你的具(jù)体下单(dān)的内容,是拿(ná)一个冰红茶,还是拿一个巧(qiǎo)克力,那么(me)我们从(cóng)货架把(bǎ)它取下来(lái),同时我们也可以从地面的(de)篮子(zi)里(lǐ)头把这些(xiē)货不断的上到货架上(shàng),我们也(yě)可以从更大的一个仓储的料架上,抱着一箱(xiāng)东西(xī)放到传送带上。
这些场景其实都展示了(le),目前具身智能对于比(bǐ)较糙的(de)活,就(jiù)是(shì)抓(zhuā)取放置和双手抱持这(zhè)样的能力(lì)已经走向(xiàng)成熟。
在这种情(qíng)况下,我(wǒ)们还(hái)要问一个问(wèn)题,为(wèi)什么是这个人形对吧?有很多人现(xiàn)场问我,你们为(wèi)什么要做成人形?因(yīn)为你想(xiǎng)如果(guǒ)货架上的一个商品掉在地上(shàng)了,我的机器人(rén)得有能力去够地面这么低的东西,我的货架可能(néng)两米高,我要能够抓到两(liǎng)米那么高的东西(xī),同时我还(hái)能 还得来回走动,还要得有两(liǎng)只手才能抱住一个箱子,又有两只手(shǒu)又能(néng)高又能低又能够来回走,那么(me)它基本(běn)上(shàng)就把形态往人(rén)基本上非常(cháng)的靠拢了,那(nà)么我(wǒ)们目前用的是一个轮(lún)式底盘,没(méi)有腿(tuǐ),那么也已经(jīng)达到这样的一个能(néng)力了。那么我们认为(wèi)像这样的抓取放置(zhì)搬运的能力,在(zài)很多行业(yè),比如说零售,比如说工厂,比(bǐ)如(rú)说(shuō)一些服(fú)务的场景全都可以用起来。
所以(yǐ)我判断,人形机器人的大规模应用(yòng),2025年、2026年我(wǒ)们(men)将见到从(cóng)百台级到(dào)千台级的(de)一个快速的增长,
王兴兴:我个人的(de)话(huà),总体(tǐ)来(lái)说(shuō),对目前(qián)整个(gè)人形机器人应用落地还是(shì)需要一些时间,但当下,包括今年和明年(nián)对一(yī)些简单场景,像特斯拉场景里面(miàn)把一(yī)个电池从什么地方装到什么地方里面,这种简单的,用模仿学习能做的事情,目(mù)前的AI技术其(qí)实(shí)成功率还是做的比较高了,今年或明年可(kě)以做一(yī)些(xiē)应(yīng)用 ,包括把整个的GPT速度(dù)也提升(shēng)。
但是我觉得,真正要提升人形(xíng)机器人大规(guī)模应用,确实还需要更多的时间,把机器人的模(mó)型本身(shēn)做(zuò)得更(gèng)好一点,让(ràng)它更通用,基本(běn)上(shàng)无论是更精细化的或者更泛用心的一些事情都(dōu)可以做一起(qǐ)来,所(suǒ)以我(wǒ)还(hái)是希望社会大众对AI和(hé)机器人(rén)能更多一些耐心。但实际上可(kě)能中(zhōng)国其实(shí)还是有很(hěn)多人比较心急的,我觉得还是大家可以(yǐ)再多给一(yī)点耐心。谢谢。
熊友军:我觉得人形(xíng)经济和大规模(mó)的应用,其实上这个就涉及到一个(gè)商业化场景选择的问题,实际上,并不是说现在人形机器人不能够应用(yòng),而是说要再看什么场景(jǐng)。我觉得在有一些刚需的(de)场景,或者对人不可达到的这(zhè)种场景,还是有一些可以用的,尤其是这种刚性需求 的,比如抢险救灾,特种的(de)对核辐射,或者是说有毒 有(yǒu)害(hài)气体环境等等,这(zhè)些我觉得现(xiàn)在实际上是可以用的。
大家其实想的更多是,技术怎么去提升,然后怎么它(tā)能够(gòu)让(ràng)人形机器(qì)人能够快速(sù)适应更多的场景,然后把成(chéng)本快速的降下来,只有这样(yàng)通过(guò)一方面通过技术(shù)的提升,提高有更多工(gōng)作效率,让人有更好的体验感,然(rán)后更(gèng)多(duō)人愿意用它。
第二方面,就(jiù)是把成本继续往下降,我觉得让(ràng)大家更买得起,这(zhè)个我觉(jué)得要是要想的(de)这个(gè)方式。
另外(wài)我觉(jué)得还有一种,就(jiù)是商业模式上的探索,实际(jì)上人形机器人是(shì)我觉得是一个集大成者,它基本(běn)上涵盖了机器人和人工智能(néng)的绝大部分的技术领域,然后在人体技(jì)术(shù)上的研究能(néng)够大大(dà)的推进(jìn)这些技术的成(chéng)熟,然后技术甚至技术的市场化,我们可以采用(yòng)“沿途下(xià)蛋”方式获得这个商业的利润。通过这些其他的一些(xiē)技术,人形机器人(rén)产品上孵化的其他技术商业化、产业 化来推(tuī)动人形机器人研究。一个典型的例子,就是我们现在有一(yī)些人形机器人公(gōng)司已经在其他产品上(shàng)实现盈利,然(rán)后已(yǐ)经实现了一个很好的商(shāng)业化,这我觉(jué)得是一种非常好的模式。
问:作为技术人员,我们是否意识到有很多机器人都有道德伦理方面(miàn)的顾虑——我们如何才能(néng)消除这些顾虑?
Marc:我认为,从最高层面来说,理解所有技术都涉及一些风险和机遇是很重要的(de)。我参加了(le)一个政府会议,但我听到许多(duō)政府的人都(dōu)在谈论监管人工智能,而压倒性的感觉是关注最糟糕的结果,对吗(ma)?
比如(rú)在欧洲,来自英国一位人士在发言,让我印象(xiàng)深(shēn)刻的是(shì),人们几乎陷入恐慌,担(dān)心最糟糕的事情会发生,并且不惜一切代价想要阻止这种事(shì)情发生。但我认(rèn)为,不利用(yòng)机(jī)会的风险与让坏 事发(fā)生的风险一样大。
所以我认为(wèi),正如开发人(rén)员(yuán)指(zhǐ)出的那样,我们需(xū)要找到一种平衡,当我们撰写论文时,我们会在(zài)开头列出这些内容。这些都是我们工作(zuò)可能产生的巨大影响(xiǎng),但我们(men)从(cóng)不谈(tán)论我(wǒ)们的工作,可能(néng)产(chǎn)生的坏事是什(shén)么。
我们需要诚实和开放(fàng),更加公(gōng)平地对(duì)待这个问题,但随后继(jì)续强调(diào)这种平衡,并以某种方式防止我(wǒ)们错(cuò)过机会,我认(rèn)为由于公 众的恐(kǒng)惧,这(zhè)种(zhǒng)机会很容易发生。
陈建宇:我觉(jué)得人们对这个人形机(jī)器人(rén)、或者相应的具身智能机器人(rén)技术的担忧,其实核心来自于(yú)对自(zì)身安(ān)全性的(de)一个担忧。
安全其实有几个不同的层次,最底层的层次是物理的安全,大家(jiā)担心(xīn)机器人会不会在工作(zuò)的时(shí)候去伤害到人,那么这是一个(gè)层次;当然其 实在它分情况,那么比如说我们刚才说的如果是(shì)工厂里面的话,其实如果我(wǒ)们(men)把它跟人工作(zuò)环境隔开,其实一定程度上能解决这个问题;同时(shí),我们也需要从我(wǒ)们的算法硬件等等上面做的更鲁(lǔ)棒来去优化这个问题。
那么(me)第二个层次,其实也是生存上面的问题,但是(shì)不是说物理层面(miàn)的,那么 也是不是说全人(rén)类的一 个担忧,而是说有一部分人一个(gè)担忧,他担心这个会替代咱们的某一些工作,大家会有担忧,我觉得这个事情可能(néng)需要政府(fǔ)或者商号进行有一些引导,我们(men)尽量的开始去做一些确实劳动(dòng)力非(fēi)常紧缺的这样(yàng)的一些产业,比如说我们一些非(fēi)常恶劣环境工业(yè)环境,或者是比如说养老等。
当然(rán)第三个层面,如果未来我(wǒ)们的(de)具身智能机器人真正(zhèng)拥有了意识,那么这个会对人类的自我存在的(de)价值可能产生一些担(dān)忧,我觉得(dé)这个 事是更远的和更(gèng)大的topic。
王兴兴:我觉得机器人的伦理道德和安全性问题,是非常重要(yào)的一(yī)件事情,而且我觉得,要希(xī)望是在场(chǎng)所有的人(rén)都大家需要共同(tóng)去(qù)维护的一件事情,就(jiù)有点像现在新能源汽车以及无(wú)人驾驶,它其实还(hái)是有(yǒu)很多(duō)安全性问题,并且(qiě)比如说有一辆早些年新能源汽车起(qǐ)火了,或者有一家(jiā)新能源汽车(chē)无人驾驶出了交通事故,这个对整个行业影响是非常大的,会降低普(pǔ)通老百姓对技术行业的认可度以及信心。
这个事情 很容易发生在人形机(jī)器人和AI这(zhè)个(gè)领域。所以我(wǒ)一直觉得。当(dāng)下以及未来大家都应(yīng)该在机器人安全性上(shàng),无论是出台一些(xiē)规章政策,或(huò)者做一些更好的引(yǐn)导,或者需要全世界政府出台一些相关的政策,都共同推动整个行业的(de)健康发展(zhǎn)。
王鹤:所以我就(jiù)从技术(shù)的角度,人形机(jī)器人它(tā)的一个面向终局的技(jì)术必(bì)然是大(dà)模型,那么其实只有波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”大模型才可能(néng)实现(xiàn)非(fēi)常高的通(tōng)用性,把很多能力全(quán)部汇集在一起,把很多模态,从视觉感知(zhī),到语言理解,到动作执行,那(nà)么(me)融会贯通,那么今天我们在技术上其实是有(yǒu)方法对大模型的行为进行限制(zhì),就是“对齐(qí)”,我们在大模型内(nèi)部已经进行了深入研究,那么未来,我们会(huì)对语言(yán)模型、多模态模型进行更(gèng)深(shēn)入的(de)对齐,让它不会伤害到我们的人类,并且他的(de)技能会(huì)被局限在服务的范畴(chóu)内,那么这一些是我们技术上能做的(de),在技(jì)术上(shàng)之外,必然还需要政府社会(huì)和国际(jì)的合作。
熊友军(jūn):我觉(jué)得前面几位都说的都挺(tǐng)好(hǎo)的,我就(jiù)补充一点,就是说我觉得应该是有一些行业组织或者是政府出来,更多在法(fǎ)律法规这(zhè)方 面更(gèng)多的立法,包(bāo)括(kuò)更多的是做(zuò)全社会的机器人使用、伦理道德方面的(de)一些教育(yù)。因为我觉(jué)得,任何一(yī)个机器人(rén)也是一种工具,放在不同人的(de)手上,它的可能(néng)有不同的使用方法(fǎ),然后只有加强教育,提升大家对人工智能对人形机器人的使用,让大家相对安全角度去考虑,我觉得才是(shì)一个(gè)正确的方式(shì)。
问:您认为 5 年后人形机(jī)器(qì)人(rén)行业会发展到什么程(chéng)度?哪些(xiē)经济(jì)领域将(jiāng)率先使用它们?
Marc:不,我认为人(rén)形机器人的(de)出现让(ràng)事(shì)情变得复杂。我认为机器人在工业领域的应用将取得很大进展。我认为机(jī)器人的(de)应用非常广泛。人(rén)们(men)对此非常关注。正如大家所说,使机器人变得越(yuè)来越好的技术(shù)确实正在日趋成熟。我认为工业将继续取得(dé)进步。
我(wǒ)认为人形机器人 本身总体上(shàng)仍然非(fēi)常不(bù)成熟。所以我看不到它们。我知道(dào)你(nǐ)可以看(kàn)看(kàn)一(yī)些人形机器人(rén)公司与汽车(chē)公司合作的演示。我认(rèn)为(wèi)这在某种程度上是一种炫耀,而不是一(yī)种生(shēng)产(chǎn)力。我不知道这(zhè)是不是题外话(huà)。如果你看看仓库机器人,你会发现最大的挑战之一是系(xì)统集成(chéng),特(tè)别是如果它不是围绕机(jī)器人设计的全新仓库。
我(wǒ)认为许多仓库(kù)机(jī)器人供应商都在苦苦挣(zhēng)扎,因为他们需要(yào)一个系 统集成商,而这个系统集成商会消耗(hào)掉太多的预算,因此很难赚钱(qián),这是因为运营仓库的 IT 人员并不想开放他们的系统。在那里工作的(de)人并不想(xiǎng)改变他们现在做的一切。如果机器人可以处理每一项任务,那就(jiù)意味着他们仍然需要一个人来完成任务。使用任何类型的机器人对行业来说都具有(yǒu)很大的复杂性。我认为这些都是重要(yào)因素。
说(shuō)实话(huà),我原(yuán)本以为(wèi) Spot 会取得更大的成功,但 Spot 的推出只(zhǐ)是一次实验。我们之所(suǒ)以设计 Spot,是因为它能够让你连接自己(jǐ)的传感(gǎn)器,因为我们不知道(dào)人们想要什么样的(de)传感器。我们(men)之所以设计 Spot,是因为它能够让你对它(tā)进行编程,因为我 们不知道现在的用户们都有哪些(xiē)应用程序,而(ér)我们对它们(men)的使用方(fāng)式有了(le)更(gèng)多了解,开发人员正专注于巨大(dà)机遇,因此 Spot 对人们的(de)接受度确实产生了影响。
也许如果(guǒ)我们没有足够的商人,能够提(tí)前进入并评(píng)估它是什么,我们实际上是在做一个实验。也(yě)许人形机器人会有更好的记录。
王鹤:我觉(jué)得我(wǒ)对人形机(jī)器人的(de)发展总体是比较乐观的,那么在(zài)未来5年(nián),我们要完成真正的大规(guī)模应用,这件事情(qíng)对于整个人形机器人仍然是一个先慢后快(kuài),其中慢的阶段,那么一个里程碑(bēi)应该是——在5年的时候我们(men)能达到万台人形(xíng)机(jī)器人级(jí)别的应用(yòng)。
这样的一个市场大约是对标现在商业清洁机(jī)器人。我们举(jǔ)个例子,在超市在万达广场在写(xiě)字楼一层,我们看(kàn)来回去洗地擦地的(de)机器人,那(nà)么领先(xiān)的这个市场,中国最领先(xiān)的公司(sī)大约是每年出货1万台,那么他做的事情不局限做(zuò)这么简单的事情,它能达(dá)到在各种场景(jǐng),不管是商超还是写字楼,还是(shì)很(hěn)多不(bù)同的场景进行清洁,但是当然是(shì)平面(miàn)清洁。
那么,对于我(wǒ)们人形机器人来说,我们希望能做到(dào)一(yī)个立体操作,但是它(tā)的能力可能是(shì)局限的,我搬运我就是(shì)上货,我就是取货,对吧?
我没有更多的能力,但是我也要实现跨场景的应用,可以在超市里、可(kě)以在工厂里、可以在服(fú)务场景等等。那么能达到5年1万台的市场规模的话,我相信后面有真实世界数据的回流,那时,我们会看到人形机器人应用规模会(huì)加快,从(cóng)慢时代进入快时代。
熊友军:人形机器人我对它的应用可能会更(gèng)加乐观一点,其实大家看到波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”这两年人形机(jī)器(qì)人的进步非常快,尤其(qí)在AI驱动下面,实际(jì)上在市场应用方面,你们(men)已经可以看(kàn)到国的有一些(xiē)企业,包括全球企业已经开始在一些(xiē)场景里面做试点应用了。
比如说在汽车厂,比如在一些商用服务场景,已经开始做试(shì)点,随着这(zhè)个试点数据会(huì)形(xíng)成一个飞轮的效应,所(suǒ)以试点进展,然后它会有更(gèng)多的迭代,然后有更多数据驱动,机器人会在在一些特定的环(huán)境里面(miàn)提高效率,它的速度,它的随着量的增长,它的价格会大幅的降低,这样我觉得会更快的去促进产业的应用。
我觉得今(jīn)年年底,大家应该(gāi)可 以看到,有一部分的(de)公司已经能够在一些比如说新能源汽车厂,比如说在一些特种领域已经开始应用,明(míng)年(nián)我觉得应该(gāi)可以看到一些可能千台左 右量级的出(chū)货。
问(wèn):你能在我们的年轻观众中“点燃一把火”,让他们也想成(chéng)为“机器人专家”吗(ma)?他们应该怎(zěn)么做(zuò)?
Marc:我认为伊(yī)隆·马斯克本人凭借他的雄心和资(zī)源,可能在几(jǐ)年内推出10000个机器人,不一定(dìng)是因为它们会直接让机器(qì)人赚钱,但看看他对电动汽车所做的一切。他们从无人相信(xìn)到现在,我(wǒ)比这里的 任何人都更(gèng)加怀(huái)疑,包(bāo)括我(wǒ)在内(nèi),到(dào)每家汽车公司都有淘(táo)汰内燃机的计划。
我认为这是一件(jiàn)了(le)不起的事情。他(tā)似乎对(duì)此很认真。所以这在整个人形机器人领域都是一个真正不确定性的因(yīn)素。我不(bù)确定(dìng)如果他没有抓住机会,是否会有这么多人形机(jī)器人。
我认为机器人玩得越有趣(qù),人们就越(yuè)能与它们互动。我到(dào)处走走,我没有带机器人来这里,但(dàn)这里有很(hěn)多机器人,但我到处发(fā)表演讲,发(fā)现(xiàn)机器人在计划中(zhōng)相当无聊。你(nǐ)总是能吸(xī)引一(yī)群人(rén),只要你(nǐ)愿意让他们与机器人互动,他们就会(huì)留下来。我认为我们做得越多,公众(zhòng)就会(huì)越(yuè)热情。我非常欣慰,参加这次活动最令人(rén)兴奋的事情可能是有很多人说(shuō)你做的(de)工作(zuò)是我(wǒ)十几岁时(shí)见(jiàn)过的,现(xiàn)在(zài)我正在做。我们(men)越能展示我们的工作并激励下一代(dài),这就会实(shí)现。
陈建(jiàn)宇:我(wǒ)的一个建议是(shì),因为机会其实永远是留(liú)给有准(zhǔn)备的人(rén),那么像Maec做这(zhè)个事情做了做了好几十年,然后包括我们其(qí)实台上(shàng)我们几位(wèi)也都是多年深耕在机器(qì)人或者相关领域,所以说,因为人形机器人它其(qí)实也是一个非常(cháng)长周期的事情(qíng),同时它也包罗(luó)万象,从(cóng)技术上的软件、硬件、AI再到(dào)商业、产品等等,其实各方面都有,所以(yǐ)说大家应该去问一问自己的内心在这一步范围内到底自(zì)己最有激情,最喜欢的最热爱的是什么?然后从此刻开始就去积(jī)累(lèi)它。最后,要(yào)么等待未来,要么(me)总有时刻你(nǐ)有施展自己的机会。
王兴兴(xīng):对于我觉(jué)得对于(yú)所有年轻人(rén),包括我们(men)其实(shí)这个时代都是非常(cháng)精彩的,而且想象一下,大家也知道(dào)AI、机器人都是(shì)阶梯性发(fā)展,就像(xiàng)GPT没有出来之前,大家(jiā)觉得语言模型没什(shén)么用,基本上是非常差,但突(tū)然就是发生了巨大进(jìn)步,非常好,其实机器(qì)人、AI也会遵(zūn)循这种规律,所以大家现在可能(néng)看到机器人的 AI 能力都(dōu)比较弱,但实 际上这是好(hǎo)事,为什么?因为大家(jiā)都有(yǒu)机(jī)会去(qù)做的更(gèng)好(hǎo),可以真正的把这种人类目前可以预估的最伟大技(jì)术,就在(zài)当下,就在未来(lái)几(jǐ)年,所以这个事情都是非常值得做(zuò)的,
而且,在机(jī)器人和 AI 另外一个比较适(shì)合年(nián)轻的点(diǎn),它没有那么多历史包袱,不像数学领域,有几百上千年(nián)的非常天才的数学家(jiā),你一定(dìng)要比他们做得好,你才可以做技术(shù),但是当下(xià),AI 和机器人它都非常年轻,尤其 AI 技(jì)术就最近几年的东西,所以非常适合年(nián)轻人(rén)。我一直感觉(jué)在如果在未来5年到10年(nián)或者几十年回看(kàn)我(wǒ)们(men)现在这个时代(dài),所以(yǐ)想想这种感觉(jué),真(zhēn)的非常激动(dòng)人(rén)心(xīn)。
王(wáng)鹤:我觉得其实未来的15年,在我心目中(zhōng)会是人(rén)形机器人,从当下在产业中没有规模化应(yīng)用,到(dào)可能成长到跟今天汽车的产(chǎn)量一个万亿市场的过程。那么在这个过程中(zhōng),其实对年轻人来说,那么我(wǒ)觉得大家就是(shì)做好自己就(jiù)可以了,因为15年之后(hòu)很多(duō)工作都是跟人形(xíng)机器人相关(guān)的,今(jīn)天可能(néng)你负责卖车,那么15年(nián)后,你可(kě)能岗位就调到卖人形机器人对吧?今天你是班级(jí)里头的佼佼者,那么你学 AI ,那么你可能发现你的(de)职业生涯就是围绕着(zhe)进一步(bù)提升人形机器人的能力展开的,所以大家(jiā)做好(hǎo)自己,我们(men)一起共享光明(míng)、人形机器人(rén)的未来。
熊友军:其实我是经历过个人电脑时(shí)代,我(wǒ)经历智能手(shǒu)机时代,我经历过移动(dòng)互联网的时代(dài),现(xiàn)在其实我们正在经历智能汽(qì)车的时代,电动(dòng)汽车的时代(dài),我觉得下一(yī)个时代实际(jì)上就是聚生智(zhì)能的(de)时(shí)代,而(ér)聚生智(zhì)能时代的典型(xíng)代表其实就是人性机器人(rén),所以我给现在的年轻人建议就是说保持野(yě)心,怀揣大梦(mèng)想。
问:让(ràng)我们(men)在(zài)小组成员之间花几分钟时间讨(tǎo)论(lùn)一下:你们(men)想要互相问什么(me)问题?
陈建宇:所以我想问Marc,你认(rèn)为(wèi)对于机器人和人(rén)工智能来说最(zuì)重要的研究问题是什么,例如,如果你(nǐ)只能选择一个研究项目,那么你选(xuǎn)择哪一个?
Marc:让我从侧面回答(dá)一(yī)下,这(zhè)也是一(yī)种(zhǒng)回避你的问题的方式。最后我没有展示我的最后一张幻灯片。我的最后一(yī)张幻灯片是(shì)一个(gè)展示机器人故障的视频(pín)。它展示了,我不知道它大(dà)概有 2 分钟(zhōng)长,可能有 25 种不(bù)同的(de)故障。我认为故障是工作中最有(yǒu)趣、最有意思、最有用的部分,关注(zhù)它们,然(rán)后在你的工作不(bù)工作的时候继续(xù)前进,这真的很重要。这不(bù)是研究的主题,但它是一种工作精(jīng)神。所以如(rú)果我要问你们(men)所(suǒ)有人这个问题的话,那(nà)就是我(wǒ)还(hái)没看到任何人在演讲中提到过事情无(wú)法正常运转(zhuǎn),而且我敢肯定,单一机器(qì)人不会在不发生碰撞的情况下完成那些后空翻以(yǐ)及它们所做的所有很酷的事情。你喜欢碰(pèng)撞吗(ma)?
王兴兴:Marc先生,很荣幸今天(tiān)见到您,我其实想有(yǒu)好(hǎo)奇想问一下,您觉得对于人形机器人的(de)手(shǒu),您觉得未来几(jǐ)年比较合适的有几(jǐ)个手指,或者几个电机,这会是(shì)比较好的一个方向?
Marc:再次,我要回答一个略(lüè)有不同的问题。我们研究所最近举办了一(yī)场研讨会,名为“对操纵的反向观点”。我认为灵(líng)巧性确实很重要,但基本上它并没有(yǒu)取得很大进展,尽(jǐn)管人们至少(shǎo)已经为此努力了 50 年(nián)。我认为我们必须以不同的方式(shì)思考(kǎo),再次尝试不(bù)同(tóng)的东西,就像我(wǒ)今天在演讲中开始的那样,也许我们需要(yào)更多的动态(tài)操(cāo)纵,而不是所有的静态抓握。我认为很多学(xué)习界的人在提出他们正在(zài)学习的灵巧性的要求时对自(zì)己要求(qiú)不够(gòu)。他们做的事情很简单,很容易。
我认为那里是有机会(huì)的(de),有多少只手我不知道有多(duō)少根手指。我认为(wèi)五个已(yǐ)经很多了。但也许有一天我会觉得更有趣的问题是手(shǒu)掌怎么样?我们的手掌功能非常强大,它们不仅(jǐn)仅是静态(tài)的块(kuài)。而且(qiě)你看到的几乎每个机器人手都(dōu)有许(xǔ)多手指在做(zuò)这件事,但仅此而已。
王鹤:之前我提到过,大概 15 年后,世界上会有(yǒu)数百万、一(yī)千万个人形机器人。如果 人形(xíng)机器人具有通用目的,那么人(rén)形机器人是终极体现,那么这种(zhǒng)通用目(mù)的的终极技术是什么?对于人类(lèi)噪音(yīn),您是否认(rèn)为视觉、语言、动作模(mó)型,这些端到端模(mó)型是人类噪音的终极(jí)技术(shù)或方法?
Marc:我很难相信,端到端是取(qǔ)得进步的方法 。也许(xǔ)最终在渐近(jìn)线上端 到端是正(zhèng)确的方法,但我认为我们知道的太多(duō)了。
说实话,我认(rèn)为人们过分看重(机器)学习。我知道应该对学习(xí)持乐观态度,但如果你看看当今存在的解决方案(àn),你会发现最好的解决方案中学(xué)习所起的作(zuò)用微不足道(dào)或微不(bù)足道。当然,在波士顿动(dòng)力公司(sī),今天学(xué)习(xí)很少(shǎo),尽(jǐn)管人们正在努力 。我认为控制(zhì)系(xì)统、控制(zhì)理论、观察器,这些在过去 20 或 30 年建立起(qǐ)来的东西仍然发挥着巨(jù)大(dà)的作(zuò)用。
我(wǒ)不想(xiǎng)就这样(yàng)把它抛弃。我希望我们能真正拥 抱学习,但要把它与(yǔ)我(wǒ)们已经知道(dào)的东西结合起 来,找到一种(zhǒng)方法把它们结合起来(lái),至少在接下来的5年或(huò)10年(nián)里,也许在渐近线上,情(qíng)况会有所不同。
熊友军:我的一个(gè)问题是,Marc作为波士顿动(dòng)力的创始人,您(nín)之前开发了像Atlas这样的非常令人惊奇(qí)的这种产品,但(dàn)是我(wǒ)们前不久我们(men)看到波士顿动力(lì)终止了这个机(jī)器的(de)研发,然后由(yóu)原来的液压(yā)驱动,转(zhuǎn)向纯电驱动的这种(zhǒng)方式。对这方面是出(chū)于什(shén)么样(yàng)的考虑?是因为成本的考虑(lǜ),还是因为(wèi)出于商业化的(de)考虑?同(tóng)时我(wǒ)还想知道,波士顿动力未来5年的一些这种计划(huà),对商业(yè)化的一些(xiē)计(jì)划。
Marc:我认(rèn)为,如果你问为(wèi)什么要进行转变(biàn),我认为(wèi)有两个(gè)关键因素:一个是液压机(jī)器(qì)人,我喜欢液压技术,我会用(yòng)液压技术制造很多机(jī)器人。我认为(wèi),建造人形机器人或类似人(rén)形机器人仍有空(kōng)间,它(tā)们将继续使用液压技术(shù),因为重量和强(qiáng)度等因素。
但我认为有两点。一是它们(men)很麻烦(fán),至少对(duì)于像 Atlas 这样的高性能(néng)机器人来说,尽管我们付出了(le)无尽的(de)努力,也永远(yuǎn)无法(fǎ)让它们完全不漏油。当你把石油机器人放到工厂和家里时,它们就不能滴油;同时,很难找到(dào)精通(tōng)液压技术的人,因为人们认(rèn)为这是非常古老的东西,尽(jǐn)管 Atlas 在 液压工作(zuò)原理方(fāng)面有(yǒu)很多(duō)创新,从服务器阀门到 HPU 液压动力装置,一直都是如此,确实有创新的东西在进行;最后,我认为电动汽车在规(guī)模上已经(jīng)足(zú)够强大,它们可以参与竞争。我 不想代表波士顿动力发(fā)言,尽管(guǎn)我是创(chuàng)始人之一,并且仍然是董事会成员,但我认为他们必须有自己的计划,说明未来的计划以及技术的所有细节(jié)。我想随(suí)着事情的发展,你会发(fā)现(xiàn)更多这方面的(de)内容。
主(zhǔ)持人:非常(cháng)感谢。我(wǒ)想观众肯(kěn)定会有更多问题,也(yě)许(xǔ)吧,但(dàn)我们的时间真(zhēn)的不多(duō)了。所以非(fēi)常(cháng)感谢各位小组成员(yuán)。非常感谢(xiè)观众的(de)到来和聆听(tīng)。我 认为这是一场非(fēi)常精彩(cǎi)的会议,尤其是小(xiǎo)组讨(tǎo)论。我对组织者的建议(yì)是,我们明年再举办一次类似的会(huì)议,然后我们可以(yǐ)回(huí)顾进展和未来的步骤。
未经允许不得转载:中央空调,电梯,空气能热水器-中央空调,电梯,空气能热水器 波士顿动力创始人对话国内四大AI机器人CEO:“人形机器人是炫耀而非生产力”
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了