高峰:从私域AI到具身智能
专题:2024中国AIGC创新发展论坛
2024年服贸会专题论坛之一——“2024中(zhōng)国AIGC创(chuàng)新发展论坛”于9月13日-14日在(zài)北京举行(xíng)。智子引擎产品副总裁高峰出席(xí)并演讲。
高峰介绍,和大多数大模型企(qǐ)业一样,过(guò)去一年,智子引(yǐn)擎在垂直(zhí)领域中做了很多落地项目,但经过内部复盘,发现很多多模态大模型的能力(lì)其(qí)实还没有被企业充分利(lì)用。传统企业和我们AI大模型公司之间,似乎(hū)隔着一层“窗(chuāng)户纸”。因此,公司(sī)决定 走一条艰难但(dàn)有效的路,这条(tiáo)路就是(shì)私域AI。“我们重新思考,企(qǐ)业与AI公司的关系不应该是供需关系,而应是共创关系”。
“积(jī)跬步,行千里”,高(gāo)峰说,开发私(sī)域AI解决方案的过程,也是在帮助(zhù)Awaker逐步认识和理解世界。“我(wǒ)相信,当(dāng)我们积累到一定程度时,先进的生产力将会爆发,而那时(shí)我们就可以进行更 为(wèi)先进的(de)通用层 面的整合。那(nà)将是一个新的时机,作(zuò)为一个技术创新型企业,我们更多的是把自己定位在创(chuàng)新领域,推动AI给产业 的(de)赋能(néng)”。
以下为演讲(jiǎng)实录(lù):
高峰:尊敬的各(gè)位来宾,大家好!非常荣幸能代表(biǎo)智子引擎科技(jì)有限公司 分享我们的科研成果,今天我演讲的(de)主题是《从私域AI到具身智能》。
首先,我想谈谈过去一年我们所做的工作。和大多数大模(mó)型企业一样,我们在垂直领域中做了很多落地(dì)项目,但经过我(wǒ)们内部的复盘,发现很多多模态大模型的能力其实(shí)还没有(yǒu)被企业充(chōng)分利用。传统企(qǐ)业和我们AI大模型公(gōng)司之间(jiān),似乎隔着一层“窗户纸(zhǐ)”。因此(cǐ),我们决定走一条艰 难(nán)但有效的路,这条路就是(shì)私域AI。我们重新思考,企业与AI公司的关系不应该是供需关(guān)系,而应是共创(chuàng)关系。
接下来,我将从四个方面展开我的分享。首先,请允许我简单介绍一下我们公(gōng)司。
智子引擎科技有限(xiàn)公(gōng)司的科研(yán)人员主要来自中国人民大学高(gāo)瓴人工智能学院,我们的核心团队曾参与智源研(yán)究院的悟道·文澜项目。我(wǒ)们(men)研发了(le)国产首(shǒu)个国产(chǎn)多(duō)模(mó)态大模型。
接下来介绍一下我(wǒ)们的“孩子(zi)”——Awaker,中 文名(míng)叫觉醒者。我(wǒ)们希望Awaker能像人的大脑一样进行思考决策,赋予企业流水线和机器以生命。Awaker可以像普通人一样思考,也可(kě)以像领域专家或技术工人一(yī)样思考。它由三部分能力组成:对话(huà)能力、检索能力(lì)和(hé)生成能力。你可以从拟人化的角(jiǎo)度来理(lǐ)解它,它能够对话,能(néng)够(gòu)感知外部环境,但(dàn)这种(zhǒng)感知(zhī)基于(yú)数据进行。Awaker还能生成(chéng)我们需要的 一些指令,涵盖感知、理解(jiě)、决(jué)策、规划和控(kòng)制。这些能力可以应用于有形的硬件,比如四足机器人或两足机(jī)器人,也可以应用(yòng)于无形(xíng)的系统,比如程序大脑、企业大脑(nǎo),甚(shèn)至私人管家。重点在于Awaker如何感知、理解、决策、规划并最终实现控制。
感知可以高峰:从私域AI到具身智能通过语言交流,也可以通过声(shēng)音传感器接收音频信号,当然还包括温度、湿度等(děng)复杂的(de)传(chuán)感(gǎn)器。Awaker通过多模态数据融合理解外(wài)界信息,基于之前学习的知识进行决策(cè)和规划。如果是在硬件上,它可以控制(zhì)机械臂;如 果是在软(ruǎn)件(jiàn)系统中(zhōng),它可以控制API,执(zhí)行各种操作。
这就是我们所(suǒ)谓的(de)“多模态高峰:从私域AI到具身智能输入、多(duō)模态输出”架构(PPT图示)。输入形式是多(duō)模(mó)态的,比(bǐ)如文本问答、图片问答、声(shēng)音(yīn)问答。在专业领域,还(hái)包括通过传感器采集的数据(jù)。Awaker通过多模(mó)态融合理解这些数据后,能进行决策、规划和控制。
前面提到的共创关系,意味着企业不只是提供数据,而是提供学习素材。大(dà)模型通过学习(xí)这些素材得到(dào)只是。大(dà)模型出厂时(shí),可能就像一个有强烈(liè)求知欲望的孩子,但如果没有学习材料,它仍只是一个普通的孩子。我们(men)和企业共创,打造先进的(de)生产工具。私域AI为企业(yè)提(tí)供的不仅是降本增效,更是提(tí)升核心竞争力的关键。
接下来,我讲一个实际案例——无人机巡检。传统无人机通(tōng)过摄像头、激光雷达等传感器采集农场数据(jù),传输到大模型数据分析中心,检测农作物是否异(yì)常。如 果异常,传统小模型会直接发出警告。而Awaker具备农业领域的(de)知识,它不(bù)仅能识别病虫害,还能生成一整套解决方案,告诉维修人员(yuán)需要用什么农药(yào)、喷洒多少、具体喷洒位置,并通过API下发工单给相关(guān)人员。如果配备了喷洒农(nóng)药的无人机,Awaker可以直接生成报告,并下发任(rèn)务,自动规划喷洒(sǎ)路径并执行(xíng)作业。
这(zhè)套框架还可(kě)应用于搜救(jiù)任务,如无人机通过传感器感知受灾区域并生(shēng)成救援路径 。
第二个例子,我们先看一段视频。
(现场播放(fàng)视频(pín))
通过(guò)这个(gè)视频大家(jiā)可以看到,企(qǐ)业内(nèi)部的系统大多是通(tōng)过点击功能模(mó)块来进(jìn)行操作的。而在AI时代,我们提前预置了指令。大模型(xíng)能够理解自然语言,在刚才演示的变电站案(àn)例(lì)中,控制的最小动作其(qí)实是通过API来(lái)实现的(de)。用户(hù)发出的自然语言指令被系统理解为中文,之后与原子动作相关(guān)的API进行匹配,并最终输出结果。对于大模型来(lái)说,这没有什(shén)么(me)神秘之处,关键在于企业需要为大模型提供学习材料,比(bǐ)如相关的知识文档。大模型能够(gòu)自主学习这些内容,从而(ér)提升其能力。
接下(xià)来(lái)谈一下我们的未(wèi)来规(guī)划(huà)。我们希望与传统企业共创,走私域(yù)AI解决(jué)方(fāng)案这条路。虽(suī)然过程中可能会遇到很多不确定性,但先(xiān)进(jìn)的生产力和优秀的解决(jué)方案,往往是在(zài)双方紧密合(hé)作中迸发出来的。如果(guǒ)仅仅是供(gōng)需关系,企业可能只(zhǐ)会将自己认知范围内的(de)问(wèn)题交给大模型处理,但真正有(yǒu)效的合作是要让大模型参与到企业的(de)核心生产流程中,重塑整个流水(shuǐ)线和生产环境。如果(guǒ)结合云(yún)边协同,整个大(dà)模型将变得更加强大,因为城市中的摄像头、巡逻车、无人机等都会成为大模型的传感器,城市中各个(gè)单位的工作职责和路线关系都可能因此发生变化。
“积跬步(bù),行千里(lǐ)”,我们开发私(sī)域AI解决方案的(de)过程,也是在帮(bāng)助Awaker逐步认识和理解世界(jiè)。我相信,当(dāng)我们积累到一定程度时(shí),先进的生产力将会爆(bào)发(fā),而那时我们就可以进行更为(wèi)先(xiān)进的通(tōng)用(yòng)层面的整合。那将是(shì)一个(gè)新(xīn)的时(shí)机,作为一个技术创新型企业,我们更(gèng)多的是把自(zì)己定位在创新领域,推动AI给产业的赋能(néng)。
最后 ,我真诚期望有更多(duō)的(de)合作伙伴加入到我们的(de)AI事业中,与(yǔ)我们共同打造新质生产(chǎn)力,推动先进流水线的发展。我的分享到此结束,感谢大家的聆(líng)听。
新浪声明(míng):所有会议实录均为现场速记整理,未经演讲者审阅,新浪网登载此文出于传递更多信息之目的,并不意(yì)味着赞(zàn)同其观点或证实(shí)其描述(shù)。
责任编(biān)辑:梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了