高峰:从私域AI到具身智能
专题:2024中国AIGC创(chuàng)新(xīn)发(fā)展(zhǎn)论(lùn)坛
2024年服贸会专题论坛之一——“2024中国AIGC创新发展(zhǎn)论坛”于9月13日-14日在北京举行。智子引擎(qíng)产品副总裁高峰 出席(xí)并演讲(jiǎng)。
高峰介绍,和大多(duō)数大模型企业一样,过去一年,智子引擎在垂直领域中做了很多落地(dì)项目,但经(jīng)过内部复盘,发现很多多模态(tài)大模型的能(néng)力其实还没有被企业充分利用。传统企(qǐ)业和我们AI大模(mó)型(xíng)公司之间,似乎隔着一层“窗户纸”。因此,公司决定走一条艰难但有效(xiào)的路,这条(tiáo)路就是私(sī)域AI。“我们重新思考,企业与AI公司的关系不应(yīng)该是供需关系,而应是共创关系”。
“积跬步,行(xíng)千里”,高峰说,开发私域AI解决方案的过程,也(yě)是在帮(bāng高峰:从私域AI到具身智能)助Awaker逐步认识和理解世(shì)界。“我相(xiāng)信,当(dāng)我们积累到一定程度时(shí),先进(jìn)的生产力将会爆发,而(ér)那时我们就可以进行更为先进的通用层面的整(zhěng)合。那将是一个新的时机(jī),作为一个技术(shù)创新型(xíng)企业,我们更多的是把(bǎ)自己(jǐ)定位在创新领(lǐng)域,推动 AI给(gěi)产(chǎn)业的赋能”。
以下为(wèi)演讲实录:
高峰(fēng):尊敬的各位来宾,大家好!非常荣幸能代表智子引擎科技有限公司分享我们的科研成(chéng)果,今天我演(yǎn)讲的主题是《从私域AI到具(jù)身智能》。
首先,我想(xiǎng)谈谈过去一年我们 所做的工作。和大多数大(dà)模型(xíng)企业(yè)一(yī)样,我们在垂直领域中做了很多落地项目,但经过我们内部(bù)的复(fù)盘,发现(xiàn)很多多模态大(dà)模型的能力其实还没有被企业充分(fēn)利用。传(chuán)统企业和我们AI大模型公 司(sī)之间,似乎隔着一层“窗户(hù)纸”。因此,我们决定(dìng)走一条艰难(nán)但(dàn)有效的路,这条路就是私(sī)域AI。我们重(zhòng)新(xīn)思考,企业与AI公司的关(guān)系不(bù)应该是供需关(guān)系,而应是共创关系(xì)。
接下来,我将从四个方面展开我(wǒ)的分享。首先,请允许我简单(dān)介绍一下我们(men)公司。
智子引(yǐn)擎科技有限公司的科研人(rén)员主要来自(zì)中国人(rén)民大(dà)学高瓴(líng)人工智能学院,我们的核心(xīn)团队曾参与智源研究院(yuàn)的悟道·文澜项目(mù)。我们研(yán)发了国产首(shǒu)个国产多模态大模型。
接下来介绍一下我(wǒ)们的(de)“孩子”——Awaker,中文名叫觉醒者。我们希望Awaker能像人(rén)的大脑一样进行思考决策,赋予企业流水线和(hé)机(jī)器以生命。Awaker可以像普通人一样思考,也可以像领域专家或技术工人一样思考。它由三部分能力组成:对话能力(lì)、检索能(néng)力和生成能力。你可以从(cóng)拟人化的角度(dù)来(lái)理解它,它能够对话,能够感知外(wài)部环境(jìng),但这种感(gǎn)知基于数据进行(xíng)。Awaker还能(néng)生成我们需要的一(yī)些指(zhǐ)令,涵盖感知(zhī)、理解、决策、规划和控制。这些能力(lì)可(kě)以应用于有形的硬件,比如四足机(jī)器人或两足机器(qì)人,也可以应用(yòng)于无形的系统,比如(rú)程(chéng)序大脑、企业大(dà)脑,甚至私人管家。重点在于Awaker如何感 知、理解、决策、规(高峰:从私域AI到具身智能guī)划并最终实现(xiàn)控制(zhì)。
感知可以通过语言交流,也可以通过声(shēng)音传感器(qì)接收音频信号,当然还包括温度、湿(shī)度(dù)等复杂的传感器。Awaker通过多(duō)模态数据融合理解外界信息,基于之(zhī)前学习的知识进行决策和规划。如果是 在硬件上,它可以控制机械(xiè)臂;如果是在软件(jiàn)系统中(zhōng),它可以控制API,执行各种操作。
这就是我们所谓的“多模态(tài)输入、多模态输出(chū)”架构(PPT图示)。输入形式是多模态的,比如文本问答、图片(piàn)问答、声(shēng)音问答。在(zài)专业领域(yù),还包括通过传感(gǎn)器采集的数据(jù)。Awaker通过多模态融合理解这些数据后,能进行(xíng)决策、规划和控制(zhì)。
前面提到的共创关系,意味着企业不只是提供数据,而是提供学习素材。大(dà)模型(xíng)通过学习这些素材 得到只是。大模型出厂(chǎng)时,可能就像一个有强烈求知欲望的孩子,但如果没有学习(xí)材料,它仍只是一个普通的孩子。我们和企(qǐ)业共创,打造先进的生产工具。私域AI为(wèi)企业提供的不仅是降本增效,更是提升核心竞争力的关键。
接下来,我讲一个实际案例——无人机巡检 。传统(tǒng)无人机通过摄像头、激光雷(léi)达等传感器采集农场(chǎng)数据(jù),传输到(dào)大模型数(shù)据分析中心,检测农作物是否异常(cháng)。如果(guǒ)异常,传统小模(mó)型会直接发出警告。而Awaker具(jù)备农业 领(lǐng)域的知识,它不仅能识别病虫害,还能生成(chéng)一整套解决方案,告(gào)诉维修(xiū)人员需要用什么农药、喷洒多少、具体喷洒(sǎ)位(wèi)置,并通过API下发(fā)工单给相关(guān)人员。如果配备(bèi)了喷洒农药的无人机,Awaker可以直(zhí)接生成(chéng)报(bào)告,并下发任务,自动规划喷洒(sǎ)路径并执(zhí)行作业(yè)。
这套框(kuāng)架(jià)还可应(yīng)用于搜救任务,如无人机通过传感器(qì)感知受灾(zāi)区域并生成救援高峰:从私域AI到具身智能路径。
第二个(gè)例子(zi),我们(men)先看一段视频。
(现场播放视频(pín))
通过这个视频大家可以看到,企业内部的系统大 多是通过点击功(gōng)能模块(kuài)来进行操作的。而在AI时代,我们提前预置了指令。大模型能(néng)够理解自然语言,在刚才演(yǎn)示的变电(diàn)站案例中,控(kòng)制的最小动作其(qí)实是(shì)通过API来(lái)实现的。用户发出的(de)自然语言指令被系统理解为中文(wén),之后与原子(zi)动作相关的API进行匹配,并最(zuì)终输出结果。对于大模型来说,这没有什么神秘之处 ,关键在于企业需要为大模型提供(gōng)学习材料,比如相(xiāng)关的知识文档。大模型(xíng)能(néng)够自主学(xué)习这(zhè)些(xiē)内容,从而提升其能力。
接下来谈一下我们的未来规划。我(wǒ)们希望与传统企业共(gòng)创,走私域AI解决方(fāng)案这 条路。虽然过程中可能会遇到很(hěn)多(duō)不确 定(dìng)性,但先进的生产(chǎn)力和优秀的解决方案,往往是在双方紧密合(hé)作中迸(bèng)发(fā)出来的。如果仅仅是供需关(guān)系,企业可能只会将自己认知范围内的问题交给大模型(xíng)处(chù)理,但真正有效的合(hé)作是要让大(dà)模型参与到(dào)企业的核心生产流程中,重塑整个流水线和生产环境。如果结(jié)合云边(biān)协(xié)同,整个大模型将变得更加强大,因为城市中的摄像头、巡逻车、无(wú)人机(jī)等都会(huì)成为大模型的传感器,城市中各个单位的工作职责和(hé)路线关系都可能因(yīn)此发生变化。
“积跬步,行千里”,我们开发私域AI解决方案的过程,也是在帮助Awaker逐步认识和理解世界。我相信,当我们积累到一定 程度时,先(xiān)进(jìn)的生产力将会爆(bào)发,而(ér)那时我们就可以进行更为先进的通 用层面的整合。那将是(shì)一个新的时(shí)机,作(zuò)为一个技术创(chuàng)新型企(qǐ)业,我(wǒ)们更多的是把(bǎ)自己定(dìng)位在创新领域,推动AI给产业的赋能。
最后,我真诚期望有更多(duō)的合(hé)作伙伴加(jiā)入到我(wǒ)们(men)的AI事业中,与我们共同打造新(xīn)质生产力,推(tuī)动先进流水(shuǐ)线的发展。我的分享到此结束(shù),感谢大家(jiā)的(de)聆(líng)听。
新浪声明:所有会议实录均为现场(chǎng)速记整理,未经演讲(jiǎng)者审阅(yuè),新浪网登(dēng)载此文出于传递更(gèng)多(duō)信息之目的,并(bìng)不意味着赞同其观点或证实其描述。
责任编(biān)辑(jí):梁斌 SF055
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了