AI“源神”启动!影响多大?
开源还是闭源?这是属于大模型(xíng)的时(shí)代(dài)之问。
今年年初,埃隆·马斯(sī)克在对OpenAI及其CEO萨姆·奥(ào)特(tè)曼提起诉讼时,就对OpenAI逐渐不公开其(qí)模型(xíng)研究相关细节的行为大加谴责(zé)。“时至今日,OpenAI公司网(wǎng)站还宣称(chēng),它的宗旨(zhǐ)是确保通用人工智能(néng)造(zào)福全人 类。然而,在现实中,OpenAI已经转(zhuǎn)变为科技巨头微软事(shì)实上的(de)闭源子公司。”这位曾经的OpenAI联合(hé)创始人(rén)如此表示。
OpenAI不够“Open”,Meta却“Open”了自己最新的开源人(rén)工智能(néng)模型。
4月18日,Meta 发布了其(qí)最新版本的开源大模型 Llama 3,引起开源AI社(shè)区的一阵欢(huān)呼。巧合的是,Llama 3发布(bù)当天正好(hǎo)是AI领域顶尖学者、AI开源倡导者吴恩达的生(shēng)日。“(Llama 3是)至今为止最好的(de)礼(lǐ)物,谢感谢Meta!”他说(shuō)。
行至2024,开闭(bì)源之争日渐白热化。闭源阵营(yíng)以目前最强的OpenAI为代表,开源阵营Meta的LLaMa、Mistral和Google等也在不断迭代。闭源阵营坚持对(duì)Scaling Law的信仰,押注在更强通用(yòng)模型的打造上;开源阵营模(mó)型能力不断提升,并(bìng)且强调以更垂直的性能、更灵活的配(pèi)置来(lái)推动大模型(xíng)商业化落地。
关于应该选(xuǎn)择模型开源还(hái)是(shì)闭源讨论经久不息。
对于局内人,这一(yī)选择这不仅决定了他们将如何点亮AI“科技树”,更将影响他们的(de)商业路线选择。换言之,这很有可能是这个残酷(kù)竞争市场下的生存问题。
两个版(bǎn)本,多重惊喜
Meta此次发布的Llame 3包括8B和70B的预训练和(hé)指令微(wēi)调版本(běn)。
据Meta官网信息,Llama 3 模型将数据(jù)和规模提升(shēng)到新的(de)高度。它在两个定制24K GPU集(jí)群上基于超过 15T 的数据进行了训练——训练数据集(jí)是Llame 2使用量的7倍有余。它支持 8K 上下(xià)文长度,是 Llama 2 容量的两(liǎng)倍。
除了 Llama 3,Meta 还发布了新的(de)信任和安全(quán)工(gōng)具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。
据悉,Llama 3 即将在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主 要云提(tí)供商、模型 API 提供商平台上线,Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的硬件平台(tái)的支持。
在官网(wǎng)上,Meta还放出了Llama3两个版本与谷(gǔ)歌Gemma、谷歌Gemini、Mistral、Anthropic的(de)Claude 3等竞(jìng)争(zhēng)对手的参数对比。据Meta官网,Llame3在(zài)MMLU(学科知识理解)、GPQA(一般问题)、HumanEval(代(dài)码能力)、GSM—8K(数学能力)、MATH(比较(jiào)难的数学问(wèn)题)5个评测集上(shàng)均表(biǎo)现良(liáng)好。
值得注意的(de)是,Llama3的代码能力非常 优秀。在AI领域公众号“数字生命卡兹AI“源神”启动!影响多大?克”主理人卡兹克分享的用户实测(cè)中,Llama3—8B能够给出国际象棋中经典皇后问题的解题代码。而其前代版本Llama2需要专门的代码模(mó)型才能实现。
市场的反应速度很快。18日当天,Meta股价逆势(shì)收涨1.54%。次(cì)日,百度智能云(yún)千(qiān)帆大模型平台开放邀约测试,提供针对Llama 3的训练推理方 案,帮(bāng)助开发者训练专属大模型。
8B和70B 两个(gè)型号的模型,仅仅标志着 Llama 3 系列的开(kāi)端,Meta AI首席科学家杨立昆在其社交媒体透露,在接下来的几个月,还会有更多版本陆续发布。
英伟达(dá)高级科学家Jim Fan认(rèn)为之后可能会发(fā)布的Llama 3-400B以上的版本将成(chéng)为(wèi)某(mǒu)种“分水岭”,开(kāi)源社(shè)区将能用上(shàng)GPT-4级别的模型。
不(bù)下牌桌,各显 神通
上(shàng)一轮元宇(yǔ)宙(zhòu)竞争中被认为可能跌进坑里的Meta,在人工智能的牌桌上打出了Llama系列这把好牌。要讨论Llama3带(dài)来的(de)行(xíng)业震荡,首先要(yào)明白,什么是大模型领域的开源?
大模型领(lǐng)域的开(kāi)源通常意味(wèi)着模型的架构、训练代(dài)码和预训(xùn)练权重等都(dōu)被(bèi)公开,允许研究人员和开发者自由地(dì)访问和使用。
不过(guò),开源的程度因(yīn)模型而异。“有些(xiē)可能只提(tí)供(gōng)有限的(de)访问权限或部(bù)分代码(mǎ)。”郭涛指出,判断大模型是否真正开源的基准可能包括:代码和数(shù)据的(de)可访问性、使用许可的宽松程(chéng)度、社(shè)区支持的活跃度以及对改进(jìn)和新应用的开放性。
放眼AI界,两条路径上都各有“头(tóu)号玩家”分布。闭源自不必说,海外有OpenAI旗下的ChatGPT,国内是百度的文心一(yī)言(yán)以及风头正劲(jìn)的月之暗面Kimi。
而开源方面,除了Llama系列,目前应用较(jiào)广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly,以(yǐ)及MosaicML的MPT等。国内则包括,阿里(lǐ)巴巴的通义千问(wèn),智谱的(de)ChatGLM-4、百川智能的(de)baichuan-7B中英文大模型、北京智(zhì)源悟道3.0大(dà)模型系列和面壁智能(néng)的CPM-Bee 10B中文基座大模型等。
形成这样的分(fēn)化,很(hěn)多时候是受技术进步和商业模式迭代等(děng)的多重影(yǐng)响(xiǎng)。
天使投资人、资(zī)深人工智(zhì)能专家郭涛认为,从(cóng)技术角度来看,开源可以促进(jìn)学术界的研究和创(chuàng)新,而闭源则有助于在一(yī)定时间内保持技术领先优势。
从商业(yè)角度来(lái)看,开源可以吸引开(kāi)发者社区的贡献,促进技术(shù)的快速迭代和应用的广泛传播,但(dàn)可能会影响到公司的盈(yíng)利模式。闭源则可以保护知识产权,为公司创造直接的收入来源,但可能会(huì)限制技术(shù)的(de)普及和生态的建设。
事实上,在Llama3发(fā)布(bù)之前,中文互联网刚刚经历(lì)了一轮开闭源论(lùn)战。
据媒体报道(dào),百度(dù)CEO李(lǐ)彦宏近日表态,认为大模型开(kāi)源意义不大,闭源模(mó)型(xíng)性能(néng)会不断提升。“有(yǒu)了文心大模型(xíng)4.0,我们可以根(gēn)据(jù)需要兼(jiān)顾效果、响应速度、推理成本等各种考虑,裁剪出适合各种(zhǒng)场景的更小尺寸模型,且支持精调和post pretrain。通过降维裁剪出的(de)模型,比直接拿开源调出来的模型,同等尺寸下效果更好,同等效(xiào)果下成本明显(xiǎn)更低。”
李彦宏一直是闭源(yuán)路(lù)线的忠实拥趸,理由包(bāo)括但不限于认可闭(bì)源商业模式可以更好地聚集人力和财力等。
而其反对者(zhě)——360创(chuàng)始人周鸿祎言简意赅 ,“一(yī)句(jù)话,今天没(méi)有开源就没有 Linux,没有 Linux 就没有互联网。”
“源神”启动,影响几何?
“Llama 3的发布会带来市场格局的改变。”郭涛在接受21记者(zhě)采访时(shí)指出,其优异表现可能吸引更多的用户和投资者,从而(ér)增加其市(shì)场份额。
官网显示,Llama 3将有条(tiáo)件地开源给商业使用(月活用户超 过7亿需要(yào)单独申请)。“不过这基本等于完全免费商(shāng)用了。”卡兹克表示。
此前,投(tóu)资人朱啸虎曾经就人工智能市场相关话题接受腾讯新(xīn)闻采访。当被问及2023年(nián)大(dà)模(mó)型发展的(de)关键节点时,他给出(chū)的回答正是Llama上线。这让中国在(zài)应用层面创新有了(le)基础(chǔ),降低了商业化门(mén)槛。
当然,朱啸虎提到的变现是(shì)指开(kāi)源生态内的用户。对于开源大(dà)模型(xíng)发布(bù)者的能否盈利,或者能等来盈利机会,很多时候并没(méi)有确定的答案(àn)。
闭源大模型通常通过授权使用、订阅服务或者直接销售产品来盈(yíng)利。其中的代表(biǎo)便是AI领域的领跑者OpenAI,虽然(rán)其一(yī)直(zhí)有推进开(kāi)源项(xiàng)目的动作,但其处在核心地位的(de)ChatGPT却一(yī)直(zhí)采(cǎi)取收取API许可(kě)费的方(fāng)式向其他公司提供 服务。在API服务过(guò)程,其他公司不会接(jiē)触到(dào)ChatGPT模型的细节和源代码(mǎ),仅仅通过(guò)API接口进行调用。
创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示,ChatGPT以(yǐ)70%的(de)应用率成为美国小型企业应用最多的生(shēng)成式AI产品,这(zhè)说(shuō)明OpenAI选择的闭源模(mó)式的商业化之(zhī)路在一定程(chéng)度已经跑通(tōng)。
开源模型如何(hé)寻求生(shēng)存(cún)和发展的机会?
首先是以开放的生态(tài)吸(xī)引用户。国盛证券研报就指出,开源大模型(xíng)借助更大标(biāo)识符训练数据集、DeepSpeed、RLHF等方式,实现低训练成本和高性能,超大模型(xíng)以下大模型的壁垒正在消失。
“在拥有用户后,开(kāi)源大模型通(tōng)常通过提供增值服务、定制开(kāi)发、技术支持等方式(shì)来实现盈利”。郭涛指出,公司可以在开源模型的基础上提供专(zhuān)业的训练服务或者定制化的应 用解决方案(àn)。
对于Meta甚至众(zhòng)多(duō)开源者而言,开源的野心不仅是短期的商业变(biàn)现,其更(gèng)想引领规则设计 以及搭建生态。有业内专家分析,开源后壁垒并没有那么容易破除,高(gāo)质量、标注过(guò)的训练数据集(jí)尤(yóu)其是专业模型的壁垒。
星(xīng)纪(jì)魅族集(jí)团(tuán)数据(jù)合规执行总监朱玲凤表示,目前有些(xiē)开源AI由头部公(gōng)司主导,“越多人使用(yòng),就越能强化网格效应,而且不是真正(zhèng)的开放,后续需要使用它们的配套工具、配(pèi)套服务。头(tóu)部公(gōng)司还可能(néng)利用(yòng)监管豁免的方(fāng)式,获得(dé)寻租空间。”换言之,以开源为噱头的巨头游戏,可能会进一步强化(huàAI“源神”启动!影响多大?)大公司的垄断地位(wèi),反而(ér)不利于产业竞(jìng)争。
据报道,去(qù)年4月,在扎克伯格与分析师的一次电(diàn)话会议中,他就谈到,如果行业能够在Meta使用的基础工具上达(dá)成标准化,那么meta就能从其(qí)他人的改进中受(shòu)益。同年(nián)5月(yuè),谷歌内部泄露的文(wén)件《我们没有护城河,OpenAI也没有(yǒu)》在SemiAnalysis网站上传播,其中的观点包括,比起开源社区需要谷歌,谷歌更需要开源社区等等。文章作(zuò)者指出,不同开源模型所组(zǔ)成的生态 系统永远(yuǎn)是(shì)OpenAI的潜在竞争对手(shǒu),与开源AI竞争的结果必(bì)然是失败。
Meta落(luò)子,战局生变。大模型的路线之争(zhēng)会(huì)不会迎(yíng)来真正的胜利者?
“开源(yuán)与闭源大模型之间不太可能分出(chū)绝对的输(shū)赢,因为它们各自适合不同的应用(yòng)和场景。”郭涛认为,开源大模型更适合那(nà)些需要快速创新AI“源神”启动!影响多大?和大规模协作的项 目,而闭源大模(mó)型可能(néng)更适合那些对性能和安全性(xìng)有极高(gāo)要求的商业应用。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了