AI“源神”启动！影响多大？

开源还是闭源？这是属于大模型(xíng)的时(shí)代(dài)之问。

今年年初，埃隆·马斯(sī)克在对OpenAI及其CEO萨姆·奥(ào)特(tè)曼提起诉讼时，就对OpenAI逐渐不公开其(qí)模型(xíng)研究相关细节的行为大加谴责(zé)。“时至今日，OpenAI公司网(wǎng)站还宣称(chēng)，它的宗旨(zhǐ)是确保通用人工智能(néng)造(zào)福全人类。然而，在现实中，OpenAI已经转(zhuǎn)变为科技巨头微软事(shì)实上的(de)闭源子公司。”这位曾经的OpenAI联合(hé)创始人(rén)如此表示。

OpenAI不够“Open”，Meta却“Open”了自己最新的开源人(rén)工智能(néng)模型。

4月18日，Meta 发布了其(qí)最新版本的开源大模型 Llama 3，引起开源AI社(shè)区的一阵欢(huān)呼。巧合的是，Llama 3发布(bù)当天正好(hǎo)是AI领域顶尖学者、AI开源倡导者吴恩达的生(shēng)日。“（Llama 3是）至今为止最好的(de)礼(lǐ)物，谢感谢Meta！”他说(shuō)。

行至2024，开闭(bì)源之争日渐白热化。闭源阵营(yíng)以目前最强的OpenAI为代表，开源阵营Meta的LLaMa、Mistral和Google等也在不断迭代。闭源阵营坚持对(duì)Scaling Law的信仰，押注在更强通用(yòng)模型的打造上；开源阵营模(mó)型能力不断提升，并(bìng)且强调以更垂直的性能、更灵活的配(pèi)置来(lái)推动大模型(xíng)商业化落地。

关于应该选(xuǎn)择模型开源还(hái)是(shì)闭源讨论经久不息。

对于局内人，这一(yī)选择这不仅决定了他们将如何点亮AI“科技树”，更将影响他们的(de)商业路线选择。换言之，这很有可能是这个残酷(kù)竞争市场下的生存问题。

两个版(bǎn)本，多重惊喜

Meta此次发布的Llame 3包括8B和70B的预训练和(hé)指令微(wēi)调版本(běn)。

据Meta官网信息，Llama 3 模型将数据(jù)和规模提升(shēng)到新的(de)高度。它在两个定制24K GPU集(jí)群上基于超过 15T 的数据进行了训练——训练数据集(jí)是Llame 2使用量的7倍有余。它支持 8K 上下(xià)文长度，是 Llama 2 容量的两(liǎng)倍。

除了 Llama 3，Meta 还发布了新的(de)信任和安全(quán)工(gōng)具，包括Llama Guard 2、Code Shield和 CyberSec Eval 2。

据悉，Llama 3 即将在AWS（Amazon web service）、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提(tí)供商、模型 API 提供商平台上线，Llama还得到AMD、AWS、戴尔、英特尔、NVIDIA和高通提供的硬件平台(tái)的支持。

在官网(wǎng)上，Meta还放出了Llama3两个版本与谷(gǔ)歌Gemma、谷歌Gemini、Mistral、Anthropic的(de)Claude 3等竞(jìng)争(zhēng)对手的参数对比。据Meta官网，Llame3在(zài)MMLU（学科知识理解）、GPQA（一般问题）、HumanEval（代(dài)码能力）、GSM—8K（数学能力）、MATH（比较(jiào)难的数学问(wèn)题）5个评测集上(shàng)均表(biǎo)现良(liáng)好。

值得注意的(de)是，Llama3的代码能力非常优秀。在AI领域公众号“数字生命卡兹AI“源神”启动！影响多大？克”主理人卡兹克分享的用户实测(cè)中，Llama3—8B能够给出国际象棋中经典皇后问题的解题代码。而其前代版本Llama2需要专门的代码模(mó)型才能实现。

市场的反应速度很快。18日当天，Meta股价逆势(shì)收涨1.54%。次(cì)日，百度智能云(yún)千(qiān)帆大模型平台开放邀约测试，提供针对Llama 3的训练推理方案，帮(bāng)助开发者训练专属大模型。

8B和70B 两个(gè)型号的模型，仅仅标志着 Llama 3 系列的开(kāi)端，Meta AI首席科学家杨立昆在其社交媒体透露，在接下来的几个月，还会有更多版本陆续发布。

英伟达(dá)高级科学家Jim Fan认(rèn)为之后可能会发(fā)布的Llama 3-400B以上的版本将成(chéng)为(wèi)某(mǒu)种“分水岭”，开(kāi)源社(shè)区将能用上(shàng)GPT-4级别的模型。

不(bù)下牌桌，各显神通

上(shàng)一轮元宇(yǔ)宙(zhòu)竞争中被认为可能跌进坑里的Meta，在人工智能的牌桌上打出了Llama系列这把好牌。要讨论Llama3带(dài)来的(de)行(xíng)业震荡，首先要(yào)明白，什么是大模型领域的开源？

大模型领(lǐng)域的开(kāi)源通常意味(wèi)着模型的架构、训练代(dài)码和预训(xùn)练权重等都(dōu)被(bèi)公开，允许研究人员和开发者自由地(dì)访问和使用。

不过(guò)，开源的程度因(yīn)模型而异。“有些(xiē)可能只提(tí)供(gōng)有限的(de)访问权限或部(bù)分代码(mǎ)。”郭涛指出，判断大模型是否真正开源的基准可能包括：代码和数(shù)据的(de)可访问性、使用许可的宽松程(chéng)度、社(shè)区支持的活跃度以及对改进(jìn)和新应用的开放性。

放眼AI界，两条路径上都各有“头(tóu)号玩家”分布。闭源自不必说，海外有OpenAI旗下的ChatGPT，国内是百度的文心一(yī)言(yán)以及风头正劲(jìn)的月之暗面Kimi。

而开源方面，除了Llama系列，目前应用较(jiào)广的开源大模型还包括非营利组织LAION推出的OpenFlamingo、Databricks的Dolly，以(yǐ)及MosaicML的MPT等。国内则包括，阿里(lǐ)巴巴的通义千问(wèn)，智谱的(de)ChatGLM-4、百川智能的(de)baichuan-7B中英文大模型、北京智(zhì)源悟道3.0大(dà)模型系列和面壁智能(néng)的CPM-Bee 10B中文基座大模型等。

形成这样的分(fēn)化，很(hěn)多时候是受技术进步和商业模式迭代等(děng)的多重影(yǐng)响(xiǎng)。

天使投资人、资(zī)深人工智(zhì)能专家郭涛认为，从(cóng)技术角度来看，开源可以促进(jìn)学术界的研究和创(chuàng)新，而闭源则有助于在一(yī)定时间内保持技术领先优势。

从商业(yè)角度来(lái)看，开源可以吸引开(kāi)发者社区的贡献，促进技术(shù)的快速迭代和应用的广泛传播，但(dàn)可能会影响到公司的盈(yíng)利模式。闭源则可以保护知识产权，为公司创造直接的收入来源，但可能会(huì)限制技术(shù)的(de)普及和生态的建设。

事实上，在Llama3发(fā)布(bù)之前，中文互联网刚刚经历(lì)了一轮开闭源论(lùn)战。

据媒体报道(dào)，百度(dù)CEO李(lǐ)彦宏近日表态，认为大模型开(kāi)源意义不大，闭源模(mó)型(xíng)性能(néng)会不断提升。“有(yǒu)了文心大模型(xíng)4.0，我们可以根(gēn)据(jù)需要兼(jiān)顾效果、响应速度、推理成本等各种考虑，裁剪出适合各种(zhǒng)场景的更小尺寸模型，且支持精调和post pretrain。通过降维裁剪出的(de)模型，比直接拿开源调出来的模型，同等尺寸下效果更好，同等效(xiào)果下成本明显(xiǎn)更低。”

李彦宏一直是闭源(yuán)路(lù)线的忠实拥趸，理由包(bāo)括但不限于认可闭(bì)源商业模式可以更好地聚集人力和财力等。

而其反对者(zhě)——360创(chuàng)始人周鸿祎言简意赅，“一(yī)句(jù)话，今天没(méi)有开源就没有 Linux，没有 Linux 就没有互联网。”

“源神”启动，影响几何？

“Llama 3的发布会带来市场格局的改变。”郭涛在接受21记者(zhě)采访时(shí)指出，其优异表现可能吸引更多的用户和投资者，从而(ér)增加其市(shì)场份额。

官网显示，Llama 3将有条(tiáo)件地开源给商业使用（月活用户超过7亿需要(yào)单独申请）。“不过这基本等于完全免费商(shāng)用了。”卡兹克表示。

此前，投(tóu)资人朱啸虎曾经就人工智能市场相关话题接受腾讯新(xīn)闻采访。当被问及2023年(nián)大(dà)模(mó)型发展的(de)关键节点时，他给出(chū)的回答正是Llama上线。这让中国在(zài)应用层面创新有了(le)基础(chǔ)，降低了商业化门(mén)槛。

当然，朱啸虎提到的变现是(shì)指开(kāi)源生态内的用户。对于开源大(dà)模型(xíng)发布(bù)者的能否盈利，或者能等来盈利机会，很多时候并没(méi)有确定的答案(àn)。

闭源大模型通常通过授权使用、订阅服务或者直接销售产品来盈(yíng)利。其中的代表(biǎo)便是AI领域的领跑者OpenAI，虽然(rán)其一(yī)直(zhí)有推进开(kāi)源项(xiàng)目的动作，但其处在核心地位的(de)ChatGPT却一(yī)直(zhí)采(cǎi)取收取API许可(kě)费的方(fāng)式向其他公司提供服务。在API服务过(guò)程，其他公司不会接(jiē)触到(dào)ChatGPT模型的细节和源代码(mǎ)，仅仅通过(guò)API接口进行调用。

创业者服务平台GoDaddy对全美1003家小型企业的调查数据显示，ChatGPT以(yǐ)70%的(de)应用率成为美国小型企业应用最多的生(shēng)成式AI产品，这(zhè)说(shuō)明OpenAI选择的闭源模(mó)式的商业化之(zhī)路在一定程(chéng)度已经跑通(tōng)。

开源模型如何(hé)寻求生(shēng)存(cún)和发展的机会？

首先是以开放的生态(tài)吸(xī)引用户。国盛证券研报就指出，开源大模型(xíng)借助更大标(biāo)识符训练数据集、DeepSpeed、RLHF等方式，实现低训练成本和高性能，超大模型(xíng)以下大模型的壁垒正在消失。

“在拥有用户后，开(kāi)源大模型通(tōng)常通过提供增值服务、定制开(kāi)发、技术支持等方式(shì)来实现盈利”。郭涛指出，公司可以在开源模型的基础上提供专(zhuān)业的训练服务或者定制化的应用解决方案(àn)。

对于Meta甚至众(zhòng)多(duō)开源者而言，开源的野心不仅是短期的商业变(biàn)现，其更(gèng)想引领规则设计以及搭建生态。有业内专家分析，开源后壁垒并没有那么容易破除，高(gāo)质量、标注过(guò)的训练数据集(jí)尤(yóu)其是专业模型的壁垒。

星(xīng)纪(jì)魅族集(jí)团(tuán)数据(jù)合规执行总监朱玲凤表示，目前有些(xiē)开源AI由头部公(gōng)司主导，“越多人使用(yòng)，就越能强化网格效应，而且不是真正(zhèng)的开放，后续需要使用它们的配套工具、配(pèi)套服务。头(tóu)部公(gōng)司还可能(néng)利用(yòng)监管豁免的方(fāng)式，获得(dé)寻租空间。”换言之，以开源为噱头的巨头游戏，可能会进一步强化(huàAI“源神”启动！影响多大？)大公司的垄断地位(wèi)，反而(ér)不利于产业竞(jìng)争。

据报道，去(qù)年4月，在扎克伯格与分析师的一次电(diàn)话会议中，他就谈到，如果行业能够在Meta使用的基础工具上达(dá)成标准化，那么meta就能从其(qí)他人的改进中受(shòu)益。同年(nián)5月(yuè)，谷歌内部泄露的文(wén)件《我们没有护城河，OpenAI也没有(yǒu)》在SemiAnalysis网站上传播，其中的观点包括，比起开源社区需要谷歌，谷歌更需要开源社区等等。文章作(zuò)者指出，不同开源模型所组(zǔ)成的生态系统永远(yuǎn)是(shì)OpenAI的潜在竞争对手(shǒu)，与开源AI竞争的结果必(bì)然是失败。

Meta落(luò)子，战局生变。大模型的路线之争(zhēng)会(huì)不会迎(yíng)来真正的胜利者？

“开源(yuán)与闭源大模型之间不太可能分出(chū)绝对的输(shū)赢，因为它们各自适合不同的应用(yòng)和场景。”郭涛认为，开源大模型更适合那(nà)些需要快速创新AI“源神”启动！影响多大？和大规模协作的项目，而闭源大模(mó)型可能(néng)更适合那些对性能和安全性(xìng)有极高(gāo)要求的商业应用。

未经允许不得转载：中央空调,电梯,空气能热水器-中央空调,电梯,空气能热水器 AI“源神”启动！影响多大？