Meta继续押宝开源大模型 Llama 3拿下“赛点”?
开源与闭源(yuán)之争延(yán)续到大模型时代。在寻找(zhǎo)“新大陆”的 路上,开源(yuán)与闭源的辩论(lùn),就像是一场(chǎng)关于AI未来的“航海策略”讨论。
开源一派认为,开源能够(gòu)促(cù)进全球科研人员和开发者的协作,加速(sù)AI技术的迭代与创新。同时,开源 让更多人参与到模型的改进和优化中,通过集体(tǐ)智慧解决复杂的技(jì)术难题。
闭源的(de)倡导者则看重其在商业化、技术保护(hù)和产品差异化(huà)方面的优势。闭源模型使得企业能够(gòu)控制产品的开发节奏和市场策略,保护其(qí)商业利益。此外,闭源(yuán)也有助(zhù)于企业维护其技术优势,避免竞争对手模仿(fǎng)或超越(yuè)。
Llama 3的发布让开源大模型在与闭源的竞争中再(zài)度“扳回一城”。从测(cè)试结果来看,Llama 3的成绩大幅超越了 Llama 2,也胜过了GPT-3.5。
在(zài)AI这场(chǎng)没有硝(xiāo)烟的“航海竞赛”中,大模型已然成为眼前的灯塔(tǎ)。未知(zhī)的是,这座灯塔究(jiū)竟(jìng)是向所(suǒ)有航海者开放其光芒,还是仅为特定(dìng)的船只照亮前行的(de)航道。
开源在开发者和研究(jiū)人(rén)员中极(jí)受欢(huān)迎
Meta正沿着开(kāi)源路径继续(xù)前进。
近日,Meta推出开(kāi)源大模型Llama 3系列,发布(bù)8B和70B两个版本。Meta创始人兼首席执行官扎克伯格在同(tóng)一天宣(xuān)布,基于(yú)Llama 3,Meta的AI助手现(xiàn)在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单(dān)独开启了网站。
与Llama 2相比,Llama 3进行了几项关(guān)键的改进:使用具128K token(输入数据的最小(xiǎo)单元)词汇表的tokenizer(编译器),可以更有效地编码语言,从(cóng)而显著提升模型性能;在8B和70B模(mó)型中 都采用分组查询注意力(GQA),以提高(gāo)Llama 3模型(xíng)的推理效率;在8192个token的序列上(shàng)训练模型,使用掩码来确(què)保自注意力(Self-Attention)不会(huì)跨越文档边界。
据Meta介绍,Llama 3已(yǐ)经在多 种行(xíng)业基准测试上展现了最(zuì)先进的性能,提供了包(bāo)括改进的推理能力在内的新功能,是目(mù)前市场上最好的开源(yuán)大模型。
此(cǐ)外,Llama 3发布后,微软Azure、谷歌云、百(bǎi)度智能(néng)云等陆续宣布其平台上线Llama 3。百度方(fāng)面此前对《每日(rì)经济新(xīn)闻(wén)》记者表示,百度智(zhì)能云千帆大模型(xíng)平台在(zài)国内(nèi)首家(jiā)推出针对 Llama 3全(quán)系列版本的训练推理方案,便于开发者进行(xíng)再训练,搭建专属大模型。
工业和信息化部工业文化发展中(zhōng)心AI应(yīng)用(yòng)工作组执(zhí)行组长、行行(xíng)AI董事长李明顺在接受《每日经济新闻》记(jì)者采访时表示(shì),Meta的Llama 3发布可能会(huì)带来(lái)更(gèng)多AI应用落地机会和场(chǎng)景(jǐng),它通过提(tí)供更大词汇量的Token词典、更长(zhǎng)的输入上下文(wén)长度以及优化的(de)模型结构,增强了模型的编码效率和推理效率。“现在,比起Llama 2,Llama 3在代码能力和逻(luó)辑推理能(néng)力上有(yǒu)显著提升,这可能会(huì)促进相关AI应用的性能(提升),尤(yóu)其是在需要复杂(zá)逻辑和代码(mǎ)理 解的场景中去落(luò)地。”
OpenAI在GPT-2之后调转船头(tóu)走向闭源,Meta则成为开源界的引领(lǐng)者之一。
从2020年发布(bù)GPT-3,到引(yǐn)发轰动的GPT-3.5,以(yǐ)及2023年3月 发(fā)布的GPT-4,都是闭源模型(xíng)。此前,马斯克起诉OpenAI时曾直言:“如(rú)果OpenAI改名(míng)为ClosedAI,我就撤销诉讼。”
李明顺认(rèn)为,OpenAI的转变(biàn)可能(néng)与(yǔ)其商业战 略和市场定位有关(guān)。“初期开源有(yǒu)助于快速吸引关注和(hé)社区参(cān)与,但随着公司的(de)发展(zhǎn),我估 计阿尔特曼(Sam Altman)的野心和商业梦想越来越膨胀了,闭源可以更好地让它融(róng)资,包括和微软合作,保护领先的技术优势。”他表示,从OpenAI的转 变中可 以看出(chū),开(kāi)源(yuán)与闭源的选择并 非固定不变,而是需要根据公司战略目标、市(shì)场环境和产品发展阶段灵(líng)活调整。天下没什么 事情是绝对的,很多开源公司也是(shì)拿着次优代码开源,独家秘方闭源。
在追逐(zhú)AGI(通用人工智能)这颗(kē)明珠的道路上,迄今为止,Meta依(yī)旧持续沿着开源的路径(jìng)前行。
2024年初(chū),扎克伯(bó)格在Meta第四季度及2023全年财报电话会议上表示(shì):“长期以来,我们的策略是构建并开放源(yuán)代码通用基础设施(shī),同时保留(liú)我们的具体产品实现为专 有技术。”
他认为,开源带来了(le)几个战略好处。首先,开源软件通常更加(jiā)安全可靠,并且因为社区的持续(xù)反馈、审查和(hé)开发,更加高效。其次(cì),开源软件经常成为行业标准,“当企业开始基于我们(men)的技术栈建立标准时,这使得将创(chuàng)新融入我们的产品变得更加容易。这(zhè)种(zhǒng)微妙的优(yōu)势,能够迅速学习和(hé)改进,是巨大的竞(jìng)争优势,而成为(wèi)行业标准正(zhèng)是这一能力的(de)关键”。第三,开(kāi)源在开发者和研究人员中极受欢迎。
开源与闭源并不(bù)矛盾
开源(yuán)还是闭源,也许是全球人(rén)工智能信徒长久的辩题。在Llama 3诞生前几天,国内同样在进行一场(chǎng)“辩论”。
4月11日,百度董事长(zhǎng)兼(jiān)首席执行官李彦宏Meta继续押宝开源大模型 Llama 3拿下“赛点”?在其内部讲话中(zhōng)直言,大模型开源的意义不大,闭(bì)源模型在(zài)能力上会(huì)持(chí)续领先(xiān),而不是一时领先,做模型的创业公(gōng)司既做模型又做应用的“双轮驱动(dòng)”不是一个好的模 式。在一周后的Create 2024百度AI开发者大Meta继续押宝开源大模型 Llama 3拿下“赛点”?会上,李(lǐ)彦宏再度提到,大家以前用开源觉得开源便宜,其实在大模型场景(jǐng)下,开源是最贵的,所以开源模型会越来越落后。
360公司创始人周鸿祎则持不同的观点。他表示:“网上有些名人(rén)胡说八道,大家也别被他们忽(hū)悠(yōu),说(shuō)开源不如闭源好。一句话,今天没有开(kāi)源就没有Linux(操作系统内核(hé)),没有Linux就没有互联网,就(jiù)连说这话的公司(sī)自己都借助了开源(yuán)的力量才成长到今(jīn)天。”
这段发言被解读为对李彦宏观点的回(huí)怼,周鸿祎随后澄清道:“我一直是开源的信徒(tú),但(dàn)是我说开源好(hǎo),是(4月)13日在(zài)哈(hā)佛(fú)讲的,李厂长(指李彦宏)说闭源好,是(4月)16日在北京讲(jiǎng)的(de)。”
生数科技联合创始人(rén)兼CEO唐家渝站在闭源的一边。在4月18日举行的“2024中国生成式AI大会”上,唐(táng)家渝表(biǎo)示:“在我们看来,开源、闭源都有各自可以做的商业生态,但是从 模型能(néng)力的提升来说,或者持(chí)续走到前列来说,闭源还是会走到开源的前面(miàn)。”
昆仑万维董事长方汉(hàn)的观(guān)点是(shì),开源模型(xíng)与闭源模型之间的(de)差距正在不断(duàn)缩(suō)小。4月(yuè)16日,方汉在接(jiē)受《每日经济新闻》记者在内的媒体采访时(shí)表(biǎo)示,闭源模型的确是第一,但是开(kāi)源大(dà)模型在2023年到今年这一年间(jiān),从落后两(liǎng)年以上(shàng),已经进化到落后4~6个月以上。
此外,方汉认为,在应用侧,闭源对于产品特性和(hé)长尾需求的满足都落后(hòu)于开源(yuán)大模型(xíng),开源(yuán)大模型是一种生态构建器,更利于满足用户的长尾需求。开源大(dà)模型(xíng)和闭源大(dà)模(mó)型是一(yī)个生态的组成部分,不是谁压倒谁,大(dà)家都有自己(jǐ)的生存(cún)空间,也都有更好的明天。
不过,从商业化上来讲,闭源和开源也许并不矛盾。启明创投合伙(huǒ)人周志峰就认为(wèi),开源闭源在过去几个大浪潮当中没有(yǒu)很大的冲(chōng)突,不 太理解为什么很(hěn)多人把闭源、开源在AI时代看成对立的。
李明顺的观点则(zé)是,在当前强(qiáng)应用导向的背景下,开源模(mó)式(shì)具有显(xiǎn)著(zhù)优势,能够吸(xī)引全球(qiú)范围内最(zuì)广(guǎng)泛的人参与,从而使其创新性保(bǎo)持在较(jiào)高水平。
相较之下,尽管一些闭源大模型在(zài)技术上具有领先地位(wèi),但(dàn)其成本太高。不过他也强调(diào),开源与闭(bì)源在不同公司和应用场景中可以相互转换。一些基于开源的产品在发掘到独特(tè)优势(shì)后(hòu),可能会通(tōng)过闭(bì)源策略建(jiàn)立(lì)竞争壁垒。同时,一些闭源公司也会不断将其部分产品开源。这两个应该是(shì)共存的,未来开源可能用户量级上更大(dà),但是行业内,商业化(huà)做得比(bǐ)较好的公司,往往还是闭(bì)源的多(duō)一点。
在开源与闭源的辩论中,也(yě)许答案并非非此即彼。AI的未来可能既不是(shì)完全开放的“自由港”,也不是(shì)彻底封闭的“孤岛”,而是(shì)一个既包含开放(fàng)协(xié)作也包含封闭竞争的混合生态(tài)。在这个生态(tài)系统(tǒng)中,开放(fàng)与封闭不是对立的两极,而是一枚硬币的两面(miàn)。
未经允许不得转载:中央空调,电梯,空气能热水器-中央空调,电梯,空气能热水器 Meta继续押宝开源大模型 Llama 3拿下“赛点”?
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了