文|三易生活
早前Meta的LLaMA大模型“意外”泄露后,大模型的開(kāi)源與閉源之爭(zhēng)就此提上了日程。大模型到底是開(kāi)源好、還是閉源好?過(guò)去一年整個(gè)AI業(yè)界可謂是爭(zhēng)吵不休。如今,又有一位重量級(jí)人士站出來(lái)表態(tài)了。
就在4月11日,百度創(chuàng)始人李彥宏的內(nèi)部講話被傳出。據(jù)悉他在此次講話中表示,去年文心一言發(fā)布時(shí),百度方面就判斷市場(chǎng)上一定會(huì)有開(kāi)源的模型,而且不止一家會(huì)開(kāi)源,在這種情況下多百度一家開(kāi)源不多、少百度一家開(kāi)源也不少。并且他認(rèn)為,大模型開(kāi)源意義不大,閉源才能走通商業(yè)模式。
李彥宏之所以堅(jiān)定押注閉源,在于他認(rèn)為開(kāi)源大模型的運(yùn)行模式和傳統(tǒng)開(kāi)源軟件不同,并不是眾人拾柴火焰高。作為從自由軟件思潮之中誕生的結(jié)晶,開(kāi)源軟件也繼承了自由軟件所提倡的知識(shí)共享理念,同時(shí)又允許以專利的形式從知識(shí)產(chǎn)品中獲得收益。事實(shí)上,開(kāi)源本身并不是一種商業(yè)模式,而是一種軟件的開(kāi)發(fā)、發(fā)布和傳播模式。
而開(kāi)源就使得大規(guī)模協(xié)作開(kāi)發(fā)成為了可能,從GNU/Linux、Android、Chromium這一系列大名鼎鼎的項(xiàng)目,到XZ Utils這類深耕細(xì)分領(lǐng)域的產(chǎn)品,它們的成功都是源自于匯聚了開(kāi)源社區(qū)的力量,大量的開(kāi)發(fā)者都在為這些項(xiàng)目貢獻(xiàn)力量。
然而開(kāi)源大模型的運(yùn)行模式則完全不同,如今無(wú)論是來(lái)自歐洲的AI獨(dú)角獸Mistral的Mixtral-8x7B,還是美國(guó)科技巨頭Meta的Llama-2,它們都鼓勵(lì)開(kāi)發(fā)者貢獻(xiàn)各種各樣的數(shù)據(jù)、代碼,但Mixtral-8x7B、Llama-2的主要開(kāi)發(fā)者依舊還是Mistral、Meta。
開(kāi)源大模型很難從社區(qū)獲益,歸根結(jié)底在于社區(qū)貢獻(xiàn)的價(jià)值并不一定是正向的。AI大模型會(huì)出現(xiàn)“幻覺(jué)”(Hallucination),現(xiàn)在幾乎已經(jīng)是業(yè)界的共識(shí),AI科學(xué)家也仍未完全解開(kāi)這個(gè)謎題,但數(shù)據(jù)的質(zhì)量與大模型幻覺(jué)呈現(xiàn)正相關(guān)則是肯定的。
開(kāi)源大模型接受垃圾代碼、低質(zhì)數(shù)據(jù)導(dǎo)致性能下降,這樣的事情不是沒(méi)有發(fā)生過(guò)。甚至Anthropic的研究人員曾發(fā)表論文警告,現(xiàn)階段的安全訓(xùn)練無(wú)法消除插入后門觸發(fā)機(jī)制的惡意行為,進(jìn)而會(huì)導(dǎo)致開(kāi)源大模型變得不安全。
開(kāi)源大模型缺乏安全性,這也是OpenAI、Anthropic等閉源陣營(yíng)旗手攻擊開(kāi)源的重要論點(diǎn)。
除此之外,開(kāi)源大模型在性能上也還無(wú)法媲美閉源大模型。如今無(wú)論是哪個(gè)機(jī)構(gòu)給出的大模型評(píng)測(cè)榜單中,OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude,以及國(guó)產(chǎn)的文心一言、訊飛星火、KimiChat,對(duì)比它們的開(kāi)源大模型競(jìng)爭(zhēng)對(duì)手都更有優(yōu)勢(shì)。所以在同等參數(shù)的情況下,閉源大模型的能力更強(qiáng),李彥宏此言并非無(wú)的放矢。
此前福布斯的一篇文章《10 AI Predictions For 2024》就曾給了預(yù)測(cè),盡管開(kāi)源模型在某些領(lǐng)域有優(yōu)勢(shì),但最先進(jìn)的商業(yè)閉源模型可能仍將在性能上保持領(lǐng)先。
大家不妨試想一下,如果GPT-4不能保持性能領(lǐng)先,用戶就會(huì)轉(zhuǎn)向免費(fèi)的開(kāi)源模型。當(dāng)免費(fèi)、不受限制的替代品在質(zhì)量上具有可比性時(shí),用戶確實(shí)不會(huì)為受限制的模型付費(fèi)??扇缃竦那闆r,卻是開(kāi)源大模型的性能還不能挑戰(zhàn)閉源大模型。
當(dāng)然,開(kāi)源大模型最致命的缺陷其實(shí)是在商業(yè)層面。Meta的Llama-2開(kāi)源之后,國(guó)內(nèi)的百模大戰(zhàn)立刻拉開(kāi)了帷幕,市面上很快也多了一大堆套殼模型。從某種意義上來(lái)說(shuō),大模型的開(kāi)源其實(shí)是給自己平白無(wú)故地增加了一大堆競(jìng)爭(zhēng)對(duì)手,而且這一部分競(jìng)爭(zhēng)者又會(huì)分食潛在的企業(yè)級(jí)用戶。
由于開(kāi)源協(xié)議本身并沒(méi)有限制商業(yè)化,因此在許多開(kāi)源軟件中存在著免費(fèi)社區(qū)版和收費(fèi)企業(yè)版共存的模式,也就是所謂的雙許可證。其中免費(fèi)版本負(fù)責(zé)擴(kuò)大軟件的影響力,再用付費(fèi)版本獲利,這就是開(kāi)源軟件經(jīng)典的商業(yè)模式。比如在2018年被IBM以334億美元收購(gòu)的開(kāi)源軟件和技術(shù)供應(yīng)商Red Hat,就是這一模式的典型。
開(kāi)源大模型沒(méi)有建立起商業(yè)模式,這是當(dāng)下開(kāi)源大模型鼓吹者始終無(wú)法回避的一個(gè)問(wèn)題。拋開(kāi)眾說(shuō)紛紜的B端業(yè)務(wù),OpenAI的GPT-4、百度的文心一言目前都有付費(fèi)訂閱版本,C端用戶的付費(fèi)是實(shí)打?qū)嵈嬖诘摹6掖髽I(yè)大的Meta打定主意要用開(kāi)源來(lái)為自己挽回已經(jīng)跌入谷底的企業(yè)形象,Llama則可以被視為Meta方面精心設(shè)計(jì)的一個(gè)廣告。
但其他的開(kāi)源大模型廠商不能總是只靠融資,事實(shí)上,即使是開(kāi)源大模型的代表Mistral,如今對(duì)于開(kāi)源也沒(méi)有那么堅(jiān)定。Mistral創(chuàng)始人Arthur Mensch近期在接受媒體采訪時(shí)就曾確認(rèn),Mistral已經(jīng)推出了商業(yè)模型,并且他還坦言,商業(yè)模型可以幫助Mistral創(chuàng)造收入。歸根結(jié)底,大模型太貴,開(kāi)發(fā)成本比傳統(tǒng)的軟件要高出了數(shù)個(gè)量級(jí),因此也更加依賴融資。
當(dāng)大模型與資本的牽扯如此之深的情況下,可后者顯然是要謀求回報(bào)的,所以這可能才是李彥宏堅(jiān)定看好閉源的原因。