文|旗幟財(cái)經(jīng) 李長(zhǎng)懷
國(guó)內(nèi)外頭部廠商紛紛加入這場(chǎng)“開(kāi)源熱”,意味著“加速快跑”已成為行業(yè)共識(shí)。大家都希望跑在前面,成為李彥宏口中那剩下的1%。而留給后來(lái)者的機(jī)會(huì)窗口也正緩緩關(guān)閉。
因?yàn)樵诟?jìng)爭(zhēng)空前激烈的大模型賽道上,所有參賽者都明白,這不是一場(chǎng)排位賽,而是一場(chǎng)淘汰賽。
兩千多年前,春秋諸侯連年征戰(zhàn),天下格局也隨之動(dòng)蕩不定。
但正如常言所道,“天下大勢(shì),分久必合”,經(jīng)過(guò)近300年的兼并戰(zhàn)爭(zhēng),數(shù)百個(gè)諸侯紛紛覆滅,最終只剩下少數(shù)幾個(gè)主要國(guó)家,歷史進(jìn)入七國(guó)爭(zhēng)雄的戰(zhàn)國(guó)時(shí)期。
歷史不會(huì)簡(jiǎn)單重演,但總會(huì)飛來(lái)幾只似曾相識(shí)的燕子。這一次的“燕子”,名叫大模型。
從被稱(chēng)為AIGC的“iPhone時(shí)刻”的ChatGPT誕生以來(lái),正如智能手機(jī)的iPhone時(shí)刻不只屬于蘋(píng)果公司,而是帶來(lái)了一大批智能手機(jī)品牌的崛起一樣,大模型也迎來(lái)了“百模大戰(zhàn)”。
據(jù)GitHub的統(tǒng)計(jì)數(shù)據(jù),到2023年底,僅國(guó)內(nèi)已經(jīng)發(fā)布的大語(yǔ)言模型數(shù)量,即已接近300個(gè)。加上海外企業(yè),全球大模型數(shù)量已超過(guò)400個(gè)。
巧合的是,當(dāng)初東周王室分封的諸侯數(shù)量,也是400多個(gè)。
盡管大模型空前廣闊復(fù)雜的應(yīng)用場(chǎng)景,以及不同廠商在細(xì)分領(lǐng)域優(yōu)劣勢(shì)的客觀存在,決定了大模型不會(huì)像PC一樣出現(xiàn)Windows一統(tǒng)天下的格局,也不會(huì)像智能手機(jī)一樣僅由iOS、Android兩個(gè)主要玩家壟斷市場(chǎng);但大模型本身超強(qiáng)的適應(yīng)能力,也決定了百度李彥宏所說(shuō)的“99%陪跑”,更有可能成為行業(yè)的未來(lái)景象。
新的歷史正在上演,而在敘事上,大模型研發(fā)者們,似乎已經(jīng)選擇了當(dāng)初谷歌打下Android江山的劇本。
去年12月,阿里云正式發(fā)布并開(kāi)源“業(yè)界最強(qiáng)開(kāi)源大模型”通義千問(wèn)720億參數(shù)模型Qwen-72B。
1月17日,商湯科技與上海AI實(shí)驗(yàn)室聯(lián)合香港中文大學(xué)和復(fù)旦大學(xué)發(fā)布的新一代大語(yǔ)言模型書(shū)生·浦語(yǔ)2.0宣布開(kāi)源。
1月29日,Meta發(fā)布的“Code Llama家族中體量最大、性能最好的模型版本” Code Llama70B,也選擇了開(kāi)源。
1月30日,科大訊飛發(fā)布首個(gè)基于全國(guó)產(chǎn)化算力平臺(tái)”飛星一號(hào)”的開(kāi)源大模型——星火開(kāi)源-13B。
公開(kāi)信息顯示,Meta的LLama、OPT,谷歌的T5、MT5、FLAN-T5以及UU2,Big Science的BLOOM、T0、BLOOMZ等國(guó)內(nèi)外主流大模型,均走上了開(kāi)源道路。
艾倫人工智能研究所等5機(jī)構(gòu)最近公布的開(kāi)源模型OLMo,更是將模型權(quán)重、完整訓(xùn)練代碼、數(shù)據(jù)集和訓(xùn)練過(guò)程全部予以公開(kāi),玩起了大模型的“真·完全開(kāi)源”模式。
國(guó)內(nèi)外頭部廠商紛紛加入這場(chǎng)“開(kāi)源熱”,意味著“加速快跑”已成為行業(yè)共識(shí)。大家都希望跑在前面,成為李彥宏口中那剩下的1%。
而留給后來(lái)者的機(jī)會(huì)窗口也正緩緩關(guān)閉。因?yàn)樵诟?jìng)爭(zhēng)空前激烈的大模型賽道上,所有參賽者都明白,這不是一場(chǎng)排位賽,而是一場(chǎng)淘汰賽。
大模型的“戰(zhàn)國(guó)時(shí)代”,似乎已經(jīng)遙遙在望。
01、推開(kāi)“戰(zhàn)國(guó)”的大門(mén)
Android的發(fā)展歷程,堪稱(chēng)互聯(lián)網(wǎng)行業(yè)底層操作系統(tǒng)開(kāi)源的教科書(shū)。
作為一個(gè)開(kāi)源系統(tǒng),Android較之此前占據(jù)優(yōu)勢(shì)的塞班、黑莓、WP,以至同樣出身名門(mén)的plam OS(惠普)、BADA OS(三星)、MeeGo(英特爾+諾基亞),本身并沒(méi)有多大突破。但是由于開(kāi)發(fā)者可以自由訪問(wèn)系統(tǒng)底層,通過(guò)其源代碼進(jìn)行二次開(kāi)發(fā),App的開(kāi)發(fā)門(mén)檻、周期都得以大幅縮短,并且可以根據(jù)自己的需求和風(fēng)格定制界面和功能,市場(chǎng)自然更容易接受。
手機(jī)廠商也樂(lè)得將更多的精力,投入到系統(tǒng)的打磨上,改善用戶(hù)的使用體驗(yàn)。因此,我們所熟知的小米、魅族、vivo、OPPO等手機(jī)廠商,基本都是基于Android的深度定制打造的自身操作系統(tǒng)。
回望模型,開(kāi)源大模型的出現(xiàn),讓 AI 應(yīng)用的開(kāi)發(fā)周期和成本大幅降低,加快人工智能的普及。以Meta發(fā)布的Code Llama70B為例,據(jù)稱(chēng),其API調(diào)用成本大約比 GPT-4 便宜了 30 倍。在Llama2 發(fā)布兩個(gè)月后,通過(guò) Hugging Face 的 Llama 模型下載量就超過(guò) 3000 萬(wàn)次。國(guó)內(nèi)興起的AIGC,不少應(yīng)用的基礎(chǔ)模型就是 Llama2。
正如Meta 首席科學(xué)家、深度學(xué)習(xí)三巨頭之一 Yann LeCun所說(shuō):“閉源證明了大模型路線的可行性,而開(kāi)源則通過(guò)繁榮的生態(tài),讓大模型變得易用、可用?!?/p>
而這次大模型的“開(kāi)源熱”,除了市場(chǎng)推廣邏輯的復(fù)刻外,還有更現(xiàn)實(shí)的利益考量,那就是算力資源的匱乏。
根據(jù)不同的機(jī)構(gòu)測(cè)算,GPT-4 的訓(xùn)練需要的 A100 數(shù)量大約在10000-25000 張的區(qū)間?!鞍倌4髴?zhàn)”所消耗的算力規(guī)??上攵?。
更富邏輯性的說(shuō)法則是,過(guò)去4年間,大模型參數(shù)量以年均400%的速度增長(zhǎng),AI算力需求增長(zhǎng)超過(guò)15萬(wàn)倍,傳統(tǒng)算力基礎(chǔ)設(shè)施已無(wú)法滿(mǎn)足大模型、生成式AI的訓(xùn)練需求。
正是在這一背景下,業(yè)內(nèi)早就提出,AI大模型的合理發(fā)展路徑,應(yīng)該是“可能僅有少數(shù)企業(yè)會(huì)開(kāi)發(fā)基礎(chǔ)大模型,其他各行各業(yè)將根據(jù)自身業(yè)務(wù)需求、數(shù)據(jù)量等,接入大模型平臺(tái),開(kāi)發(fā)屬于自己的模型”。
國(guó)內(nèi)大模型的先發(fā)者百度CEO李彥宏更是直言:“好幾百個(gè)基礎(chǔ)模型,這是對(duì)社會(huì)資源巨大的浪費(fèi)?!?/p>
另一方面,“百模大戰(zhàn)”對(duì)于技術(shù)升級(jí)的意義或許也確實(shí)不大。
盡管目前各家大模型在數(shù)據(jù)、算法等各個(gè)層面千差萬(wàn)別,但核心的技術(shù)路線,事實(shí)上都是6年前誕生的Transformer 架構(gòu)。ChatGPT的名字中,GPT的T,指的就是Transformer。Copilot、 DALL·E 3 、 Midjourney、Runway……這一年不斷刷新我們認(rèn)知的 AI 產(chǎn)品,背后的核心技術(shù)架構(gòu)都是Transformer。
這也解釋了為什么ChatGPT之后,新的大模型會(huì)如此密集出現(xiàn)。ChatGPT的最大功績(jī),不是創(chuàng)造了新的AI工具,而是讓大家看到了AI革命性突破的確定路徑。這與前文提到的智能手機(jī)的iPhone時(shí)刻可謂異曲同工。
在同樣的架構(gòu)之下,訓(xùn)練出再多再好的大模型,最終意義或許就是刷個(gè)榜而已。
1月30日,上海人工智能實(shí)驗(yàn)室推出的大模型開(kāi)源開(kāi)放評(píng)測(cè)體系司南(OpenCompass2.0),發(fā)布了2023年度大模型評(píng)測(cè)榜單,榜單顯示,整體技術(shù)能力居于GPT4與GPT3.5之間的大模型數(shù)量,已多達(dá)7個(gè),其中不乏國(guó)產(chǎn)大模型身影。
OpenCompass2.0大語(yǔ)言模型中英雙語(yǔ)客觀評(píng)測(cè)前十名(采用百分制)。商用閉源模型通過(guò)API形式測(cè)試,開(kāi)源模型直接在模型權(quán)重上測(cè)試。
但在實(shí)際應(yīng)用上,李彥宏表示:“國(guó)內(nèi)數(shù)百個(gè)大模型調(diào)用量加起來(lái),還不如文心一個(gè)多。”
既然這樣,把資源集中在幾個(gè)更有實(shí)力的大模型上,的確是更優(yōu)選擇。
從政策上來(lái)看,開(kāi)源也是行業(yè)大勢(shì)所趨。早在2017年,中國(guó)發(fā)布的《新一代人工智能發(fā)展規(guī)劃》就將開(kāi)源、開(kāi)放作為基本原則寫(xiě)入了規(guī)劃。2023年,科技部副部長(zhǎng)吳朝暉也表示,中國(guó)堅(jiān)持開(kāi)源協(xié)作,加強(qiáng)大模型技術(shù)持續(xù)創(chuàng)新,協(xié)同解決透明性、穩(wěn)定性等共性問(wèn)題,加快形成大模型的產(chǎn)業(yè)生態(tài)。
因此,當(dāng)下大模型發(fā)展的“春秋時(shí)期”,是市場(chǎng)、企業(yè)、政策多方合力,共同用開(kāi)源推開(kāi)了“戰(zhàn)國(guó)”的大門(mén)。
02、“分晉”?“代齊”?
開(kāi)源將改變大語(yǔ)言模型的格局已毋庸置疑。如何應(yīng)對(duì)?相信誰(shuí)也給不出終極答案。
但既然“似曾相識(shí)燕歸來(lái)”,我們不妨再次將眼光轉(zhuǎn)向兩千多年前的那個(gè)時(shí)代。
歷史從春秋轉(zhuǎn)入戰(zhàn)國(guó),有兩個(gè)標(biāo)志性的事件,一是三家分晉,二是田氏代齊。這兩大事件,也為大模型廠商們面對(duì)開(kāi)源后加快的市場(chǎng)洗牌,提供了兩個(gè)有效的應(yīng)對(duì)思路。
三家分晉的最終成行,在于趙、魏、韓三家勢(shì)弱的公卿,通過(guò)聯(lián)合取勝,消滅了勢(shì)強(qiáng)的智家,從而各自分得了晉國(guó)的部分領(lǐng)土。對(duì)于大模型廠商來(lái)說(shuō),這意味著一種合縱抗敵,各得其利的思路。
海外比較具有代表性的案例當(dāng)屬Hugging Face開(kāi)源社區(qū)。作為世界最大的大模型托管平臺(tái),Hugging Face近日推出了開(kāi)源、可定制的AI 助手Hugging Chat Assistants。除了免費(fèi)之外,其與GPTs和GPT Store另一個(gè)重要區(qū)別在于:后兩者完全依賴(lài)于OpenAI的專(zhuān)有大模型GPT-4以及GPT-4 Vision/Turbo,而前者的用戶(hù)可以自由選擇多個(gè)開(kāi)源LLM來(lái)驅(qū)動(dòng)AI助手。
Hugging Chat Assistants推出后不久,就受到AI社區(qū)許多開(kāi)發(fā)者的稱(chēng)贊,認(rèn)為它在某些方面“超越了GPTs”,成為其追趕閉源系統(tǒng)競(jìng)爭(zhēng)對(duì)手方面的不二法寶。
在國(guó)內(nèi),2023年9月5日,由重慶市大數(shù)據(jù)應(yīng)用發(fā)展管理局牽頭,華為、阿里、騰訊、百度、京東、科大訊飛等50多家國(guó)內(nèi)頭部大模型企業(yè)加入的,全國(guó)首個(gè)大模型聯(lián)盟智博會(huì)正式宣告成立,極大地推動(dòng)了大模型產(chǎn)業(yè)生態(tài)發(fā)展。這與Android系統(tǒng)發(fā)布當(dāng)天,Google公司宣布聯(lián)合摩托羅拉、高通、HTC和T-Mobile在內(nèi)的30多家公司,共同組建全球性的開(kāi)放手機(jī)聯(lián)盟,以推動(dòng)Android普及,看上去頗有幾分相似。
回顧歷史,田氏代齊中的田氏,則是通過(guò)“有德于民”,而使“齊之民歸之如流水”,最終取代姜氏,掌握了齊國(guó)的政權(quán)。這種給與下游生態(tài)合作伙伴及客戶(hù)更多實(shí)惠,從而提升其合作意愿的思路,更適合有實(shí)力的大模型廠商。
譬如2023年9月5日召開(kāi)的百度云智大會(huì)上,百度即宣布,推出大模型新生態(tài)政策,為伙伴提供資金、算力、技術(shù)、營(yíng)銷(xiāo)等全方位的強(qiáng)力支持。百度如今能做到“國(guó)內(nèi)數(shù)百個(gè)大模型調(diào)用量加起來(lái),還不如文心一個(gè)多”的成績(jī),與此不無(wú)關(guān)系。
當(dāng)然,從大模型長(zhǎng)期發(fā)展的復(fù)雜性來(lái)說(shuō),需要考慮的因素遠(yuǎn)不止此。數(shù)據(jù)安全、許可協(xié)議標(biāo)準(zhǔn)、商業(yè)模式等等問(wèn)題,在如今的發(fā)展階段,仍然處于未解之中。
但,Android先例在前,無(wú)論選擇“分晉”還是“代齊”路線,抑或其他,大模型廠商們通過(guò)開(kāi)源加快搶占市場(chǎng)的用心,早已堅(jiān)不可摧?!按呵飼r(shí)代”戰(zhàn)事的終結(jié),也早已由此注定。
Android的命名靈感,來(lái)自一個(gè)充滿(mǎn)野心的科幻作品《未來(lái)夏娃》。在這部小說(shuō)中,作者試圖創(chuàng)造出一個(gè)完美的機(jī)器生命。正是出于對(duì)作者利爾·亞當(dāng)科學(xué)精神的致敬,Android之父安迪·魯賓,將本書(shū)女主角的名字,用在了自己開(kāi)發(fā)的操作系統(tǒng)之上。大模型廠商們,誰(shuí)又將造出AI時(shí)代的“未來(lái)夏娃”,我們拭目以待。