文|數(shù)智前線 黃幸怡
編輯|石兆
這兩天,大模型風(fēng)頭實(shí)在強(qiáng)勁。
3月15日,OpenAI剛帶著新出爐的GPT-4在全網(wǎng)刷屏,狂吸了一大波眼球,第二天,百度就帶著第一個中國版ChatGPT——文心一言亮相,又掀起一波熱潮。
雖然在朋友圈中,關(guān)于文心一言有不少吐槽,但不少業(yè)界人士也對數(shù)智前線表示,要對中國自己的大模型追趕者寬容一點(diǎn),這其中不乏來自百度的競爭對手。
而數(shù)智前線獲悉,中國行業(yè)龍頭和大用戶,對大模型創(chuàng)新和它帶來的新技術(shù)范式高度關(guān)注,甚至已經(jīng)開始倒逼國內(nèi)互聯(lián)網(wǎng)大公司和人工智能企業(yè)加速行動。
發(fā)布會上,李彥宏也稱,文心一言還不能算完美,但為什么現(xiàn)在發(fā)布?是因?yàn)闊o論是百度內(nèi)部產(chǎn)品還是合作伙伴對大語言模型的需求都非常強(qiáng)烈,“大家都在催”。
01 文心一言謹(jǐn)慎發(fā)布
"千呼萬喚"中,文心一言終于亮相。3月16日下午兩點(diǎn),百度創(chuàng)始人李彥宏帶著五個Demo(視頻短片)登臺展示,宣告了百度新一代大語言模型、生成式AI產(chǎn)品——文心一言的正式發(fā)布。
百度對于文心一言的預(yù)熱足足進(jìn)行了幾個月,卻在臨門一腳之際,碰上大洋彼岸的OpenAI 突然“插隊”發(fā)布多模態(tài)預(yù)訓(xùn)練大模型GPT-4 ,被搶了不少風(fēng)頭的同時,還難免被用來對比。
就比如,功能展示環(huán)節(jié),百度使用提前錄好的Demo,就被不少人拿來和前一天OpenAI發(fā)布GPT-4時的實(shí)時演示對比,被認(rèn)為“缺少了現(xiàn)場感”和“不太自信”。
GPT-4是ChatGPT之前使用的大模型GPT-3.5的升級版,與前代相比,文本輸入上限提升至2.5萬字,回復(fù)的準(zhǔn)確性提高,更重要的是,可以讀圖了,且很會“做題”,包括之前被吐槽的數(shù)學(xué)題。在SAT考試中,它拿下700分,GRE幾乎滿分,在律師模擬考試中能考到前10%,而GPT-3.5只考到倒數(shù)10%。而這些,很多其實(shí)也并不為文心一言所有。
“大家的期望值是要對標(biāo) ChatGPT,甚至要對標(biāo)GPT-4,這個門檻還是很高的。全球大廠還沒有一個做出來的,百度是第一個?!卑l(fā)布會上,李彥宏如是表示。
圍繞文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理邏輯推算、中文理解、多模態(tài)生成五個使用場景,他在現(xiàn)場演示了文心一言的一些能力:
幫劉慈欣續(xù)寫《三體》,分析推理于和偉和張魯一誰更高,給公司起名、寫slogan、寫新聞稿;解決了此前難倒過ChatGPT的“雞兔同籠”問題,也能理解“洛陽紙貴”,并以此寫一首藏頭詩;幫2023世界智能交通大會生成海報和宣傳視頻,還以一口四川話回答問題……
文心一言雖然在一些方面還比不上OpenAI的GPT產(chǎn)品,但業(yè)內(nèi)認(rèn)為,它在中文理解、一些多模態(tài)生成場景上將有一定優(yōu)勢。在多模態(tài)生成方面,文心一言目前的版本,能生成文字、圖片和語音,而生成視頻是世界級難題,包括谷歌在內(nèi)的企業(yè),實(shí)現(xiàn)的效果還差強(qiáng)人意,百度也未對所有用戶開放。
文心一言并未對全部用戶開放,采用了申請制,這是比較謹(jǐn)慎的做法。在新聞發(fā)布會后一小時內(nèi),百度透露,排隊申請文心一言企業(yè)版API調(diào)用服務(wù)測試的企業(yè)用戶已達(dá)3萬多家,申請產(chǎn)品測試網(wǎng)頁多次被擠爆。
李彥宏稱,大語言模型一旦發(fā)布出來,就會獲得真實(shí)的反饋。有了用戶反饋之后,迭代速度、能力提升會加快。
02 中國客戶倒逼AI公司加快行動
ChatGPT的爆火,最初引起國內(nèi)一眾人工智能企業(yè)和從業(yè)者的緊迫感,而現(xiàn)在,這種緊迫感,已經(jīng)傳導(dǎo)到了更廣闊的范圍,AI公司已經(jīng)開始被他們的客戶倒逼著開展一些行動。
數(shù)智前線獲悉,國內(nèi)幾家大型互聯(lián)網(wǎng)公司和人工智能企業(yè),最近幾乎都遇到過這樣的場景:來自各行各業(yè)的客戶紛紛找來,向他們咨詢和了解ChatGPT和大模型相關(guān)的內(nèi)容。
“而且?guī)缀跛腥硕际潜焕习灞浦鴣韱柕??!敝槿耸客嘎?,尤其是行業(yè)龍頭企業(yè)和大型央國企,都有一種焦慮感。
大家普遍關(guān)注和擔(dān)心的點(diǎn)在于:這些人工智能企業(yè)和互聯(lián)網(wǎng)公司的大模型進(jìn)展情況如何?他們的技術(shù)是否跟上了潮流?客戶如果在業(yè)務(wù)中采用了這些公司做的人工智能技術(shù),業(yè)務(wù)和創(chuàng)新能不能處于前沿?
這使得一些一開始并不打算“追風(fēng)”的人工智能企業(yè),也在不得不在最近出來發(fā)聲,向外界和大客戶分享和介紹他們的大模型相關(guān)進(jìn)展。
實(shí)際上,如果單從大模型的數(shù)量和研發(fā)時間來看,中美并沒有不可逾越的距離。有數(shù)據(jù)顯示,自2020年起,中國的大模型數(shù)量驟增,僅2020年到2021年,中國大模型數(shù)量就從2個增至21個,和美國量級同等,大幅領(lǐng)先于其他國家。
具體到目前業(yè)界具有代表性的AI大模型上,國外的OpenAI在2021年發(fā)布120億參數(shù)的多模態(tài)大模型CLIP、DALL-E,同年谷歌發(fā)布ALIGN 、VIT-G/14時,國內(nèi)的百度已經(jīng)有了文心大模型,阿里也推出了國內(nèi)首個千億參數(shù)多模態(tài)大模型M6,華為和商湯紛紛在這年推出自己的大模型盤古和書生(INTERN),騰訊則在2022年對外官宣了混元大模型。
參數(shù)規(guī)模上,國內(nèi)目前也已經(jīng)有不少能比肩ChatGPT的大模型,如百度的文心大模型參數(shù)量2600億,阿里的多模態(tài)大模型M6參數(shù)規(guī)模突破10萬億,據(jù)稱已經(jīng)遠(yuǎn)超谷歌、微軟的大模型參數(shù)規(guī)模,成為全球最大的AI預(yù)訓(xùn)練模型。
不過,不可否認(rèn)的是,從效果來看,國內(nèi)廠商的大模型距離領(lǐng)先的OpenAI仍然還有距離,需要國內(nèi)企業(yè)提速追趕。
曠視科技聯(lián)合創(chuàng)始人、CEO印奇認(rèn)為,國內(nèi)目前已經(jīng)公布的大模型,跟GPT-3.5還有較大差距。李開復(fù)也在最近表示,自己嘗試過一些所謂的中國ChatGPT,發(fā)現(xiàn)他們的確不如ChatGPT。
”這種差異歸咎于英語服務(wù)比中國競爭者提供的數(shù)據(jù)更多、質(zhì)量更高。但在技術(shù)方面,有幾家公司給我留下了相當(dāng)深刻的印象“。李開復(fù)認(rèn)為,中國公司可能需要一年時間才能獲得同等或可能更大的數(shù)據(jù)量。
實(shí)際上,由于GPT-3之后,OpenAI的所有模型就沒有再開源,GPT-3.5、甚至GPT-4的運(yùn)行機(jī)制是什么,如何達(dá)成這種效果,仍需國內(nèi)企業(yè)進(jìn)一步去跑通。印奇認(rèn)為,中國攻堅 AI 大模型目前最重要的是要先能把GPT-3.5復(fù)現(xiàn)出來,"這是所有事情的起點(diǎn)"。
但這個過程并沒有想象的那么容易。相對于美國在基礎(chǔ)技術(shù)上的創(chuàng)新投入,中國 AI 公司還是要面臨相對短周期商業(yè)化的壓力,而不可能像OpenAI和DeepMind一樣,“我們沒有那么奢侈的條件?!痹谟∑婵磥?,中美在 AI 領(lǐng)域差距并沒有那么大,國內(nèi)只要迎頭趕上還是有優(yōu)勢的,但也“要有極強(qiáng)的危機(jī)感?!?/p>
03 大量小模型企業(yè)將要轉(zhuǎn)型
大模型出來之前,各行各業(yè)的小模型已經(jīng)運(yùn)行了一段時間。相比于大模型展現(xiàn)出的強(qiáng)大能力,做小模型的企業(yè)又將何去何從?
“咱們不能拿著錘子,看什么都是釘子,有些場景小模型已經(jīng)能滿足需求,就沒必要用大模型去解決它。”百度AI中臺總監(jiān)忻舟告訴數(shù)智前線,像門口閘機(jī)系統(tǒng),基本上靠人臉識別就已經(jīng)用得很好了,就沒必要再用一個大模型去迭代。
但同時,忻舟和不少資深人士都認(rèn)為,大模型的確給碎片化場景和原來用小模型解決不好的場景,帶來改變。
在忻舟看來,大模型導(dǎo)致了AI產(chǎn)業(yè)應(yīng)用新范式的出現(xiàn)。"原來的范式是每個場景都有一個模型,需要專家做設(shè)計、標(biāo)注數(shù)據(jù),新的范式卻是通用大模型加行業(yè)數(shù)據(jù)變成行業(yè)大模型,再針對不同場景使用少量數(shù)據(jù)就能得到場景的模型,場景的模型還可以做數(shù)據(jù)回流來增強(qiáng)行業(yè)大模型的能力?!?/p>
在他看來,這種新范式的出現(xiàn),會給整個人工智能企業(yè)的服務(wù)生態(tài)帶來很大變化。例如,原來在一些單點(diǎn)為客戶提供服務(wù),滿足他們某個領(lǐng)域如金融行業(yè)需求的創(chuàng)業(yè)公司,在大模型技術(shù)到來后,優(yōu)勢將大幅降低,這些企業(yè)如果想繼續(xù)活下去,就必須想辦法擁抱有大模型的企業(yè),合作去做相關(guān)工作。
與此同時,大模型技術(shù)使得人工智能的門檻進(jìn)一步降低后,由于不需要每家企業(yè)從頭訓(xùn)練NLP或CV能力,會有更多的企業(yè)進(jìn)來,加劇整個行業(yè)的競爭。這時,服務(wù)好、成本控制好、在大模型的基礎(chǔ)上有更多創(chuàng)新的企業(yè),將被市場篩選出來,也會使原來亂報價的現(xiàn)象得到控制。
“我認(rèn)為他會給整個人工智能企業(yè)服務(wù)行業(yè)帶來一個正向結(jié)果。”忻舟表示。這是一個大的趨勢,尤其是創(chuàng)業(yè)企業(yè),誰能最先擁抱這樣的趨勢來對自己的服務(wù)模式和商業(yè)模式做一定的改變,誰就更能夠在新AI時代活下來。
大模型的熱潮還將長期持續(xù)。在大模型的落地部署上,此前一些問題正在出現(xiàn)一些新的解決方向。
比如大模型通常需要更大的算力消耗,尤其是昂貴的GPU,從而導(dǎo)致的高部署成本問題。數(shù)智前線獲悉,不少人工智能企業(yè)目前已經(jīng)可以通過一些方法探索如何更合理地控制成本。比如,推理時對模型進(jìn)行壓縮和蒸餾,使一個大的模型壓縮成一個小的模型,同時確保其效果不降或只降一點(diǎn)點(diǎn),也能大幅節(jié)約成本。
事實(shí)上,據(jù)業(yè)內(nèi)人士透露,如何將模型做“小”正在成為大模型產(chǎn)業(yè)落地的一個重要課題。實(shí)在智能CEO孫林君此前就曾表示,大模型生態(tài)里,除了專用高質(zhì)量數(shù)據(jù)外,最重要的工作是基于預(yù)訓(xùn)練大模型跑出來的參數(shù)底座,去微調(diào)壓縮訓(xùn)練垂直領(lǐng)域內(nèi)的新的專用小模型,這可以降低算力和成本,同時提高自身產(chǎn)品的用戶體驗(yàn)。
又比如一些人擔(dān)心的大模型是否能私有化部署的問題。幾位業(yè)界人士告訴數(shù)智前線,大模型是可以支持私有云的。李彥宏也表示,圍繞文心一言,百度既有公有云服務(wù),也可以做私有化部署。對于中國客戶青睞的私有化部署,國內(nèi)的企業(yè)都將提供和實(shí)踐性價比越來越高的方法。