文 | 巨潮 荊玉
最近一段時(shí)間,生成式AI賽道受關(guān)注的程度,用“烈火烹油”來形容都不過分。
2022年11月ChatGPT誕生。憑借背后強(qiáng)大的技術(shù),ChatGPT可以完成流暢對(duì)答、寫腳本、寫方案、寫代碼等各項(xiàng)功能,更展現(xiàn)出了此前AI無法實(shí)現(xiàn)的“創(chuàng)造”能力,讓C端用戶都驚喜不已。因此其僅用了兩個(gè)月用戶數(shù)便已突破1億,成為史上躥紅最快的應(yīng)用。
隨后谷歌、Meta、亞馬遜等巨頭企業(yè)也迅速跟進(jìn),探索生成式AI技術(shù)與自身業(yè)務(wù)的結(jié)合;小型的AI初創(chuàng)公司也由此迎來了新一輪的投資熱潮。生成式AI的熱度之高,讓人恍惚有回到移動(dòng)互聯(lián)網(wǎng)創(chuàng)業(yè)熱潮中的感覺。
AIGC(即AI Generated Content,國內(nèi)對(duì)于生成式AI的另一個(gè)稱呼)已徹底成了中國互聯(lián)網(wǎng)領(lǐng)域的新風(fēng)口。過去一個(gè)月內(nèi),百度、阿里、騰訊、京東等廠商先后宣布了自身在AIGC方面的技術(shù)布局和未來計(jì)劃。
國內(nèi)AIGC玩家中,最被給予厚望的還是百度。在“All in AI”戰(zhàn)略下,百度在過去10年的研發(fā)投入超過1100億元,在大模型領(lǐng)域有一定積累。其也被一些業(yè)內(nèi)人士認(rèn)為是“最有可能做出中國版ChatGPT的企業(yè)”。
3月10日,百度正式官宣了旗下的類ChatGPT聊天機(jī)器人——“文心一言”的消息。據(jù)其官方微博消息,百度計(jì)劃于3月16日14時(shí)在北京總部召開新聞發(fā)布會(huì),主題圍繞“文心一言”。
然而,截至目前全球還沒有能與ChatGPT抗衡的大模型,業(yè)內(nèi)的普遍共識(shí)是差距在兩年以上。因此百度“匆忙”發(fā)布一款ChatGPT的競品,也被不少行業(yè)觀察者質(zhì)疑——屆時(shí)百度會(huì)不會(huì)拿出一款不夠智能和有創(chuàng)造力的平庸產(chǎn)品?
這個(gè)問題上,百度曾經(jīng)的對(duì)標(biāo)谷歌已經(jīng)吃了虧。后者的類ChatGPT產(chǎn)品Bard在首秀發(fā)布會(huì)上出現(xiàn)了明顯錯(cuò)誤,這導(dǎo)致谷歌當(dāng)日股價(jià)重挫7%,市值下跌1000億美元,也給用戶留下了技不如人的印象。
而百度新產(chǎn)品的情況似乎也并不比谷歌樂觀多少。據(jù)外媒華爾街日?qǐng)?bào)近日?qǐng)?bào)道,文心一言的發(fā)布準(zhǔn)備工作極為倉促和匆忙,數(shù)百名員工一直在夜以繼日地工作。截至發(fā)布會(huì)一周前,“這款聊天機(jī)器人的一些基本功能仍未完成。”一些研發(fā)員工對(duì)文心一言也缺乏信心,“他們已經(jīng)在其推出之前賣掉了該公司部分股票?!?/p>
01 百度的關(guān)鍵一戰(zhàn)
ChatGPT甚至能夠產(chǎn)出“有創(chuàng)造力”的內(nèi)容,這確實(shí)是之前AI從未展現(xiàn)出的能力。
在2015年之前,人工智能基本是小模型的天下。此前蘋果Siri、微軟小冰、百度小度,以及各個(gè)平臺(tái)的客服機(jī)器人背后都是小模型,其系統(tǒng)中包含多個(gè)具體程序單元,一個(gè)專門負(fù)責(zé)負(fù)責(zé)聊對(duì)話聊天、一個(gè)專門負(fù)責(zé)詩詞生成、一個(gè)專門負(fù)責(zé)代碼生成等。
如果需要增加新功能,只需要訓(xùn)練一個(gè)新的程序單元。如果用戶的問題超出了既有程序的范圍,那么語音助手就會(huì)從人工智能變?yōu)槿斯ぶ钦稀?/p>
但ChatGPT采取了不同的“大模型+Prompting(提示詞)”的模式,其背后是一個(gè)經(jīng)過海量數(shù)據(jù)喂養(yǎng)的大的程序單元來解決用戶的所有問題。因而其表現(xiàn)更智能更有創(chuàng)造性,更加接近科幻電影中無所不知的通用型人工智能。
因此,ChatGPT的誕生是一個(gè)標(biāo)志性的事件,標(biāo)志著人工智能的“技術(shù)奇點(diǎn)”正在逐漸臨近。
前微軟CEO比爾·蓋茨對(duì)ChatGPT評(píng)價(jià)為“不亞于互聯(lián)網(wǎng)誕生”,現(xiàn)微軟CEO薩提亞·納德拉將其盛贊為“堪比工業(yè)革命”。就連埃隆·馬斯克都評(píng)價(jià)道:“ChatGPT好得驚人,我們離危險(xiǎn)的強(qiáng)人工智能不遠(yuǎn)了?!?/p>
一個(gè)具備如此顛覆性和革命性的技術(shù),自然也具備著巨大的商業(yè)價(jià)值。知名機(jī)構(gòu)紅杉資本在一篇名為《生成式AI:一個(gè)充滿創(chuàng)造力的新世界》的報(bào)告中表示,生成式AI讓機(jī)器開始大規(guī)模涉足知識(shí)類和創(chuàng)造性工作,這涉及數(shù)十億人的工作,未來預(yù)計(jì)能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。
面對(duì)ChatGPT,國內(nèi)的AI專業(yè)人士卻普遍感受到了與國外技術(shù)發(fā)展的巨大差距,內(nèi)心五味雜陳、感慨萬千。在社交網(wǎng)絡(luò)上,就此事引發(fā)的關(guān)于中美科技發(fā)展的對(duì)比討論,也充滿了對(duì)中國AI企業(yè)短視的批評(píng),以及對(duì)中國自主大模型的殷切期待之情。
在此背景下,在AI領(lǐng)域布局較深的百度無疑就成為了那個(gè)“全村的希望”。機(jī)構(gòu)IDC 2月發(fā)布的《2022中國大模型發(fā)展白皮書》顯示,在國內(nèi)9家主流廠商的大模型當(dāng)中,百度文心大模型位于第一梯隊(duì),產(chǎn)品能力、生態(tài)能力、應(yīng)用能力全面領(lǐng)先。
對(duì)于百度來說,AI大模型也是一個(gè)逆襲的絕佳機(jī)會(huì)。
此前,由于錯(cuò)過了移動(dòng)互聯(lián)網(wǎng)時(shí)代,百度被甩出“BAT”陣營,在收入、市值上也已掉隊(duì)多年。而在即將到來的“堪比互聯(lián)網(wǎng)誕生和工業(yè)革命”的新時(shí)代,百度如能掌握先機(jī),快人一步,自然也就有了逆襲的機(jī)會(huì)。
由于AI算力的高投入和高技術(shù)門檻,中國能做語言類大模型的團(tuán)隊(duì)非常有限。英諾天使基金合伙人王晟認(rèn)為,加上大廠、一些科研機(jī)構(gòu)和創(chuàng)業(yè)公司,總體數(shù)量可能不超過十個(gè)團(tuán)隊(duì)。而百度無疑將是其中極具競爭力的玩家之一。
且AI大模型關(guān)系到未來的信息分發(fā)方式和數(shù)億人的工作,關(guān)系到未來公民信息和國家數(shù)據(jù)的安全,因此中國必須要有自主的“大模型”,甚至必須被建設(shè)和運(yùn)行在國產(chǎn)化的存儲(chǔ)、算力、操作系統(tǒng)等基礎(chǔ)平臺(tái)上——這意味著,百度也許并不需要和ChatGPT正面競爭,只要在技術(shù)和應(yīng)用上領(lǐng)先國內(nèi)同行一個(gè)身位,就能夠最大化享受中國市場(chǎng)的紅利,就如同當(dāng)初的搜索業(yè)務(wù)一樣。
不夸張地說,如果百度能夠在AIGC領(lǐng)域占據(jù)中國市場(chǎng)的先機(jī),“追趕騰訊阿里,重回BAT陣營”就并不遙遠(yuǎn)。
這或許也是李彥宏為何如此著急推出文心一言的原因——據(jù)媒體36氪報(bào)道,多位百度員工向其證實(shí),高層下了死命令,要在一個(gè)月時(shí)間內(nèi)看到產(chǎn)品。
02 “有目的的賭博”
為抓緊時(shí)間趕在最后期限前推出產(chǎn)品,百度一直在爭分奪秒,與時(shí)間賽跑。李彥宏這種“急就章”的決策被外媒評(píng)價(jià)為“有目的的賭博”。
據(jù)悉,2020年的時(shí)候,百度就已經(jīng)開發(fā)出了有16億個(gè)參數(shù)的、類似ChatGPT的通用對(duì)話生成模型PLATO-2——與當(dāng)時(shí)的GPT-2的參數(shù)量(15億)基本處于同一個(gè)級(jí)別。
但在ChatGPT躥紅之前,百度并沒有將人工智能的研發(fā)重點(diǎn)放在類似ChatGPT的大型語言模型開發(fā)上。如今ChatGPT的參數(shù)量已經(jīng)達(dá)到了1750億,數(shù)據(jù)量高達(dá)45TB。如前文所言,百度能否在短時(shí)間內(nèi)快速訓(xùn)練模型實(shí)現(xiàn)追趕,存在著很大的不確定性。
國內(nèi)輿論場(chǎng)上,從百度內(nèi)部員工、到行業(yè)觀察者、新聞評(píng)論區(qū),都不乏對(duì)百度過早推出類ChatGPT產(chǎn)品的看空的聲音。
有百度NLP(自然語言處理)部門的員工在接受媒體華爾街見聞采訪時(shí)表示,ChatGPT背后框架龐大復(fù)雜,現(xiàn)有技術(shù)單模型解決起來有一定難度,公司以前沒做出來過,現(xiàn)在突然說幾個(gè)月之內(nèi)就能搞定,很擔(dān)心新項(xiàng)目會(huì)步“希壤”后塵。
谷歌的失敗也打擊了部分行業(yè)觀察者對(duì)于百度的信心。如上文所言,就連谷歌推出的類ChatGPT產(chǎn)品也翻了車。而谷歌是Transformer/T5/PaLM模型的提出者,旗下的Deepmind也被普遍認(rèn)為是最有可能挑戰(zhàn)OpenAI的公司。如果谷歌不能在短時(shí)間內(nèi)復(fù)現(xiàn)ChatGPT的能力,那么其他AI公司也很難做到。
今年二月,有網(wǎng)友爆料,其在試用百度AI文生圖產(chǎn)品“文心一格”時(shí)發(fā)現(xiàn),百度的文心一格AI對(duì)于語義的理解存在問題。
巨潮記者嘗試著分別在文心一格和OpenAI旗下的DALLE網(wǎng)站上分別輸出“皮卡丘大戰(zhàn)犬夜叉”,得到的圖片結(jié)果顯示,文心一格生成的圖片中并未包含犬夜叉的影像。顯然其對(duì)于中文語義的理解仍然存在著一定的問題。
盡管存在以上看空和擔(dān)憂的聲音,實(shí)際運(yùn)行效果仍未完全明朗,但百度的公關(guān)宣傳卻十分高調(diào)。
有媒體統(tǒng)計(jì),截至2月末,已有上百家媒體、多家汽車品牌、營銷機(jī)構(gòu)、企業(yè)服務(wù)商、金融服務(wù)商以及互聯(lián)網(wǎng)公司宣布“接入文心一言”,成為首批生態(tài)合作伙伴,連少林寺都來了,儼然已經(jīng)形成了一個(gè)生態(tài)圈,吊足了外界的胃口。
選擇官宣與文心一言的合作,不同類型的公司需求各異,如媒體和營銷公司要用文心一言幫助生產(chǎn)內(nèi)容,汽車廠商想借助其提升人車交互;但據(jù)媒體報(bào)道,文心一言的可用程度如何,能達(dá)到怎樣的效果,這些官宣合作的廠商目前實(shí)際上也并不清楚。
從品牌營銷的角度來看,部分行業(yè)觀察者也擔(dān)憂,百度在前期如此高調(diào)的宣傳,給予投資者和C端用戶太高的預(yù)期,如果實(shí)際產(chǎn)品與ChatGPT存在太大差距,有可能遭遇反噬,反而傷害了品牌和口碑。
03 風(fēng)物長宜放眼量
從中短期來看,文心一言的發(fā)布其實(shí)很難給百度帶來收益的改善。
AI大模型實(shí)在太燒錢了。正如此前海通證券科技行業(yè)首席分析師鄭宏達(dá)對(duì)美團(tuán)聯(lián)合創(chuàng)始人王慧文的嗆聲所言,大模型訓(xùn)練一次就花500萬美元,5000萬美元只夠訓(xùn)練10次。此外,還得面臨高昂的硬件采購成本和日常運(yùn)營成本。
《財(cái)經(jīng)十一人》分析指出,生成式AI的投資規(guī)模高達(dá)百億元,但ChatGPT只是對(duì)話機(jī)器人,商業(yè)應(yīng)用場(chǎng)景展示暫時(shí)有限。因此,其中短期內(nèi)不僅無法盈利,還要虧更多錢。
對(duì)于百度而言,另一方面的因素則是原搜索業(yè)務(wù)可能遭遇的沖擊——搜索廣告的本質(zhì)是給用戶展現(xiàn)更多的結(jié)果頁面,可ChatGPT則是更精準(zhǔn)、更有邏輯地推送答案,兩者結(jié)合之后自然會(huì)影響到廣告的投放。
ChatGPT的智能化和創(chuàng)造力對(duì)于搜索市占率不到5%的微軟必應(yīng)來說,是搶占用戶和市場(chǎng)的利器;但對(duì)于國內(nèi)搜索市占率超過70%的百度來說,則可能是一種不小的沖擊。
對(duì)于生成式AI的持續(xù)投入的效果,最終將作用于未來。如前文紅杉資本的報(bào)道所言,生成式AI讓機(jī)器開始大規(guī)模涉足知識(shí)類和創(chuàng)造性工作,未來預(yù)計(jì)能夠產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。
以通用的大模型為基礎(chǔ),AIGC可細(xì)分為文本生成、音頻生成、圖像生成、視頻生成、跨模態(tài)生成等技術(shù)場(chǎng)景,可以應(yīng)用到文案、營銷、設(shè)計(jì)、行業(yè)研究等文化傳媒領(lǐng)域,還有醫(yī)療+AI,教育+AI,數(shù)字人,游戲等各行各業(yè)中。
因此,僅僅訓(xùn)練出高質(zhì)量的大模型是不夠的,還要建立起一個(gè)完整的應(yīng)用生態(tài)。這或許也是李彥宏冒著“可能遠(yuǎn)不及ChatGPT”的風(fēng)險(xiǎn)也要爭分奪秒發(fā)布文心一言的原因之一。
一旦能夠搶占先機(jī),形成圍繞大模型的應(yīng)用生態(tài),建立起在to B領(lǐng)域的先發(fā)優(yōu)勢(shì),百度也就真正坐穩(wěn)了國內(nèi)生成式AI賽道的頭把交易,并成為未來社會(huì)不可替代的基礎(chǔ)設(shè)施。
只不過在國內(nèi)AI大模型上落后美國兩年左右的整體背景下,即使要搶占國內(nèi)市場(chǎng)的先機(jī),百度也實(shí)在不必如此操之過急——競爭對(duì)手即使已經(jīng)在做大模型的研發(fā),一時(shí)間也很難拿出可落地的產(chǎn)品。
而百度更需要做的是穩(wěn)扎穩(wěn)打,將文心一言的效果打磨到最好。否則一旦產(chǎn)品不行,當(dāng)下官宣合作的廠商,最后大概率都都會(huì)逃跑。
風(fēng)物長宜放眼量??紤]到國內(nèi)AI大模型的整體發(fā)展階段,幾天后百度發(fā)布的文心一言將只是一場(chǎng)摸底考,讓外界得以知悉百度AI大模型的實(shí)力幾何。
站在長期主義的視角來看,國內(nèi)生成式AI賽道的競爭實(shí)際上才剛剛開始。未來誰能在最短時(shí)間內(nèi)復(fù)現(xiàn)ChatGPT的能力,才是賽道的第一個(gè)轉(zhuǎn)折點(diǎn)。