正在閱讀:

百度“文心一言”,就這?

掃一掃下載界面新聞APP

百度“文心一言”,就這?

李彥宏,太急了。

攝影:界面新聞 匡達(dá)

文|深燃  王敏

編輯|金玙璠

“沖刺”一個(gè)多月后,百度文心一言終于來了,但剛出道就遭到群嘲。

3月16日下午,百度舉行文心一言發(fā)布會(huì),被寄予厚望的發(fā)布會(huì)居然沒有產(chǎn)品現(xiàn)場(chǎng)演示,而是采用“Demo演示”的形式,用提前準(zhǔn)備好的問題和答案做展示,瞬間引發(fā)眾多吐槽?;蛟S百度是吸取了谷歌的教訓(xùn),看到其因Bard產(chǎn)品在演示中“翻車”導(dǎo)致市值一下子蒸發(fā)了1000億美金后,才變得謹(jǐn)慎。

不僅如此,很多對(duì)新產(chǎn)品躍躍欲試的用戶們,被“邀請(qǐng)碼”阻擋在了門外。直到晚間,才有極少部分用戶真正“嘗鮮”。

深燃拿到邀請(qǐng)碼后,第一時(shí)間實(shí)測(cè)了文心一言的“五大能力”,整體感受是,文心一言的大多數(shù)回答,還算流暢自然,產(chǎn)品達(dá)到可用水平,但對(duì)于部分基礎(chǔ)問題,不能正確理解題意,更不要說給出準(zhǔn)確答案,而且多輪對(duì)話能力也有所欠缺。

就在前一天,國內(nèi)外還沉浸在對(duì)3月14日OpenAI新上線的GPT-4的討論中。GPT-4比上一代準(zhǔn)確性更高,解決問題能力更強(qiáng),可以處理超2.5萬字的文本,并支持圖像輸入,盡管現(xiàn)在圖像輸入還未對(duì)外開放,但這款產(chǎn)品已經(jīng)拔高了用戶對(duì)產(chǎn)品的標(biāo)準(zhǔn)。

在文心一言發(fā)布的當(dāng)晚,微軟再發(fā)“重磅炸彈”,舉辦了一場(chǎng)Microsoft 365 Copilot發(fā)布會(huì),將GPT-4模型引入Office應(yīng)用程序,舉個(gè)例子,熬夜趕不完的論文Word、看不出數(shù)據(jù)聯(lián)系的Excel表格,都可以找Copilot來幫忙。Copilot也被評(píng)價(jià)為,要顛覆打工人的工作方式。

自去年12月以來,中外大廠們都紛紛沖刺,試圖追趕ChatGPT,百度被視為是國內(nèi)比較有希望追趕ChatGPT的選手之一,兩相對(duì)比,有部分用戶表示看到文心一言時(shí),覺得被迎頭澆上一盆冷水。資本市場(chǎng)對(duì)百度的文心一言似乎也不買賬,發(fā)布會(huì)進(jìn)行過程中,百度股價(jià)一度下跌10%。截至3月16日收盤,百度股價(jià)報(bào)125.1港元,跌6.36%。

不可否認(rèn),作為國內(nèi)第一款對(duì)標(biāo)ChatGPT的產(chǎn)品,百度也算是勇敢的邁出了第一步。但此前百度鋪天蓋地的宣傳已經(jīng)拉高了外界預(yù)期,目前看來文心一言有些高開低走,讓外界對(duì)其何去何從產(chǎn)生了質(zhì)疑。

親測(cè)百度文心一言,不夠AI

從2月初官宣要集中“沖刺”,百度文心一言吊足了外界的胃口。

但在正式發(fā)布時(shí),觀眾們的評(píng)價(jià)都是“文心一言,一言難盡”、“CheatGPT”等不太正面的言辭。

對(duì)于這次百度文心一言和ChatGPT的PK,英諾天使基金合伙人王晟對(duì)深燃形容道,就像是“China PPT VS ChatGPT”。

百度“文心一言”究竟怎么樣?在發(fā)布會(huì)現(xiàn)場(chǎng),百度創(chuàng)始人李彥宏從文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五個(gè)方面舉例展示了文心一言的能力。拿到邀請(qǐng)碼后,深燃也從五大層面對(duì)文心一言進(jìn)行了體驗(yàn),并將部分答案與接入GPT-4的微軟New Bing或基于GPT-3.5的ChatGPT進(jìn)行了對(duì)比,試圖得到一些結(jié)論。

在文學(xué)創(chuàng)作層面,在對(duì)于最近爆火電視劇《黑暗榮耀》的劇情總結(jié)時(shí),文心一言的答案和劇情不太相符,New Bing的答案更貼近劇情。不過,在深燃提出將電視劇進(jìn)行喜劇改編時(shí),兩個(gè)產(chǎn)品的表現(xiàn)都不算太好,但New Bing對(duì)于追問的回答,更加靈活。

圖源 / 文心一言

圖源 / New Bing

在商業(yè)文案的創(chuàng)作能力上,我們讓這兩個(gè)產(chǎn)品分別給“文心一言”想一句廣告詞,文心一言設(shè)計(jì)的廣告詞詞句更加優(yōu)美,而New Bing設(shè)計(jì)的廣告詞更側(cè)重于產(chǎn)品特性。

圖源 / 文心一言

圖源 / New Bing

至于數(shù)學(xué)推理能力,對(duì)于小學(xué)奧數(shù)題的解答,文心一言給出了一個(gè)錯(cuò)誤答案,New Bing的最終答案是準(zhǔn)確的。

圖源 / 文心一言

圖源 / New Bing

對(duì)于中文理解能力,讓兩款產(chǎn)品解讀網(wǎng)友對(duì)于文心一言邀請(qǐng)碼的調(diào)侃,結(jié)果是,文心一言和New Bing都沒能精準(zhǔn)解讀其中的調(diào)侃意味,不過文心一言識(shí)別出了KFC是快餐品牌,還提醒不要將該邀請(qǐng)碼和特定品牌關(guān)聯(lián)。

圖源/文心一言

圖源 / New Bing

在腦筋急轉(zhuǎn)彎式的對(duì)話中,交給文心一言“要電話號(hào)碼”的任務(wù)后,其在第二輪就忘記了,而ChatGPT還記得上一輪的隱藏任務(wù)。

圖源 / 文心一言

圖源 / ChatGPT

在多模態(tài)生成方面,目前ChatGPT的識(shí)圖功能還沒對(duì)外開放。文心一言可以根據(jù)文字生成圖片、語言和視頻,但是這并非新功能,此前在百度的其他產(chǎn)品中也已經(jīng)看到過。而且文字生成圖片有時(shí)生成的圖片并不精準(zhǔn)。比如,本意是想獲得一只阿拉斯加犬圖片,但由于表述不夠精確,最后得到的是一張動(dòng)漫圖片。

圖源 / 文心一言

總結(jié)下來,從深燃的初步體驗(yàn)來看,“文心一言”沒有達(dá)到驚艷效果,有時(shí)更像搜索引擎,回答問題的方式相對(duì)模式化,情感色彩流露較少,在回答問題的精準(zhǔn)性、靈活性、上下文多輪對(duì)話等方面還有待提升。而基于GPT大模型的產(chǎn)品在語言組織和創(chuàng)造能力上更加靈活、流暢,交互性更強(qiáng)一些。

智能客服從業(yè)者Allen對(duì)深燃表示,僅從個(gè)人體驗(yàn)的主觀感受而言,如果說ChatGPT能夠提供正確答案的比例在90%,那么文心一言只有70%。不過,至少從用戶體驗(yàn)的便捷度而言,文心一言之于國內(nèi)用戶,要比ChatGPT更加方便。

距離OpenAI,百度差了多少步?

對(duì)于“文心一言”的產(chǎn)品表現(xiàn),百度創(chuàng)始人李彥宏略顯底氣不足,在發(fā)布會(huì)剛出場(chǎng)不久,就開始主動(dòng)降低用戶預(yù)期。他說道,“要對(duì)標(biāo)ChatGPT、甚至GPT-4,門檻還是很高的”、“自己測(cè)試還是感覺有很多不完美的地方”。

產(chǎn)品的背后,國內(nèi)大廠和OpenAI相比,差在了哪里,差距又有多大?

AI大模型之爭(zhēng)最早是在國外科技巨頭之間,此后國內(nèi)大廠紛紛跟進(jìn)。有專家分析稱,在2020年中GPT-3發(fā)布后,雙方差距進(jìn)一步拉大,當(dāng)時(shí)很多人認(rèn)為不僅是技術(shù)的差距,更體現(xiàn)了AI模型的發(fā)展新理念。

在GPT-3的基礎(chǔ)上,OpenAI進(jìn)行了大量的微調(diào)和訓(xùn)練,增強(qiáng)交互性、更加產(chǎn)品化后,有了基于3.5版本的ChatGPT。

值得注意的是,3月14日GPT-4的發(fā)布,再次拉大了雙方的距離。和上一代相比,GPT-4有很多跨越式提升,包括邏輯推理能力更強(qiáng),比做題家更會(huì)考試;支持圖像輸入并能理解圖像;能接收超大上下文,支持輸入處理超過25000個(gè)單詞的文本;更有創(chuàng)造力,能夠?qū)懘a、寫小說、編劇。

差距拉大的背后,是人才、資金投入和技術(shù)積累的差距。

伴隨著ChatGPT的火熱,從業(yè)者們都表示,要做底層AI大模型,資金、頂尖科技人才、技術(shù)積累,這些要素缺一不可。

做大模型,前提是有資金的投入。OpenAI在2019年獲得微軟10億美金的投入后,又于今年獲得了微軟100億美金的投資,這讓其有了燒錢的資本。業(yè)界測(cè)算,GPT-3涉及1750億參數(shù),訓(xùn)練費(fèi)用約花費(fèi)1200萬美元。據(jù)國盛證券報(bào)告估算,GPT-3訓(xùn)練一次成本約為140萬美元,每一次訓(xùn)練任務(wù)都耗資巨大。

此外,大模型訓(xùn)練的三要素包括大算力、大數(shù)據(jù)和大模型。有從業(yè)者指出,影響最后訓(xùn)練結(jié)果的因素有很多,包括清洗、標(biāo)注、模型結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練推理的技術(shù)積累等。每一個(gè)因素的變化都影響著最后的結(jié)果。

過去十幾年里百度一直在AI方面投入,包括2019年推出文心大語言模型。2022年百度核心研發(fā)費(fèi)用達(dá)到214.16億元,占百度核心收入比例達(dá)22.4%。

但是,百度和OpenAI還有不小差距。李彥宏也表示,無論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語言模型。因?yàn)樯疃葘W(xué)習(xí)、自然語言處理,需要多年的堅(jiān)持和積累,沒法速成。

王晟曾指出,中國的ChatGPT們即便奮起直追,靜態(tài)來講兩三年能追上就已經(jīng)是樂觀情況。但如果對(duì)方一直進(jìn)化,且進(jìn)展速度遠(yuǎn)比追得速度要快,那么可能永遠(yuǎn)都追不上。直到對(duì)方遇到瓶頸不得不停下來,或者國內(nèi)選手找到新的技術(shù)路徑,才有可能打平。

AI,百度不能輸?shù)囊粦?zhàn)

相較于完美,文心一言更加注重“爭(zhēng)第一”,李彥宏強(qiáng)調(diào),“對(duì)標(biāo)ChatGPT,百度是全球大廠中第一個(gè)”。

大模型帶來了AI產(chǎn)業(yè)的變革,也將是未來十年的主流趨勢(shì),這已經(jīng)成為了業(yè)界共識(shí)。

想要入場(chǎng)分羹的選手不少。自去年12月ChatGPT發(fā)布之后,無論是一級(jí)市場(chǎng),還是國內(nèi)外的大廠,都在發(fā)力大模型,研發(fā)類ChatGPT產(chǎn)品。

在國內(nèi)一級(jí)市場(chǎng)上,投資機(jī)構(gòu)為了投大模型公司,焦慮難安,行業(yè)幾乎每天都會(huì)有大量認(rèn)知的迭代。與之相應(yīng)的是創(chuàng)業(yè)熱潮,前美團(tuán)聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級(jí)副總裁周伯文等一批大佬,都在殺向大模型賽道。

國內(nèi)大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。

相較于其余互聯(lián)網(wǎng)大廠而言,AI,是百度“不能輸”的一戰(zhàn)。王晟分析道,站在企業(yè)角度,騰訊、阿里等大廠,發(fā)力AI是給原有業(yè)務(wù)提供助力,但AI之于百度是生死問題,需要“殊死一搏”,也會(huì)用出“破釜沉舟”的力氣來研發(fā)新產(chǎn)品。

在百度的營收結(jié)構(gòu)中,廣告是大頭,2022年占六成左右,但近幾年,呈現(xiàn)萎縮局勢(shì),而且被阿里、騰訊等大廠超越。百度需要搜索引擎的變革來使得廣告業(yè)務(wù)回溫。另一方面,百度近幾年在AI方面投入頗多,而且一直對(duì)外強(qiáng)調(diào)其AI能力,更是將以AI為特色的百度智能云當(dāng)作重要增長(zhǎng)曲線。

OpenAI在GPT-4發(fā)布后,通過ChatGPT Plus付費(fèi)版以及面向企業(yè)開放接口,正從一家小型非營利性實(shí)驗(yàn)室向一家成熟的商業(yè)公司轉(zhuǎn)變。Allen認(rèn)為,百度作為互聯(lián)網(wǎng)大廠,自身體量比較大,有很多業(yè)務(wù)線可以直接用上文心一言,享受商業(yè)化的紅利。

此外,AI大模型時(shí)代的到來,也將帶來大量產(chǎn)業(yè)機(jī)會(huì)。李彥宏在發(fā)布會(huì)上稱,大語言模型帶來三大產(chǎn)業(yè)機(jī)會(huì):第一類是新型云計(jì)算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS;第二類是進(jìn)行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Konwhow(技術(shù)訣竅),調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案;第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。

盡管“文心一言”和ChatGPT相比或許還有差距,但并不意味著其沒有發(fā)展空間。

一方面,能夠發(fā)布一款成型產(chǎn)品,百度在國內(nèi)爭(zhēng)奪的第一,確實(shí)領(lǐng)先了其他同行。另一方面,在國內(nèi)用戶和企業(yè)較難順暢使用ChatGPT的情況下,需要一款本土產(chǎn)品來提供服務(wù)。“技不如人”的情況下,百度還可以靠本土化取勝。李彥宏也提到,百度在沒有完全準(zhǔn)備好的情況下發(fā)布“文心一言”,是出于市場(chǎng)的需要。

考慮到信息安全和數(shù)據(jù)安全等因素,中國必須要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技術(shù)門檻,目前中國能做語言類大模型的團(tuán)隊(duì)非常有限,有潛在能力做的只有10來個(gè)團(tuán)隊(duì),最終能成的可能只有2-3家。

也就是說,百度或許并不需要和ChatGPT正面硬剛,只要在國內(nèi)市場(chǎng)上能夠占據(jù)領(lǐng)先位置,就能夠享受中國市場(chǎng)所帶來的紅利和發(fā)展空間。

王晟認(rèn)為,短期內(nèi),百度的“文心一言”或許沒有達(dá)到市場(chǎng)預(yù)期,但從中長(zhǎng)期來看,百度還是具備一定的競(jìng)爭(zhēng)力。

新一輪AI范式變革,才剛剛開始。

*深燃(shenrancaijing)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

百度

6k
  • 李彥宏堅(jiān)稱不做視頻生成模型,中國版Sora到底值不值得做?
  • 盤前機(jī)會(huì)前瞻| 工信部最新發(fā)聲!高級(jí)自動(dòng)駕駛技術(shù)有望實(shí)現(xiàn)重大突破,這幾家公司與百度、小鵬深度合作部分產(chǎn)品已經(jīng)量產(chǎn)(附概念股)

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

百度“文心一言”,就這?

李彥宏,太急了。

攝影:界面新聞 匡達(dá)

文|深燃  王敏

編輯|金玙璠

“沖刺”一個(gè)多月后,百度文心一言終于來了,但剛出道就遭到群嘲。

3月16日下午,百度舉行文心一言發(fā)布會(huì),被寄予厚望的發(fā)布會(huì)居然沒有產(chǎn)品現(xiàn)場(chǎng)演示,而是采用“Demo演示”的形式,用提前準(zhǔn)備好的問題和答案做展示,瞬間引發(fā)眾多吐槽。或許百度是吸取了谷歌的教訓(xùn),看到其因Bard產(chǎn)品在演示中“翻車”導(dǎo)致市值一下子蒸發(fā)了1000億美金后,才變得謹(jǐn)慎。

不僅如此,很多對(duì)新產(chǎn)品躍躍欲試的用戶們,被“邀請(qǐng)碼”阻擋在了門外。直到晚間,才有極少部分用戶真正“嘗鮮”。

深燃拿到邀請(qǐng)碼后,第一時(shí)間實(shí)測(cè)了文心一言的“五大能力”,整體感受是,文心一言的大多數(shù)回答,還算流暢自然,產(chǎn)品達(dá)到可用水平,但對(duì)于部分基礎(chǔ)問題,不能正確理解題意,更不要說給出準(zhǔn)確答案,而且多輪對(duì)話能力也有所欠缺。

就在前一天,國內(nèi)外還沉浸在對(duì)3月14日OpenAI新上線的GPT-4的討論中。GPT-4比上一代準(zhǔn)確性更高,解決問題能力更強(qiáng),可以處理超2.5萬字的文本,并支持圖像輸入,盡管現(xiàn)在圖像輸入還未對(duì)外開放,但這款產(chǎn)品已經(jīng)拔高了用戶對(duì)產(chǎn)品的標(biāo)準(zhǔn)。

在文心一言發(fā)布的當(dāng)晚,微軟再發(fā)“重磅炸彈”,舉辦了一場(chǎng)Microsoft 365 Copilot發(fā)布會(huì),將GPT-4模型引入Office應(yīng)用程序,舉個(gè)例子,熬夜趕不完的論文Word、看不出數(shù)據(jù)聯(lián)系的Excel表格,都可以找Copilot來幫忙。Copilot也被評(píng)價(jià)為,要顛覆打工人的工作方式。

自去年12月以來,中外大廠們都紛紛沖刺,試圖追趕ChatGPT,百度被視為是國內(nèi)比較有希望追趕ChatGPT的選手之一,兩相對(duì)比,有部分用戶表示看到文心一言時(shí),覺得被迎頭澆上一盆冷水。資本市場(chǎng)對(duì)百度的文心一言似乎也不買賬,發(fā)布會(huì)進(jìn)行過程中,百度股價(jià)一度下跌10%。截至3月16日收盤,百度股價(jià)報(bào)125.1港元,跌6.36%。

不可否認(rèn),作為國內(nèi)第一款對(duì)標(biāo)ChatGPT的產(chǎn)品,百度也算是勇敢的邁出了第一步。但此前百度鋪天蓋地的宣傳已經(jīng)拉高了外界預(yù)期,目前看來文心一言有些高開低走,讓外界對(duì)其何去何從產(chǎn)生了質(zhì)疑。

親測(cè)百度文心一言,不夠AI

從2月初官宣要集中“沖刺”,百度文心一言吊足了外界的胃口。

但在正式發(fā)布時(shí),觀眾們的評(píng)價(jià)都是“文心一言,一言難盡”、“CheatGPT”等不太正面的言辭。

對(duì)于這次百度文心一言和ChatGPT的PK,英諾天使基金合伙人王晟對(duì)深燃形容道,就像是“China PPT VS ChatGPT”。

百度“文心一言”究竟怎么樣?在發(fā)布會(huì)現(xiàn)場(chǎng),百度創(chuàng)始人李彥宏從文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成五個(gè)方面舉例展示了文心一言的能力。拿到邀請(qǐng)碼后,深燃也從五大層面對(duì)文心一言進(jìn)行了體驗(yàn),并將部分答案與接入GPT-4的微軟New Bing或基于GPT-3.5的ChatGPT進(jìn)行了對(duì)比,試圖得到一些結(jié)論。

在文學(xué)創(chuàng)作層面,在對(duì)于最近爆火電視劇《黑暗榮耀》的劇情總結(jié)時(shí),文心一言的答案和劇情不太相符,New Bing的答案更貼近劇情。不過,在深燃提出將電視劇進(jìn)行喜劇改編時(shí),兩個(gè)產(chǎn)品的表現(xiàn)都不算太好,但New Bing對(duì)于追問的回答,更加靈活。

圖源 / 文心一言

圖源 / New Bing

在商業(yè)文案的創(chuàng)作能力上,我們讓這兩個(gè)產(chǎn)品分別給“文心一言”想一句廣告詞,文心一言設(shè)計(jì)的廣告詞詞句更加優(yōu)美,而New Bing設(shè)計(jì)的廣告詞更側(cè)重于產(chǎn)品特性。

圖源 / 文心一言

圖源 / New Bing

至于數(shù)學(xué)推理能力,對(duì)于小學(xué)奧數(shù)題的解答,文心一言給出了一個(gè)錯(cuò)誤答案,New Bing的最終答案是準(zhǔn)確的。

圖源 / 文心一言

圖源 / New Bing

對(duì)于中文理解能力,讓兩款產(chǎn)品解讀網(wǎng)友對(duì)于文心一言邀請(qǐng)碼的調(diào)侃,結(jié)果是,文心一言和New Bing都沒能精準(zhǔn)解讀其中的調(diào)侃意味,不過文心一言識(shí)別出了KFC是快餐品牌,還提醒不要將該邀請(qǐng)碼和特定品牌關(guān)聯(lián)。

圖源/文心一言

圖源 / New Bing

在腦筋急轉(zhuǎn)彎式的對(duì)話中,交給文心一言“要電話號(hào)碼”的任務(wù)后,其在第二輪就忘記了,而ChatGPT還記得上一輪的隱藏任務(wù)。

圖源 / 文心一言

圖源 / ChatGPT

在多模態(tài)生成方面,目前ChatGPT的識(shí)圖功能還沒對(duì)外開放。文心一言可以根據(jù)文字生成圖片、語言和視頻,但是這并非新功能,此前在百度的其他產(chǎn)品中也已經(jīng)看到過。而且文字生成圖片有時(shí)生成的圖片并不精準(zhǔn)。比如,本意是想獲得一只阿拉斯加犬圖片,但由于表述不夠精確,最后得到的是一張動(dòng)漫圖片。

圖源 / 文心一言

總結(jié)下來,從深燃的初步體驗(yàn)來看,“文心一言”沒有達(dá)到驚艷效果,有時(shí)更像搜索引擎,回答問題的方式相對(duì)模式化,情感色彩流露較少,在回答問題的精準(zhǔn)性、靈活性、上下文多輪對(duì)話等方面還有待提升。而基于GPT大模型的產(chǎn)品在語言組織和創(chuàng)造能力上更加靈活、流暢,交互性更強(qiáng)一些。

智能客服從業(yè)者Allen對(duì)深燃表示,僅從個(gè)人體驗(yàn)的主觀感受而言,如果說ChatGPT能夠提供正確答案的比例在90%,那么文心一言只有70%。不過,至少從用戶體驗(yàn)的便捷度而言,文心一言之于國內(nèi)用戶,要比ChatGPT更加方便。

距離OpenAI,百度差了多少步?

對(duì)于“文心一言”的產(chǎn)品表現(xiàn),百度創(chuàng)始人李彥宏略顯底氣不足,在發(fā)布會(huì)剛出場(chǎng)不久,就開始主動(dòng)降低用戶預(yù)期。他說道,“要對(duì)標(biāo)ChatGPT、甚至GPT-4,門檻還是很高的”、“自己測(cè)試還是感覺有很多不完美的地方”。

產(chǎn)品的背后,國內(nèi)大廠和OpenAI相比,差在了哪里,差距又有多大?

AI大模型之爭(zhēng)最早是在國外科技巨頭之間,此后國內(nèi)大廠紛紛跟進(jìn)。有專家分析稱,在2020年中GPT-3發(fā)布后,雙方差距進(jìn)一步拉大,當(dāng)時(shí)很多人認(rèn)為不僅是技術(shù)的差距,更體現(xiàn)了AI模型的發(fā)展新理念。

在GPT-3的基礎(chǔ)上,OpenAI進(jìn)行了大量的微調(diào)和訓(xùn)練,增強(qiáng)交互性、更加產(chǎn)品化后,有了基于3.5版本的ChatGPT。

值得注意的是,3月14日GPT-4的發(fā)布,再次拉大了雙方的距離。和上一代相比,GPT-4有很多跨越式提升,包括邏輯推理能力更強(qiáng),比做題家更會(huì)考試;支持圖像輸入并能理解圖像;能接收超大上下文,支持輸入處理超過25000個(gè)單詞的文本;更有創(chuàng)造力,能夠?qū)懘a、寫小說、編劇。

差距拉大的背后,是人才、資金投入和技術(shù)積累的差距。

伴隨著ChatGPT的火熱,從業(yè)者們都表示,要做底層AI大模型,資金、頂尖科技人才、技術(shù)積累,這些要素缺一不可。

做大模型,前提是有資金的投入。OpenAI在2019年獲得微軟10億美金的投入后,又于今年獲得了微軟100億美金的投資,這讓其有了燒錢的資本。業(yè)界測(cè)算,GPT-3涉及1750億參數(shù),訓(xùn)練費(fèi)用約花費(fèi)1200萬美元。據(jù)國盛證券報(bào)告估算,GPT-3訓(xùn)練一次成本約為140萬美元,每一次訓(xùn)練任務(wù)都耗資巨大。

此外,大模型訓(xùn)練的三要素包括大算力、大數(shù)據(jù)和大模型。有從業(yè)者指出,影響最后訓(xùn)練結(jié)果的因素有很多,包括清洗、標(biāo)注、模型結(jié)構(gòu)設(shè)計(jì)、訓(xùn)練推理的技術(shù)積累等。每一個(gè)因素的變化都影響著最后的結(jié)果。

過去十幾年里百度一直在AI方面投入,包括2019年推出文心大語言模型。2022年百度核心研發(fā)費(fèi)用達(dá)到214.16億元,占百度核心收入比例達(dá)22.4%。

但是,百度和OpenAI還有不小差距。李彥宏也表示,無論是哪家公司,都不可能靠突擊幾個(gè)月就能做出這樣的大語言模型。因?yàn)樯疃葘W(xué)習(xí)、自然語言處理,需要多年的堅(jiān)持和積累,沒法速成。

王晟曾指出,中國的ChatGPT們即便奮起直追,靜態(tài)來講兩三年能追上就已經(jīng)是樂觀情況。但如果對(duì)方一直進(jìn)化,且進(jìn)展速度遠(yuǎn)比追得速度要快,那么可能永遠(yuǎn)都追不上。直到對(duì)方遇到瓶頸不得不停下來,或者國內(nèi)選手找到新的技術(shù)路徑,才有可能打平。

AI,百度不能輸?shù)囊粦?zhàn)

相較于完美,文心一言更加注重“爭(zhēng)第一”,李彥宏強(qiáng)調(diào),“對(duì)標(biāo)ChatGPT,百度是全球大廠中第一個(gè)”。

大模型帶來了AI產(chǎn)業(yè)的變革,也將是未來十年的主流趨勢(shì),這已經(jīng)成為了業(yè)界共識(shí)。

想要入場(chǎng)分羹的選手不少。自去年12月ChatGPT發(fā)布之后,無論是一級(jí)市場(chǎng),還是國內(nèi)外的大廠,都在發(fā)力大模型,研發(fā)類ChatGPT產(chǎn)品。

在國內(nèi)一級(jí)市場(chǎng)上,投資機(jī)構(gòu)為了投大模型公司,焦慮難安,行業(yè)幾乎每天都會(huì)有大量認(rèn)知的迭代。與之相應(yīng)的是創(chuàng)業(yè)熱潮,前美團(tuán)聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛、前搜狗CEO王小川、前京東高級(jí)副總裁周伯文等一批大佬,都在殺向大模型賽道。

國內(nèi)大廠們更是如此。除了百度之外,阿里、騰訊、華為、字節(jié)、科大訊飛、商湯都沒有放棄大模型之戰(zhàn)。

相較于其余互聯(lián)網(wǎng)大廠而言,AI,是百度“不能輸”的一戰(zhàn)。王晟分析道,站在企業(yè)角度,騰訊、阿里等大廠,發(fā)力AI是給原有業(yè)務(wù)提供助力,但AI之于百度是生死問題,需要“殊死一搏”,也會(huì)用出“破釜沉舟”的力氣來研發(fā)新產(chǎn)品。

在百度的營收結(jié)構(gòu)中,廣告是大頭,2022年占六成左右,但近幾年,呈現(xiàn)萎縮局勢(shì),而且被阿里、騰訊等大廠超越。百度需要搜索引擎的變革來使得廣告業(yè)務(wù)回溫。另一方面,百度近幾年在AI方面投入頗多,而且一直對(duì)外強(qiáng)調(diào)其AI能力,更是將以AI為特色的百度智能云當(dāng)作重要增長(zhǎng)曲線。

OpenAI在GPT-4發(fā)布后,通過ChatGPT Plus付費(fèi)版以及面向企業(yè)開放接口,正從一家小型非營利性實(shí)驗(yàn)室向一家成熟的商業(yè)公司轉(zhuǎn)變。Allen認(rèn)為,百度作為互聯(lián)網(wǎng)大廠,自身體量比較大,有很多業(yè)務(wù)線可以直接用上文心一言,享受商業(yè)化的紅利。

此外,AI大模型時(shí)代的到來,也將帶來大量產(chǎn)業(yè)機(jī)會(huì)。李彥宏在發(fā)布會(huì)上稱,大語言模型帶來三大產(chǎn)業(yè)機(jī)會(huì):第一類是新型云計(jì)算公司,其主流商業(yè)模式從IaaS變?yōu)镸aaS;第二類是進(jìn)行行業(yè)模型精調(diào)的公司,這是通用大模型和企業(yè)之間的中間層,他們具有行業(yè)Konwhow(技術(shù)訣竅),調(diào)用通用大模型能力,為行業(yè)客戶提供解決方案;第三類是基于大模型底座進(jìn)行應(yīng)用開發(fā)的公司,即應(yīng)用服務(wù)提供商。

盡管“文心一言”和ChatGPT相比或許還有差距,但并不意味著其沒有發(fā)展空間。

一方面,能夠發(fā)布一款成型產(chǎn)品,百度在國內(nèi)爭(zhēng)奪的第一,確實(shí)領(lǐng)先了其他同行。另一方面,在國內(nèi)用戶和企業(yè)較難順暢使用ChatGPT的情況下,需要一款本土產(chǎn)品來提供服務(wù)?!凹疾蝗缛恕钡那闆r下,百度還可以靠本土化取勝。李彥宏也提到,百度在沒有完全準(zhǔn)備好的情況下發(fā)布“文心一言”,是出于市場(chǎng)的需要。

考慮到信息安全和數(shù)據(jù)安全等因素,中國必須要有自研的AI大模型。王晟分析,由于AI算力的高投入和高技術(shù)門檻,目前中國能做語言類大模型的團(tuán)隊(duì)非常有限,有潛在能力做的只有10來個(gè)團(tuán)隊(duì),最終能成的可能只有2-3家。

也就是說,百度或許并不需要和ChatGPT正面硬剛,只要在國內(nèi)市場(chǎng)上能夠占據(jù)領(lǐng)先位置,就能夠享受中國市場(chǎng)所帶來的紅利和發(fā)展空間。

王晟認(rèn)為,短期內(nèi),百度的“文心一言”或許沒有達(dá)到市場(chǎng)預(yù)期,但從中長(zhǎng)期來看,百度還是具備一定的競(jìng)爭(zhēng)力。

新一輪AI范式變革,才剛剛開始。

*深燃(shenrancaijing)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。