正在閱讀:

GPT-4,從北喬峰變南慕容?

掃一掃下載界面新聞APP

GPT-4,從北喬峰變南慕容?

之前看GPT-4像喬峰,武功蓋世?,F(xiàn)在看GPT-4像慕容復(fù),浪得虛名?

界面新聞|范劍磊

文 | 數(shù)字力場(chǎng)  佘宗明

發(fā)現(xiàn)沒(méi),好像沒(méi)什么人再吹GPT-4了。

料到了它的熱度會(huì)降下來(lái),不降對(duì)不起Gartner曲線,但沒(méi)想到是斷崖式下降。

要知道,110多天前,作為ChatGPT進(jìn)化版的GPT-4剛問(wèn)世時(shí),很多人還被它能1秒生成網(wǎng)站、解答邏輯題、調(diào)侃腦筋急轉(zhuǎn)彎的能力驚到了。

那時(shí)候,國(guó)人的反應(yīng)通常包括幾點(diǎn):

先是震驚,“真是牛逼Plus”。

后是擔(dān)心,“差距又拉大了”。

接著是覺(jué)得自己想象力已經(jīng)不夠用了:按照GPT這一日千里的進(jìn)化速度,GPT-5出來(lái)后,是不是得宣告大結(jié)局了?

盡管今天輿論談到GPT時(shí)習(xí)慣提ChatGPT,但GPT-4其實(shí)是更強(qiáng)大的存在。

“皮衣刀客”黃仁勛就說(shuō):GPT-4的厲害之處,OpenAI也沒(méi)說(shuō)清楚。

360創(chuàng)始人周鴻祎則是將GPT-4視作“通用人工智能的奇點(diǎn)和強(qiáng)人工智能到來(lái)的拐點(diǎn)”。

“硅基取代碳基”的話題,也被GPT-4的史詩(shī)級(jí)進(jìn)化帶入輿論場(chǎng)。

包括馬斯克跟AI教父Bengio在內(nèi)的上千名科技行業(yè)人士,沒(méi)多久后還聯(lián)名發(fā)公開(kāi)信,呼吁暫停強(qiáng)AI的研發(fā)。

▲馬斯克等上千名科技人士此前曾發(fā)聯(lián)名公開(kāi)信,呼吁為強(qiáng)AI研發(fā)摁暫停鍵。

一股擔(dān)心科技大爆炸引發(fā)社會(huì)大震蕩的流行情緒,在全球蔓延開(kāi)來(lái)。

可現(xiàn)在呢,你跟許多人說(shuō)GPT-4,他沒(méi)準(zhǔn)會(huì)回你:GPT什么?G什么4?什么PT4?

你說(shuō):行,你先涼快著吧。他說(shuō)“好嘞”,爾后繼續(xù)刷普里戈任或蔡徐坤。

天空響了一道驚雷,但風(fēng)暴雨并沒(méi)有來(lái)。

何止是GPT-4,就連ChatGPT和背后的OpenAI公司,都在“增長(zhǎng)放緩”的判斷和“這輪AI見(jiàn)頂了嗎”的分析中,顯得有些黯淡失色。

以前上熱搜,指向的都是ChatGPT厲害炸了。

而今成熱門(mén),畫(huà)風(fēng)早已大變——

圖靈獎(jiǎng)得主楊立昆炮轟ChatGPT:五年內(nèi)就沒(méi)人用了

馬斯克為了不再被ChatGPT白嫖,決定給 Twitter“上鎖”

ChatGPT涼了?6月訪問(wèn)量環(huán)比下滑近10%

OpenAI遭集體訴訟,明星大模型變“數(shù)據(jù)小偷”?

已經(jīng)有媒體開(kāi)始嚴(yán)肅討論:GPT,是吹起來(lái)的泡沫嗎?

01

之前看GPT-4像喬峰,武功蓋世。

現(xiàn)在看GPT-4像慕容復(fù),浪得虛名。

這似乎又是個(gè)“初看是王者,再看是青銅”的副本。

問(wèn)題來(lái)了:現(xiàn)有的大模型天花板GPT-4,已經(jīng)不香了嗎?

看上去,確實(shí)是這樣。

就在上個(gè)月,“GPT-4變笨”的話題,一度在國(guó)外技術(shù)社區(qū)內(nèi)引發(fā)熱議。

有用戶(hù)反饋,把GPT-4的3小時(shí)25條對(duì)話額度一口氣用完了,都沒(méi)能解決自己的代碼問(wèn)題,切換到ChatGPT基于的GPT-3.5版本,反倒把事情解決了。

他反饋的主要問(wèn)題包括:以前GPT-4能寫(xiě)對(duì)的代碼,現(xiàn)在滿(mǎn)是Bug;回答問(wèn)題的深度分析變少了,內(nèi)容質(zhì)量變差了。

這引起網(wǎng)友們的共鳴,“GPT-4開(kāi)倒車(chē)”的說(shuō)法由此興起。

不少網(wǎng)友都懷疑,GPT-4會(huì)像微軟必應(yīng)那樣,出道即巔峰,但后來(lái)慘遭“前額葉切除”。

深度學(xué)習(xí)框架Keras創(chuàng)始人、網(wǎng)紅科學(xué)家Fran?ois Chollet,為GPT-4“自干五”地洗道:

不是GPT的表現(xiàn)變差,而是大家渡過(guò)了最初的驚喜期,對(duì)它的期待變高了。

言下之意,是高期待值拉高了人們對(duì)GPT失誤的敏感度。

但OpenAI開(kāi)發(fā)者推廣大使Logan Kilpatrick,倒是挺會(huì)自我拆臺(tái)——

▲很顯然,OpenAI開(kāi)發(fā)者推廣大使是個(gè)耿直Boy。

網(wǎng)友問(wèn)他,GPT-4大模型本體自從3月14日發(fā)布以來(lái)都是靜態(tài)的,對(duì)吧?

他說(shuō),沒(méi)錯(cuò)。

網(wǎng)友又問(wèn)他,相同提示詞回答不一致,是因?yàn)榇竽P捅旧聿环€(wěn)定嗎?

他又回答,Yes。

02

GPT-4變“弱”了,國(guó)內(nèi)科技大佬的“大模型自信”也就變強(qiáng)了。

幾個(gè)月前,國(guó)內(nèi)外AI大模型存在代差,幾乎是共識(shí),歧異只在于差距到底有多大。

今年3月25日,周鴻祎曾表示,中國(guó)大語(yǔ)言模型和GPT-4差距在兩三年。

5月上旬,周鴻祎跟俞敏洪對(duì)談,談到ChatGPT問(wèn)題時(shí)說(shuō),“如果不經(jīng)過(guò)兩年的模仿和抄襲,上來(lái)就說(shuō)自己能超越,那才叫吹牛呢?!?/p>

幾天后,做客央視節(jié)目時(shí)又說(shuō):GPT-4有強(qiáng)大的思維鏈模型,能夠把一個(gè)事情做連續(xù)多步推理,能夠把一個(gè)目標(biāo)做多任務(wù)的分解和規(guī)劃。如果要跟這種能力去比,國(guó)內(nèi)大模型引擎跟它比都是六七十分的水平,差距可能是兩年,“如果有人說(shuō)差兩個(gè)月、差兩周我可能不太相信”。

華為原副總裁張俊對(duì)此大概頗為認(rèn)同,他5月下旬接受采訪時(shí)也說(shuō),國(guó)內(nèi)外AI大模型存在約兩年的代差。

而李彥宏被王小川懟,也是因?yàn)樗?月下旬接受專(zhuān)訪時(shí)提了一嘴“文心一言和 ChatGPT 的水平差了2個(gè)月,但可以追趕”。

在王小川看來(lái),這屬于自我吹噓,“怎么可能只差2個(gè)月?”“之前如果說(shuō)追上GPT-3.5用一年還是有可能的,但是目前OpenAI已經(jīng)訓(xùn)練到GPT-4的級(jí)別,GPT-5也在訓(xùn)練過(guò)程當(dāng)中,我們追上還需要三年?!?/p>

就連李彥宏之后都給自己找補(bǔ),說(shuō)自己是被斷章取義了。

彼時(shí)的共識(shí)就是:AI大模型的進(jìn)化是非線性的,其正向增強(qiáng)回路的特點(diǎn)會(huì)強(qiáng)化“強(qiáng)者愈強(qiáng)”的頭部效應(yīng),外加語(yǔ)料庫(kù)質(zhì)量差異,國(guó)內(nèi)外AI大模型可能會(huì)越拉越大。

但近段時(shí)間,某些大佬的口徑在變。

科大訊飛董事長(zhǎng)劉慶峰就很自信。在5月6日的訊飛星火認(rèn)知大模型發(fā)布會(huì)上,劉慶峰表示,當(dāng)前訊飛星火認(rèn)知大模型已經(jīng)在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力三大能力上已超ChatGPT。

他還揚(yáng)言:10月24日,將實(shí)現(xiàn)通用模型對(duì)標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。

周鴻祎也不遑多讓?zhuān)?月8日,跟品玩創(chuàng)始人駱軼航對(duì)話時(shí),他說(shuō),最近幾個(gè)月國(guó)內(nèi)同行陸陸續(xù)續(xù)發(fā)布了自己的大模型,雖然客觀來(lái)講跟GPT4.0還有點(diǎn)差距,相比GPT3.5也有點(diǎn)差距,但差距沒(méi)有那么大。

在5天后的360智腦大模型發(fā)布會(huì)上,他更是表示,國(guó)內(nèi)大模型已基本趕上或接近國(guó)際先進(jìn)水平,之前曾說(shuō)和全球先進(jìn)的差距有一兩年,今天收回這句話。

中國(guó)工程院院士鄔賀銓在6月下旬接受采訪時(shí)也說(shuō),評(píng)價(jià)大模型水平應(yīng)該是多維度的,全面性、合理性、使用便捷性、響應(yīng)速度、成本、能效等,籠統(tǒng)地說(shuō)目前我國(guó)大模型開(kāi)發(fā)與國(guó)外的差距為1—2年的依據(jù)還不清楚,現(xiàn)在下這一結(jié)論意義也不大。

他還指出,按2022年年底的數(shù)據(jù),美國(guó)占全球算力36%,中國(guó)占31%,現(xiàn)有算力總規(guī)模與美國(guó)相比有差距但不大,而以GPU和NPU為主的智能算力規(guī)模中,中國(guó)明顯高于美國(guó)(按2021年年底數(shù)據(jù),美國(guó)智算規(guī)模占全球智算總規(guī)模15%,中國(guó)占26%)。

03

所以,GPT-4是被吹得太狠了嗎?

這兩天的兩則新聞,或許挺適合對(duì)此作答:

阿里達(dá)摩院多語(yǔ)言NLP團(tuán)隊(duì)日前發(fā)布了首個(gè)多語(yǔ)言多模態(tài)測(cè)試基準(zhǔn) M3Exam,共涵蓋 12317 道題目,結(jié)果顯示,多語(yǔ)言能力上,GPT-4是唯一一個(gè)可以超過(guò)60%準(zhǔn)確率的模型, 其他的均不及格。

麻省理工學(xué)院和微軟的學(xué)者近來(lái)的研究也發(fā)現(xiàn),GPT-4在自修復(fù)方面表現(xiàn)出了有效能力,GPT-3.5則沒(méi)有。在此之外,GPT-4還能夠?qū)PT-3.5生成的代碼提供反饋。

那為什么很多人感覺(jué)GPT-4能力退化了?

微軟研究院早前刷屏的那篇論文《AGI的火花:GPT-4早期試驗(yàn)》中的說(shuō)法,興許可資參考:

微軟方面獲得的GPT-4版本性能,要遠(yuǎn)強(qiáng)于目前的公測(cè)版本。公測(cè)版本變?nèi)?,是因?yàn)樗獙?duì)標(biāo)人類(lèi)的指令和價(jià)值觀。

說(shuō)大白話就是:OpenAI也怕出安全問(wèn)題,所以“寧可變慢一點(diǎn),也要安全一些”。

有人會(huì)說(shuō):不重要了,沒(méi)看到人家訪問(wèn)量正在下滑嗎?

訪問(wèn)量下滑,確實(shí)是不少人評(píng)價(jià)ChatGPT們“漲不動(dòng)了”“也不行了”的重要依據(jù)。

乍看起來(lái),這不乏數(shù)據(jù)支撐:多家數(shù)據(jù)分析網(wǎng)站指出,ChatGPT的訪問(wèn)量環(huán)比增長(zhǎng)率已從1月份的131.6%、2月份的62.5%、3月份的55.8%、4月份的12.6%,跌到了5月份的2.8%,6月份或環(huán)比下降。

 

▲統(tǒng)計(jì)顯示,ChatGPT的訪問(wèn)量增速出現(xiàn)回落態(tài)勢(shì)。

OpenAI麾下的ChatGPT和GPT-4告別流量高增長(zhǎng)時(shí)代,大概率是事實(shí)。

但別忘了幾點(diǎn)潛在背景:

1,OpenAI未必在乎C端用戶(hù)直接訪問(wèn)官網(wǎng)的流量,因?yàn)樗幌窀鶥端客戶(hù)搶用戶(hù)。

OpenAI的CEO阿爾特曼就曾表示,ChatGPT未來(lái)的核心戰(zhàn)略使命,是吸引更多的企業(yè)應(yīng)用程序接入API,而非在C端,與自己的企業(yè)客戶(hù)爭(zhēng)奪流量。

OpenAI從3月初開(kāi)始,就在降價(jià)token的費(fèi)用,借此鼓勵(lì)更多第三方開(kāi)發(fā)者(很多都是B端客戶(hù))使用ChatGPT和Whisper工具,通過(guò)API接口整合接入他們的服務(wù)。

現(xiàn)實(shí)中,很多人訪問(wèn)的都是那些應(yīng)用插件,而不是OpenAI官網(wǎng)。這難免對(duì)ChatGPT和GPT-4造成分流,但那些統(tǒng)計(jì)工具并未顧及這層因素。

2,4月初ChatGPT曾出現(xiàn)大面積封號(hào),主要針對(duì)“特制工具”批量注冊(cè)的黑賬號(hào)。

來(lái)自東方的神秘力量們憑著VPN和黑科技貢獻(xiàn)的流量,就被切掉了。

所以,你說(shuō)它的流量下滑沒(méi)毛病,但這未必是OpenAI最在意的。

04

不論是GPT-4貌似沒(méi)那么“靈”了,還是ChatGPT和GPT-4訪問(wèn)量下滑了,都指向了一點(diǎn):

大模型的正確打開(kāi)方式,與其說(shuō)是做流量入口,不如說(shuō)是深入行業(yè)場(chǎng)景,做行業(yè)數(shù)字化的AI底座。

從網(wǎng)絡(luò)反饋看,反映GPT-4變笨了的,主要都是些細(xì)分行業(yè)從業(yè)者。他們想要的業(yè)務(wù)知識(shí),確實(shí)是那些基礎(chǔ)性、普適型的公用大模型給不了的。

OpenAI要把自身從C端爆火的超級(jí)AI應(yīng)用,變成并不性感的API接口服務(wù)平臺(tái),說(shuō)白了,就是想將價(jià)值做深,而不是只賺流量錢(qián)。

為什么阿里云的通義千問(wèn)今年4月發(fā)布后,想要通過(guò)“伙伴計(jì)劃”撬動(dòng)更多企業(yè)在再訓(xùn)練和精調(diào)基礎(chǔ)上打造企業(yè)的專(zhuān)屬大模型?

為什么周鴻祎說(shuō)“公有大模型在落地政府、城市、行業(yè)和企業(yè)場(chǎng)景時(shí)并不能直接使用,存在著缺乏行業(yè)深度、易帶來(lái)數(shù)據(jù)安全隱患、無(wú)法保障內(nèi)容真正可信及無(wú)法實(shí)現(xiàn)成本可控四大痛點(diǎn)”,企業(yè)級(jí)垂直大模型才是未來(lái)?

為什么騰訊云6月19日不是直接發(fā)布基礎(chǔ)的通用大模型,而是發(fā)布面向 B 端客戶(hù)的 MaaS(模型即服務(wù))服務(wù)解決方案,幫金融、政府、文旅、傳媒、教育等行業(yè)打造契合自身業(yè)務(wù)需要的“專(zhuān)屬模型”?

原因就在于:AI大模型是工業(yè)革命級(jí)的生產(chǎn)力工具,最終得服務(wù)于生產(chǎn)效率提升,是以還得將B端作為切入口。

唯有如此,才能在AI時(shí)代“把所有行業(yè)重做一遍”。

前些天,傅盛PK朱嘯虎,圍繞ChatGPT激辯,核心也在于類(lèi)ChatGPT產(chǎn)品的價(jià)值點(diǎn)開(kāi)掘上。

▲傅盛跟朱嘯虎前不久在朋友圈激辯大模型創(chuàng)業(yè)。

作為創(chuàng)投圈話題人物的朱嘯虎,認(rèn)為ChatGPT對(duì)創(chuàng)業(yè)者不友好,只有大廠商才玩得轉(zhuǎn)大模型,大模型都是在大模型上做應(yīng)用又沒(méi)什么價(jià)值,完全沒(méi)有BAT級(jí)機(jī)會(huì)。

曾跟周鴻祎、雷軍、馬化騰、馬云等一眾大佬相愛(ài)相殺的獵豹?jiǎng)?chuàng)始人傅盛,則認(rèn)為大模型催生了很多新的架構(gòu)在大模型之上的創(chuàng)業(yè)機(jī)會(huì),包括直接在大模型上搭建的不同應(yīng)用和由于數(shù)據(jù)私有帶來(lái)的垂直領(lǐng)域大模型等。

可以這么理解:朱嘯虎認(rèn)為,創(chuàng)業(yè)公司們很難復(fù)制OpenAI,壓根就沒(méi)做通用AI時(shí)代的Windows或安卓系統(tǒng)的機(jī)會(huì)。

傅盛則不以為然,認(rèn)為做AI時(shí)代的美團(tuán)滴滴也挺好——美團(tuán)滴滴們不就是靠拿捏住落地場(chǎng)景做大的嗎?

05

說(shuō)回GPT-4,再怎么說(shuō)它變?nèi)趿?,它依舊是霸榜級(jí)別的存在。

打個(gè)不甚恰當(dāng)?shù)谋确?,GPT-4就是大模型版NBA里巔峰期還沒(méi)過(guò)去的詹姆斯,它身后的Bard、LLaMA、文心一言、通義千問(wèn)等,就相當(dāng)于字母哥、杜蘭特、庫(kù)里、約基奇,仍在追趕。

詹姆斯未必是“永遠(yuǎn)的神”(華語(yǔ)樂(lè)壇這么多年了“永遠(yuǎn)的神”也只有華晨宇一個(gè)),但在其鼎盛期,他的實(shí)力是獨(dú)一檔。

至于OpenAI的GPT以后會(huì)不會(huì)走下坡路,就難以料定了。

就目前看,中國(guó)大模型的追趕之路仍然道阻且長(zhǎng)。

特別是考慮到美國(guó)預(yù)計(jì)7月份針對(duì)對(duì)華芯片出口實(shí)施新管制,連英偉達(dá)為中國(guó)特供的A100平替版GPU芯片A800都要禁,加速追趕正迎來(lái)更多高難度挑戰(zhàn)。

但不能說(shuō)中國(guó)大模型就沒(méi)機(jī)會(huì)。中國(guó)互聯(lián)網(wǎng)過(guò)去20年能彎道超車(chē),成為全球Top2的玩家,超大市場(chǎng)提供的海量應(yīng)用場(chǎng)景就是個(gè)重要因素。

中國(guó)消費(fèi)互聯(lián)網(wǎng)規(guī)模能做成全球第一,就得益于互聯(lián)網(wǎng)平臺(tái)們抓住了應(yīng)用場(chǎng)景里蘊(yùn)藏的機(jī)會(huì),進(jìn)而不斷做大。

到了大模型時(shí)代,國(guó)產(chǎn)大模型很難再做出ChatGPT那種一問(wèn)世就舉世矚目的大模型產(chǎn)品了,畢竟喝頭啖湯有身位優(yōu)勢(shì)。

可它們能不能立足于應(yīng)用場(chǎng)景,在助益實(shí)體產(chǎn)業(yè)中發(fā)掘出更多“平臺(tái)級(jí)”機(jī)會(huì)來(lái),還挺值得觀察。

能,就會(huì)得到市場(chǎng)的犒賞。

說(shuō)到底,GPT-4有沒(méi)有從北喬峰變南慕容,固然挺有說(shuō)頭。

但反求諸己,更重要的,還是練好“適合自身體質(zhì)”的武功秘笈。

不然的話,連進(jìn)AI江湖“五絕”的機(jī)會(huì)都沒(méi)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

GPT-4,從北喬峰變南慕容?

之前看GPT-4像喬峰,武功蓋世?,F(xiàn)在看GPT-4像慕容復(fù),浪得虛名?

界面新聞|范劍磊

文 | 數(shù)字力場(chǎng)  佘宗明

發(fā)現(xiàn)沒(méi),好像沒(méi)什么人再吹GPT-4了。

料到了它的熱度會(huì)降下來(lái),不降對(duì)不起Gartner曲線,但沒(méi)想到是斷崖式下降。

要知道,110多天前,作為ChatGPT進(jìn)化版的GPT-4剛問(wèn)世時(shí),很多人還被它能1秒生成網(wǎng)站、解答邏輯題、調(diào)侃腦筋急轉(zhuǎn)彎的能力驚到了。

那時(shí)候,國(guó)人的反應(yīng)通常包括幾點(diǎn):

先是震驚,“真是牛逼Plus”。

后是擔(dān)心,“差距又拉大了”。

接著是覺(jué)得自己想象力已經(jīng)不夠用了:按照GPT這一日千里的進(jìn)化速度,GPT-5出來(lái)后,是不是得宣告大結(jié)局了?

盡管今天輿論談到GPT時(shí)習(xí)慣提ChatGPT,但GPT-4其實(shí)是更強(qiáng)大的存在。

“皮衣刀客”黃仁勛就說(shuō):GPT-4的厲害之處,OpenAI也沒(méi)說(shuō)清楚。

360創(chuàng)始人周鴻祎則是將GPT-4視作“通用人工智能的奇點(diǎn)和強(qiáng)人工智能到來(lái)的拐點(diǎn)”。

“硅基取代碳基”的話題,也被GPT-4的史詩(shī)級(jí)進(jìn)化帶入輿論場(chǎng)。

包括馬斯克跟AI教父Bengio在內(nèi)的上千名科技行業(yè)人士,沒(méi)多久后還聯(lián)名發(fā)公開(kāi)信,呼吁暫停強(qiáng)AI的研發(fā)。

▲馬斯克等上千名科技人士此前曾發(fā)聯(lián)名公開(kāi)信,呼吁為強(qiáng)AI研發(fā)摁暫停鍵。

一股擔(dān)心科技大爆炸引發(fā)社會(huì)大震蕩的流行情緒,在全球蔓延開(kāi)來(lái)。

可現(xiàn)在呢,你跟許多人說(shuō)GPT-4,他沒(méi)準(zhǔn)會(huì)回你:GPT什么?G什么4?什么PT4?

你說(shuō):行,你先涼快著吧。他說(shuō)“好嘞”,爾后繼續(xù)刷普里戈任或蔡徐坤。

天空響了一道驚雷,但風(fēng)暴雨并沒(méi)有來(lái)。

何止是GPT-4,就連ChatGPT和背后的OpenAI公司,都在“增長(zhǎng)放緩”的判斷和“這輪AI見(jiàn)頂了嗎”的分析中,顯得有些黯淡失色。

以前上熱搜,指向的都是ChatGPT厲害炸了。

而今成熱門(mén),畫(huà)風(fēng)早已大變——

圖靈獎(jiǎng)得主楊立昆炮轟ChatGPT:五年內(nèi)就沒(méi)人用了

馬斯克為了不再被ChatGPT白嫖,決定給 Twitter“上鎖”

ChatGPT涼了?6月訪問(wèn)量環(huán)比下滑近10%

OpenAI遭集體訴訟,明星大模型變“數(shù)據(jù)小偷”?

已經(jīng)有媒體開(kāi)始嚴(yán)肅討論:GPT,是吹起來(lái)的泡沫嗎?

01

之前看GPT-4像喬峰,武功蓋世。

現(xiàn)在看GPT-4像慕容復(fù),浪得虛名。

這似乎又是個(gè)“初看是王者,再看是青銅”的副本。

問(wèn)題來(lái)了:現(xiàn)有的大模型天花板GPT-4,已經(jīng)不香了嗎?

看上去,確實(shí)是這樣。

就在上個(gè)月,“GPT-4變笨”的話題,一度在國(guó)外技術(shù)社區(qū)內(nèi)引發(fā)熱議。

有用戶(hù)反饋,把GPT-4的3小時(shí)25條對(duì)話額度一口氣用完了,都沒(méi)能解決自己的代碼問(wèn)題,切換到ChatGPT基于的GPT-3.5版本,反倒把事情解決了。

他反饋的主要問(wèn)題包括:以前GPT-4能寫(xiě)對(duì)的代碼,現(xiàn)在滿(mǎn)是Bug;回答問(wèn)題的深度分析變少了,內(nèi)容質(zhì)量變差了。

這引起網(wǎng)友們的共鳴,“GPT-4開(kāi)倒車(chē)”的說(shuō)法由此興起。

不少網(wǎng)友都懷疑,GPT-4會(huì)像微軟必應(yīng)那樣,出道即巔峰,但后來(lái)慘遭“前額葉切除”。

深度學(xué)習(xí)框架Keras創(chuàng)始人、網(wǎng)紅科學(xué)家Fran?ois Chollet,為GPT-4“自干五”地洗道:

不是GPT的表現(xiàn)變差,而是大家渡過(guò)了最初的驚喜期,對(duì)它的期待變高了。

言下之意,是高期待值拉高了人們對(duì)GPT失誤的敏感度。

但OpenAI開(kāi)發(fā)者推廣大使Logan Kilpatrick,倒是挺會(huì)自我拆臺(tái)——

▲很顯然,OpenAI開(kāi)發(fā)者推廣大使是個(gè)耿直Boy。

網(wǎng)友問(wèn)他,GPT-4大模型本體自從3月14日發(fā)布以來(lái)都是靜態(tài)的,對(duì)吧?

他說(shuō),沒(méi)錯(cuò)。

網(wǎng)友又問(wèn)他,相同提示詞回答不一致,是因?yàn)榇竽P捅旧聿环€(wěn)定嗎?

他又回答,Yes。

02

GPT-4變“弱”了,國(guó)內(nèi)科技大佬的“大模型自信”也就變強(qiáng)了。

幾個(gè)月前,國(guó)內(nèi)外AI大模型存在代差,幾乎是共識(shí),歧異只在于差距到底有多大。

今年3月25日,周鴻祎曾表示,中國(guó)大語(yǔ)言模型和GPT-4差距在兩三年。

5月上旬,周鴻祎跟俞敏洪對(duì)談,談到ChatGPT問(wèn)題時(shí)說(shuō),“如果不經(jīng)過(guò)兩年的模仿和抄襲,上來(lái)就說(shuō)自己能超越,那才叫吹牛呢?!?/p>

幾天后,做客央視節(jié)目時(shí)又說(shuō):GPT-4有強(qiáng)大的思維鏈模型,能夠把一個(gè)事情做連續(xù)多步推理,能夠把一個(gè)目標(biāo)做多任務(wù)的分解和規(guī)劃。如果要跟這種能力去比,國(guó)內(nèi)大模型引擎跟它比都是六七十分的水平,差距可能是兩年,“如果有人說(shuō)差兩個(gè)月、差兩周我可能不太相信”。

華為原副總裁張俊對(duì)此大概頗為認(rèn)同,他5月下旬接受采訪時(shí)也說(shuō),國(guó)內(nèi)外AI大模型存在約兩年的代差。

而李彥宏被王小川懟,也是因?yàn)樗?月下旬接受專(zhuān)訪時(shí)提了一嘴“文心一言和 ChatGPT 的水平差了2個(gè)月,但可以追趕”。

在王小川看來(lái),這屬于自我吹噓,“怎么可能只差2個(gè)月?”“之前如果說(shuō)追上GPT-3.5用一年還是有可能的,但是目前OpenAI已經(jīng)訓(xùn)練到GPT-4的級(jí)別,GPT-5也在訓(xùn)練過(guò)程當(dāng)中,我們追上還需要三年。”

就連李彥宏之后都給自己找補(bǔ),說(shuō)自己是被斷章取義了。

彼時(shí)的共識(shí)就是:AI大模型的進(jìn)化是非線性的,其正向增強(qiáng)回路的特點(diǎn)會(huì)強(qiáng)化“強(qiáng)者愈強(qiáng)”的頭部效應(yīng),外加語(yǔ)料庫(kù)質(zhì)量差異,國(guó)內(nèi)外AI大模型可能會(huì)越拉越大。

但近段時(shí)間,某些大佬的口徑在變。

科大訊飛董事長(zhǎng)劉慶峰就很自信。在5月6日的訊飛星火認(rèn)知大模型發(fā)布會(huì)上,劉慶峰表示,當(dāng)前訊飛星火認(rèn)知大模型已經(jīng)在文本生成、知識(shí)問(wèn)答、數(shù)學(xué)能力三大能力上已超ChatGPT。

他還揚(yáng)言:10月24日,將實(shí)現(xiàn)通用模型對(duì)標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。

周鴻祎也不遑多讓?zhuān)?月8日,跟品玩創(chuàng)始人駱軼航對(duì)話時(shí),他說(shuō),最近幾個(gè)月國(guó)內(nèi)同行陸陸續(xù)續(xù)發(fā)布了自己的大模型,雖然客觀來(lái)講跟GPT4.0還有點(diǎn)差距,相比GPT3.5也有點(diǎn)差距,但差距沒(méi)有那么大。

在5天后的360智腦大模型發(fā)布會(huì)上,他更是表示,國(guó)內(nèi)大模型已基本趕上或接近國(guó)際先進(jìn)水平,之前曾說(shuō)和全球先進(jìn)的差距有一兩年,今天收回這句話。

中國(guó)工程院院士鄔賀銓在6月下旬接受采訪時(shí)也說(shuō),評(píng)價(jià)大模型水平應(yīng)該是多維度的,全面性、合理性、使用便捷性、響應(yīng)速度、成本、能效等,籠統(tǒng)地說(shuō)目前我國(guó)大模型開(kāi)發(fā)與國(guó)外的差距為1—2年的依據(jù)還不清楚,現(xiàn)在下這一結(jié)論意義也不大。

他還指出,按2022年年底的數(shù)據(jù),美國(guó)占全球算力36%,中國(guó)占31%,現(xiàn)有算力總規(guī)模與美國(guó)相比有差距但不大,而以GPU和NPU為主的智能算力規(guī)模中,中國(guó)明顯高于美國(guó)(按2021年年底數(shù)據(jù),美國(guó)智算規(guī)模占全球智算總規(guī)模15%,中國(guó)占26%)。

03

所以,GPT-4是被吹得太狠了嗎?

這兩天的兩則新聞,或許挺適合對(duì)此作答:

阿里達(dá)摩院多語(yǔ)言NLP團(tuán)隊(duì)日前發(fā)布了首個(gè)多語(yǔ)言多模態(tài)測(cè)試基準(zhǔn) M3Exam,共涵蓋 12317 道題目,結(jié)果顯示,多語(yǔ)言能力上,GPT-4是唯一一個(gè)可以超過(guò)60%準(zhǔn)確率的模型, 其他的均不及格。

麻省理工學(xué)院和微軟的學(xué)者近來(lái)的研究也發(fā)現(xiàn),GPT-4在自修復(fù)方面表現(xiàn)出了有效能力,GPT-3.5則沒(méi)有。在此之外,GPT-4還能夠?qū)PT-3.5生成的代碼提供反饋。

那為什么很多人感覺(jué)GPT-4能力退化了?

微軟研究院早前刷屏的那篇論文《AGI的火花:GPT-4早期試驗(yàn)》中的說(shuō)法,興許可資參考:

微軟方面獲得的GPT-4版本性能,要遠(yuǎn)強(qiáng)于目前的公測(cè)版本。公測(cè)版本變?nèi)?,是因?yàn)樗獙?duì)標(biāo)人類(lèi)的指令和價(jià)值觀。

說(shuō)大白話就是:OpenAI也怕出安全問(wèn)題,所以“寧可變慢一點(diǎn),也要安全一些”。

有人會(huì)說(shuō):不重要了,沒(méi)看到人家訪問(wèn)量正在下滑嗎?

訪問(wèn)量下滑,確實(shí)是不少人評(píng)價(jià)ChatGPT們“漲不動(dòng)了”“也不行了”的重要依據(jù)。

乍看起來(lái),這不乏數(shù)據(jù)支撐:多家數(shù)據(jù)分析網(wǎng)站指出,ChatGPT的訪問(wèn)量環(huán)比增長(zhǎng)率已從1月份的131.6%、2月份的62.5%、3月份的55.8%、4月份的12.6%,跌到了5月份的2.8%,6月份或環(huán)比下降。

 

▲統(tǒng)計(jì)顯示,ChatGPT的訪問(wèn)量增速出現(xiàn)回落態(tài)勢(shì)。

OpenAI麾下的ChatGPT和GPT-4告別流量高增長(zhǎng)時(shí)代,大概率是事實(shí)。

但別忘了幾點(diǎn)潛在背景:

1,OpenAI未必在乎C端用戶(hù)直接訪問(wèn)官網(wǎng)的流量,因?yàn)樗幌窀鶥端客戶(hù)搶用戶(hù)。

OpenAI的CEO阿爾特曼就曾表示,ChatGPT未來(lái)的核心戰(zhàn)略使命,是吸引更多的企業(yè)應(yīng)用程序接入API,而非在C端,與自己的企業(yè)客戶(hù)爭(zhēng)奪流量。

OpenAI從3月初開(kāi)始,就在降價(jià)token的費(fèi)用,借此鼓勵(lì)更多第三方開(kāi)發(fā)者(很多都是B端客戶(hù))使用ChatGPT和Whisper工具,通過(guò)API接口整合接入他們的服務(wù)。

現(xiàn)實(shí)中,很多人訪問(wèn)的都是那些應(yīng)用插件,而不是OpenAI官網(wǎng)。這難免對(duì)ChatGPT和GPT-4造成分流,但那些統(tǒng)計(jì)工具并未顧及這層因素。

2,4月初ChatGPT曾出現(xiàn)大面積封號(hào),主要針對(duì)“特制工具”批量注冊(cè)的黑賬號(hào)。

來(lái)自東方的神秘力量們憑著VPN和黑科技貢獻(xiàn)的流量,就被切掉了。

所以,你說(shuō)它的流量下滑沒(méi)毛病,但這未必是OpenAI最在意的。

04

不論是GPT-4貌似沒(méi)那么“靈”了,還是ChatGPT和GPT-4訪問(wèn)量下滑了,都指向了一點(diǎn):

大模型的正確打開(kāi)方式,與其說(shuō)是做流量入口,不如說(shuō)是深入行業(yè)場(chǎng)景,做行業(yè)數(shù)字化的AI底座。

從網(wǎng)絡(luò)反饋看,反映GPT-4變笨了的,主要都是些細(xì)分行業(yè)從業(yè)者。他們想要的業(yè)務(wù)知識(shí),確實(shí)是那些基礎(chǔ)性、普適型的公用大模型給不了的。

OpenAI要把自身從C端爆火的超級(jí)AI應(yīng)用,變成并不性感的API接口服務(wù)平臺(tái),說(shuō)白了,就是想將價(jià)值做深,而不是只賺流量錢(qián)。

為什么阿里云的通義千問(wèn)今年4月發(fā)布后,想要通過(guò)“伙伴計(jì)劃”撬動(dòng)更多企業(yè)在再訓(xùn)練和精調(diào)基礎(chǔ)上打造企業(yè)的專(zhuān)屬大模型?

為什么周鴻祎說(shuō)“公有大模型在落地政府、城市、行業(yè)和企業(yè)場(chǎng)景時(shí)并不能直接使用,存在著缺乏行業(yè)深度、易帶來(lái)數(shù)據(jù)安全隱患、無(wú)法保障內(nèi)容真正可信及無(wú)法實(shí)現(xiàn)成本可控四大痛點(diǎn)”,企業(yè)級(jí)垂直大模型才是未來(lái)?

為什么騰訊云6月19日不是直接發(fā)布基礎(chǔ)的通用大模型,而是發(fā)布面向 B 端客戶(hù)的 MaaS(模型即服務(wù))服務(wù)解決方案,幫金融、政府、文旅、傳媒、教育等行業(yè)打造契合自身業(yè)務(wù)需要的“專(zhuān)屬模型”?

原因就在于:AI大模型是工業(yè)革命級(jí)的生產(chǎn)力工具,最終得服務(wù)于生產(chǎn)效率提升,是以還得將B端作為切入口。

唯有如此,才能在AI時(shí)代“把所有行業(yè)重做一遍”。

前些天,傅盛PK朱嘯虎,圍繞ChatGPT激辯,核心也在于類(lèi)ChatGPT產(chǎn)品的價(jià)值點(diǎn)開(kāi)掘上。

▲傅盛跟朱嘯虎前不久在朋友圈激辯大模型創(chuàng)業(yè)。

作為創(chuàng)投圈話題人物的朱嘯虎,認(rèn)為ChatGPT對(duì)創(chuàng)業(yè)者不友好,只有大廠商才玩得轉(zhuǎn)大模型,大模型都是在大模型上做應(yīng)用又沒(méi)什么價(jià)值,完全沒(méi)有BAT級(jí)機(jī)會(huì)。

曾跟周鴻祎、雷軍、馬化騰、馬云等一眾大佬相愛(ài)相殺的獵豹?jiǎng)?chuàng)始人傅盛,則認(rèn)為大模型催生了很多新的架構(gòu)在大模型之上的創(chuàng)業(yè)機(jī)會(huì),包括直接在大模型上搭建的不同應(yīng)用和由于數(shù)據(jù)私有帶來(lái)的垂直領(lǐng)域大模型等。

可以這么理解:朱嘯虎認(rèn)為,創(chuàng)業(yè)公司們很難復(fù)制OpenAI,壓根就沒(méi)做通用AI時(shí)代的Windows或安卓系統(tǒng)的機(jī)會(huì)。

傅盛則不以為然,認(rèn)為做AI時(shí)代的美團(tuán)滴滴也挺好——美團(tuán)滴滴們不就是靠拿捏住落地場(chǎng)景做大的嗎?

05

說(shuō)回GPT-4,再怎么說(shuō)它變?nèi)趿耍琅f是霸榜級(jí)別的存在。

打個(gè)不甚恰當(dāng)?shù)谋确?,GPT-4就是大模型版NBA里巔峰期還沒(méi)過(guò)去的詹姆斯,它身后的Bard、LLaMA、文心一言、通義千問(wèn)等,就相當(dāng)于字母哥、杜蘭特、庫(kù)里、約基奇,仍在追趕。

詹姆斯未必是“永遠(yuǎn)的神”(華語(yǔ)樂(lè)壇這么多年了“永遠(yuǎn)的神”也只有華晨宇一個(gè)),但在其鼎盛期,他的實(shí)力是獨(dú)一檔。

至于OpenAI的GPT以后會(huì)不會(huì)走下坡路,就難以料定了。

就目前看,中國(guó)大模型的追趕之路仍然道阻且長(zhǎng)。

特別是考慮到美國(guó)預(yù)計(jì)7月份針對(duì)對(duì)華芯片出口實(shí)施新管制,連英偉達(dá)為中國(guó)特供的A100平替版GPU芯片A800都要禁,加速追趕正迎來(lái)更多高難度挑戰(zhàn)。

但不能說(shuō)中國(guó)大模型就沒(méi)機(jī)會(huì)。中國(guó)互聯(lián)網(wǎng)過(guò)去20年能彎道超車(chē),成為全球Top2的玩家,超大市場(chǎng)提供的海量應(yīng)用場(chǎng)景就是個(gè)重要因素。

中國(guó)消費(fèi)互聯(lián)網(wǎng)規(guī)模能做成全球第一,就得益于互聯(lián)網(wǎng)平臺(tái)們抓住了應(yīng)用場(chǎng)景里蘊(yùn)藏的機(jī)會(huì),進(jìn)而不斷做大。

到了大模型時(shí)代,國(guó)產(chǎn)大模型很難再做出ChatGPT那種一問(wèn)世就舉世矚目的大模型產(chǎn)品了,畢竟喝頭啖湯有身位優(yōu)勢(shì)。

可它們能不能立足于應(yīng)用場(chǎng)景,在助益實(shí)體產(chǎn)業(yè)中發(fā)掘出更多“平臺(tái)級(jí)”機(jī)會(huì)來(lái),還挺值得觀察。

能,就會(huì)得到市場(chǎng)的犒賞。

說(shuō)到底,GPT-4有沒(méi)有從北喬峰變南慕容,固然挺有說(shuō)頭。

但反求諸己,更重要的,還是練好“適合自身體質(zhì)”的武功秘笈。

不然的話,連進(jìn)AI江湖“五絕”的機(jī)會(huì)都沒(méi)。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。