文|新莓daybreak 史圣園
ChatGPT 點(diǎn)燃了全球?qū)ξ磥?lái)的想象,還讓沉寂已久的退休大佬決定重出江湖。是的,就是這兩天被刷屏的王慧文。
這位曾經(jīng)美團(tuán)的核心人物,在社交媒體公開(kāi)發(fā)表宣言。從最初的「必須參與」,到5000萬(wàn)美元帶資入組,不在意崗位、薪資和title,求組隊(duì)。第三天干脆宣布創(chuàng)建一個(gè)「全新生命體」,發(fā)出AI英雄榜,招募頂級(jí)人才。
這是ChatGPT傳入中國(guó)后,最高調(diào)的起步公司。它面臨的對(duì)手是那些國(guó)內(nèi)外科技巨頭。
微軟推出基于 ChatGPT 的 New Bing 一天后,谷歌匆忙搬出 Bard 應(yīng)戰(zhàn)。雖然發(fā)布會(huì)的演示尷尬出錯(cuò),市值一夜蒸發(fā)超過(guò) 7000 億元,但微軟和谷歌被認(rèn)為是最有可能將ChatGPT大放光彩的公司。
國(guó)內(nèi)公司也紛紛表態(tài),百度、阿里、騰訊等大廠均表示自己在相關(guān)方向上有所布局。
百度三月即將上線「文心一言」,并接入百度搜索;阿里達(dá)摩院正在研發(fā)對(duì)話機(jī)器人,并計(jì)劃與釘釘?shù)壬a(chǎn)力工具深度結(jié)合;騰訊雖未透露出具體的應(yīng)用計(jì)劃,但也底氣十足地表示,自己在大模型(LLM)、機(jī)器學(xué)習(xí)(ML)和自然語(yǔ)言處理(NLP)等領(lǐng)域有著技術(shù)儲(chǔ)備,進(jìn)行應(yīng)用探索。
總之,全網(wǎng)都是ChatGPT,被討論,被神話,被人窮盡溢美之詞,被視為是新一輪工業(yè)革命。但也有人發(fā)出警醒,ChatGPT也在被誤解。
大力出奇跡
「我相信大廠聲稱自己正在布局 ChatGPT ,除了有保住股價(jià)的考慮,肯定也有了解這些前沿技術(shù)的團(tuán)隊(duì)。但是懂得大致的技術(shù)框架,和真正做出來(lái)跟 ChatGPT 效果一樣好的東西,是兩件事情?!挂晃?AI 公司的技術(shù)合伙人說(shuō)。
OpenAI 對(duì)外發(fā)布了許多 ChatGPT 相關(guān)的研究性論文,講述大致的思路,但不會(huì)透露技術(shù)細(xì)節(jié)。上述合伙人提醒,「其他公司想要復(fù)刻,還是需要自己摸索。而一旦涉及到技術(shù)細(xì)節(jié)的摸索,就要有特別大的投入。」
他認(rèn)為,OpenAI 的偉大之處在于,在結(jié)果未知的情況下,就敢于下注?!敢话愎緸榱嘶钕氯?,不得不去考慮投入產(chǎn)出比。」模型的參數(shù)越多,意味著訓(xùn)練、調(diào)試時(shí)間的成倍增加。時(shí)間的翻倍,意味著硬件成本、人力成本的翻倍。
據(jù)《財(cái)富》雜志報(bào)道,2022年,OpenAI公司的收入預(yù)計(jì)不足3000萬(wàn)美元,凈虧損5.45億美元。而隨著ChatGPT的火爆,可能進(jìn)一步增加虧損,因?yàn)橛脩裘恳淮握{(diào)用,就會(huì)讓OpenAI付出更多的計(jì)算資源和帶寬成本。
本質(zhì)上,ChatGPT 是一個(gè)表現(xiàn)令人驚艷的統(tǒng)計(jì)語(yǔ)言模型。
它的原理是,不斷將前文的文本片段作為條件,預(yù)測(cè)下一個(gè)詞語(yǔ)出現(xiàn)的概率,選中概率較高的單詞,從而生成通順的語(yǔ)句和段落。
ChatGPT 的技術(shù)——GPT 3.5,是由 Transformer 的技術(shù)線發(fā)展而來(lái)的。而 Transformer 的第一篇研究文章,其實(shí)是由谷歌發(fā)布的。
2017 年 6 月,谷歌發(fā)布論文《Attention is all you need》,推出能調(diào)用 6500萬(wàn)參數(shù)的 Transformer 模型,并首次將其用于理解人類語(yǔ)言;2018 年,谷歌又推出了 3億參數(shù)的 BERT 模型。
只不過(guò)谷歌走得并不堅(jiān)定,精力遠(yuǎn)比OpenAI分散。
OpenAI 在擴(kuò)大模型的道路上一路狂奔。GPT-3 模型有 1750 億個(gè)參數(shù),訓(xùn)練的數(shù)據(jù)量高達(dá) 5000 億個(gè) token(約合 3000 億個(gè)詞)。
谷歌則在多種技術(shù)路線間搖擺不定,萬(wàn)億參數(shù)的Switch Transformer并沒(méi)有得到持續(xù)投入;Flan-T5模型一度有著勝過(guò)GPT-3的表現(xiàn),但由于優(yōu)化進(jìn)度緩慢,還是由OpenAI先做出了ChatGPT這款產(chǎn)品,將大語(yǔ)言模型的神奇能力展現(xiàn)在我們面前。
北京智源人工智能研究院理事張宏江進(jìn)一步解釋,1750億參數(shù)量,約有700G大小,一次訓(xùn)練成本大致花1200萬(wàn)美金。所以,大模型的發(fā)展不光是算法上的進(jìn)步,在數(shù)據(jù)、算力上的要求也非常巨大。
這是一個(gè)「大力出奇跡」的故事。AI 模型的訓(xùn)練,并不是「一份耕耘,一份收獲」的線性邏輯。
學(xué)術(shù)界有一個(gè)術(shù)語(yǔ),叫做「涌現(xiàn)」(emergence),參數(shù)到了一定的程度,模型效果會(huì)迎來(lái)質(zhì)的飛躍。但這個(gè)程度,究竟是10億、100億、1000億,在實(shí)踐之前都無(wú)從得知。對(duì)于 GPT 來(lái)說(shuō),「參數(shù)越多,效果越好」只是個(gè)「后驗(yàn)性」的結(jié)論。
OpenAI 的孤注一擲,等來(lái)了它的「涌現(xiàn)」;而谷歌的多線并行,卻也是當(dāng)時(shí)的「局部最優(yōu)解」。
在大語(yǔ)言模型的訓(xùn)練上,「沒(méi)有人比其他人領(lǐng)先超過(guò)兩到六個(gè)月?!构雀柙谙嚓P(guān)研究領(lǐng)域碩果累累,并未落后于 OpenAI 半個(gè)身位,但精力分散拖累了它將學(xué)術(shù)成果落實(shí)為具體應(yīng)用的步伐。
應(yīng)用會(huì)更容易嗎?
盡管ChatGPT技術(shù)內(nèi)核的突破有非常高的門檻,但是OpenAI的大模型對(duì)產(chǎn)業(yè)的影響是絕對(duì)深遠(yuǎn)的。
張宏江將其形容為,是從小農(nóng)經(jīng)濟(jì)到大規(guī)模生產(chǎn)的一個(gè)很重要的變化,就像當(dāng)初電網(wǎng)的變革一樣,此前自己發(fā)電,而今天要用 AI,不需要再做模型,而是用已有的大模型,以一種服務(wù)方式提供給用戶。
ChatGPT 超過(guò)Tiktok,成為迄今為止用戶最快破億的應(yīng)用。積累 1 億用戶,ChatGPT 用了兩個(gè)月, Tiktok用了九個(gè)月,而 Instagram 則用了兩年多。
OpenAI 的首席執(zhí)行官 Sam Altman 曾在推特上表示,用戶與 ChatGPT 每次交互的計(jì)算成本為「?jìng)€(gè)位數(shù)美分」。隨著用戶破億,其每月計(jì)算成本高達(dá)數(shù)百萬(wàn)美元。
基于此,OpenAI 開(kāi)啟了新一輪融資,也在探索如何直接用 ChatGPT 變現(xiàn)。
2月1日,OpenAI 正式官宣 ChatGPT Plus —— ChatGPT 的個(gè)人付費(fèi)訂閱服務(wù)。用戶支付 20$/月的費(fèi)用,即可享受高峰時(shí)段的優(yōu)先訪問(wèn)、更快的響應(yīng)時(shí)間,還能優(yōu)先嘗鮮新功能。
OpenAI 官宣ChatGPT Plus
to C 的付費(fèi)制還在試點(diǎn)和探索階段,to B 的付費(fèi) API 調(diào)用則是 OpenAI 現(xiàn)階段的主要收入來(lái)源。
2021 年底,OpenAI 對(duì)公眾開(kāi)放了 GPT-3 的 API 接口,開(kāi)發(fā)者和相關(guān)公司可付費(fèi)調(diào)用,實(shí)現(xiàn)自然語(yǔ)言理解和生成的任務(wù)。除此之外,OpenAI 還開(kāi)放了 Codex、DALL·E 的 API 接口,分別完成自然語(yǔ)言轉(zhuǎn)代碼、自然語(yǔ)言轉(zhuǎn)圖像的任務(wù)。路透社的數(shù)據(jù)顯示,OpenAI 2022 年收入達(dá)數(shù)千萬(wàn)美元,2023 與 2024 的預(yù)計(jì)年收入分別為 2 億美元和 10 億美元。
OpenAI API 調(diào)用價(jià)格
一個(gè)大模型,即使像 ChatGPT 一般有驚艷的表現(xiàn)、足夠的通用性,也無(wú)法用來(lái)解決所有問(wèn)題。從新技術(shù)的誕生,到可用的行業(yè)產(chǎn)品,再到后續(xù)的運(yùn)營(yíng)和用戶服務(wù),還需要很多下游應(yīng)用企業(yè)結(jié)合行業(yè)場(chǎng)景來(lái)進(jìn)行微調(diào)和開(kāi)發(fā),形成「整體產(chǎn)品」方案。
Jasper 就是這樣一家基于 GPT-3 API 的生成式 AI 公司,提供電商、廣告、博客等場(chǎng)景下?tīng)I(yíng)銷文案、種草文案的自動(dòng)生成服務(wù),以及后續(xù)的搜索引擎優(yōu)化工具。2022年,Jasper 募資 1.25 億美元,估值達(dá) 15 億美元。
再比如 Notion,接入 GPT-3 API 后,在文檔工具中實(shí)現(xiàn)了自動(dòng)續(xù)寫、翻譯、語(yǔ)法檢查等功能。
即便是基于垂直行業(yè)的語(yǔ)料庫(kù)對(duì)模型進(jìn)行微調(diào),也需要不小的研發(fā)成本:GPT-3 的每一次升級(jí)和迭代,這些下游企業(yè)也要跟進(jìn)調(diào)整,需要一定的財(cái)力支撐。
國(guó)內(nèi)關(guān)于ChatGPT概念的不少公司也拿到投資,而且類似文本生成、圖像生成、音頻生成、視頻生成、虛擬人、元宇宙等場(chǎng)景在中國(guó)的落地能力,也許會(huì)跟海外同步,甚至更快。
不過(guò),目前的大模型,更多偏向于單點(diǎn)式的應(yīng)用,優(yōu)化生產(chǎn)環(huán)節(jié)中的某一個(gè)小問(wèn)題,并未帶動(dòng)整個(gè)工作流的革新。
第一次工業(yè)革命,蒸汽機(jī)實(shí)現(xiàn)了機(jī)器替代人工;第二次工業(yè)革命,電力技術(shù)驅(qū)動(dòng)了規(guī)模化生產(chǎn)。之所以能夠被稱之為「工業(yè)革命」,都是因?yàn)榧夹g(shù)為生產(chǎn)力帶來(lái)了質(zhì)的提升。目前來(lái)看, AI 原生產(chǎn)品還沒(méi)有能夠大范圍囊括某一領(lǐng)域的工作流,并且提供完整解決方案。
沖擊會(huì)抵達(dá)哪里?
如同過(guò)去所有新的生產(chǎn)力工具一樣,ChatGPT 問(wèn)世以來(lái),關(guān)于它會(huì)沖擊哪些行業(yè)的討論不絕于耳。
作為當(dāng)今最為先進(jìn)「統(tǒng)計(jì)語(yǔ)言模型」,ChatGPT 在問(wèn)答和對(duì)話上的表現(xiàn)出色。它能夠模仿人類的交互方式,提供和整合信息,從而輔助創(chuàng)意和決策。
ChatGPT 有效縮短了「信息→決策」的路徑,受到其影響最大的,是與「滿足信息需求」有關(guān)的生意,尤其是幫助「人找信息」的生意。
其中無(wú)法回避的,首當(dāng)其沖就是搜索引擎。因?yàn)楹芏嗳苏J(rèn)定,基于ChatGPT有可能誕生出比 Google 更出色的搜索引擎。
ChatGPT已經(jīng)明確回答,它不會(huì)替代搜索引擎。實(shí)際上,比起功能替代,未來(lái)的信息搜索應(yīng)當(dāng)是兩者的結(jié)合。
ChatGPT 的優(yōu)勢(shì)在于,它可以綜合生成更為完整、拿來(lái)即用的答案,還可以通過(guò)多輪對(duì)話回答后續(xù)問(wèn)題,但我們無(wú)法忽視它的硬傷——真實(shí)性和邏輯性問(wèn)題。
首先,ChatGPT生成的答案中難以避免地出現(xiàn)事實(shí)性錯(cuò)誤。按照既定的語(yǔ)言模型和規(guī)則,ChatGPT 可以生成相應(yīng)的文本,卻無(wú)法自查自糾;且生成的序列越長(zhǎng),出現(xiàn)錯(cuò)誤引用的概率也會(huì)隨之增加。這也就是為什么谷歌 Bard 言之鑿鑿地說(shuō)詹姆斯·韋布空間望遠(yuǎn)鏡拍攝了太陽(yáng)系以外的行星的第一批照片(實(shí)際并非如此),微軟 New Bing 進(jìn)行 GAP 的財(cái)報(bào)分析時(shí)引用了許多錯(cuò)誤數(shù)據(jù)。
其次,ChatGPT 雖然很少在語(yǔ)法上犯錯(cuò),但它在推理(reasoning)任務(wù)上的表現(xiàn)不夠令人滿意,頗有種「數(shù)學(xué)是語(yǔ)文老師教的」感覺(jué)。至少在目前,我們無(wú)法指望它能夠通曉邏輯、厘清事實(shí)。而它通過(guò)對(duì)話喂給我們的唯一答案,也限制了我們從多處來(lái)源交叉驗(yàn)證信息的能力。
朱嘯虎就提出警醒,ChatGPT最大的風(fēng)險(xiǎn)是在網(wǎng)上創(chuàng)造出巨量的似是而非的內(nèi)容,那以后就不僅僅是「物理學(xué)不存在了」,如何判斷信息的真實(shí)性越來(lái)越難,熵爆炸式增長(zhǎng)。
實(shí)際上,較為理想的產(chǎn)品形態(tài)是,由 ChatGPT 精選優(yōu)質(zhì)信源,拼接為完整答案,并給出引用來(lái)源供我們核實(shí)?;蛘咴谒阉鹘Y(jié)果頁(yè)面的基礎(chǔ)上,由ChatGPT來(lái)總結(jié)要點(diǎn)。
除了微軟Bing外,初創(chuàng)公司 Perplexity 也嘗試結(jié)合 ChatGPT 和搜索引擎,做出更智能的信息搜索工具。
Perplexity 的結(jié)果展示,包括三個(gè)部分:Perplexity(生成的直接答案)、Sources(引用來(lái)源)、Related(相關(guān)問(wèn)題)。你還可以在前文的基礎(chǔ)上進(jìn)行追問(wèn),獲得更聚焦的信息增量。
Perplexity產(chǎn)品界面
此類信息搜索產(chǎn)品,若想提供好的使用體驗(yàn),也需要ChatGPT在未來(lái)能夠做到「知之為知之,不知為不知」。否則,甄別錯(cuò)誤信息的成本將是巨大的,在關(guān)鍵任務(wù)中造成的風(fēng)險(xiǎn)也難以估量。
目前,學(xué)者們正在琢磨著怎么給 ChatGPT 打上「知識(shí)補(bǔ)丁」(Knowledge Patch)。比如問(wèn)到它拿不準(zhǔn)的問(wèn)題時(shí),它能夠輸出「抱歉,我不了解」這樣謙虛而自知的回答,而不是言之鑿鑿地胡編亂造。
「所有的行業(yè)都值得用AI重做一遍」,技術(shù)的進(jìn)步會(huì)帶來(lái)新的生產(chǎn)力工具,也會(huì)帶來(lái)新的問(wèn)題。ChatGPT 讓我們獲取信息變得更容易,同時(shí)對(duì)我們的判斷力提出了更高的要求??陀^、理性、全面地分析信息,還是只能靠我們自己。