正在閱讀:

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

掃一掃下載界面新聞APP

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

怎么書(shū)寫(xiě)ChatGPT的中國(guó)故事?

文|伯虎財(cái)經(jīng) 陳平安

如果非要用一個(gè)詞來(lái)形容ChatGPT最近的熱度,那我只能稱(chēng)之為“絕殺”。

已經(jīng)很久沒(méi)有一個(gè)科技圈的熱點(diǎn)能夠承包全網(wǎng)小編2周的KPI。從北京中關(guān)村到加州硅谷,從創(chuàng)投大佬到普通學(xué)生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。

這么些年來(lái),和AI相關(guān)的熱點(diǎn)不是沒(méi)有,比如之前阿爾法狗和自動(dòng)駕駛。熱度來(lái)的快去的也快,阿爾法狗幾乎已經(jīng)無(wú)人提及,自動(dòng)駕駛遭遇寒冬,企業(yè)集體降維求生。

但這次是真不一樣。ChatGPT顛覆了大眾對(duì)于A(yíng)I的認(rèn)知,真正把通用模型擺到了普通用戶(hù)的面前,不僅能幫你寫(xiě)材料,敲代碼,還能通過(guò)選拔性考試的測(cè)驗(yàn),美國(guó)賓夕法尼亞大學(xué)稱(chēng),ChatGPT能夠通過(guò)該校工商管理碩士MBA課程的期末考試。

ChatGPT的強(qiáng)大甚至還讓國(guó)際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。

業(yè)界大佬們也紛紛出來(lái)為它站臺(tái)。馬斯克和比爾蓋茨曾經(jīng)堅(jiān)定的相信“AI威脅論”,為了預(yù)防人工智能帶來(lái)的災(zāi)難性影響,推動(dòng)人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營(yíng)利機(jī)構(gòu),OpenAI。(是的,就是ChatGPT的研發(fā)公司)

現(xiàn)在這兩人,一個(gè)稱(chēng)贊“ChatGPT好嚇人,我們離強(qiáng)大到危險(xiǎn)的人工智慧不遠(yuǎn)了”,一個(gè)甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。

更為不同尋常的是大廠(chǎng)們的動(dòng)作。面對(duì)ChatGPT,大廠(chǎng)們的反應(yīng)強(qiáng)烈,谷歌冒著翻車(chē)的危險(xiǎn)也要強(qiáng)行上線(xiàn)內(nèi)測(cè)產(chǎn)品,國(guó)內(nèi)包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關(guān)的研發(fā)上線(xiàn)時(shí)間表。

小公司為提振股價(jià)強(qiáng)行蹭熱度還可以理解,業(yè)務(wù)穩(wěn)定的大公司為何非要冒這個(gè)風(fēng)險(xiǎn)呢?

01 AI不會(huì)取代你,一個(gè)使用AI的人會(huì)取代你

要理解ChatGPT的革命性,不如先從搜索聊起。

90后以前的互聯(lián)網(wǎng)用戶(hù)們應(yīng)該都知道,國(guó)內(nèi)的中文信息服務(wù)大致經(jīng)歷了三個(gè)階段。

第一個(gè)階段是導(dǎo)航網(wǎng)站和門(mén)戶(hù)網(wǎng)站階段,尋找信息要經(jīng)由導(dǎo)航網(wǎng)站。

第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶(hù)的開(kāi)放性問(wèn)題被轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性?xún)?yōu)先級(jí)的、一個(gè)更具體的選項(xiàng)擴(kuò)列,人們可以通過(guò)搜索來(lái)獲得自己想要的信息。

第三階段是移動(dòng)互聯(lián)網(wǎng)階段。智能手機(jī)的普及和字節(jié)的推薦算法讓那些你想要的信息自動(dòng)被推送到你的面前。

不難看出,每一個(gè)階段的更迭都伴隨著效率的提升。如果把以上三個(gè)階段的效率分別比作步行,馬車(chē)和汽車(chē),那么ChatGPT則更像是“導(dǎo)彈”。

這也就難怪谷歌CEO皮柴會(huì)如此火急火燎的在官網(wǎng)上宣布上馬類(lèi)ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對(duì)話(huà)AI服務(wù)Bard,即便這款產(chǎn)品在內(nèi)部算不上準(zhǔn)備充足。

因?yàn)榧叶伎毂煌盗恕?/p>

但ChatGPT,或者說(shuō)將其包含在內(nèi)的AIGC展現(xiàn)的潛力,遠(yuǎn)不止搜索這一個(gè)領(lǐng)域。

比如今年2月8日,微軟就推出了由 ChatGPT 提供技術(shù)支持的高級(jí) Teams 產(chǎn)品, 不僅可以自動(dòng)幫助參會(huì)者生成會(huì)議記錄,即使沒(méi)有參加會(huì)議,智能回顧功能也能幫助用戶(hù)生成會(huì)議記錄和要點(diǎn)。

由ChatGPT中分拆而出的CodeX則成為了自動(dòng)補(bǔ)齊代碼應(yīng)用 Copilot 的基礎(chǔ),這款旨在輔助程序員寫(xiě)代碼的應(yīng)用從去年 8 月開(kāi)始收費(fèi),每月 10 美元。

至于實(shí)際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。

游戲產(chǎn)業(yè)同樣面臨著來(lái)自ChatGPT的挑戰(zhàn)。國(guó)外開(kāi)發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開(kāi)發(fā)了一個(gè)實(shí)驗(yàn)性Mod,在ChatGPT的幫助下,原本相對(duì)呆板的NPC變得靈動(dòng)起來(lái),不再只能重復(fù)幾句固定的臺(tái)詞。

此前社交媒體上討論火熱的AI繪畫(huà)同樣如此。去年8月,游戲設(shè)計(jì)師Jason Allen通過(guò)AI繪圖工具M(jìn)idjourney生成原畫(huà),再經(jīng)過(guò)Photoshop潤(rùn)色而完成的作品《太空歌劇院》在科羅拉多州博覽會(huì)上獲得了數(shù)字類(lèi)別的一等獎(jiǎng)。雖然AI繪畫(huà)的能力并不能和資深的人類(lèi)畫(huà)師媲美,但無(wú)疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報(bào)道,有業(yè)內(nèi)人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分。”

根據(jù)騰訊研究院《AIGC發(fā)展趨勢(shì)2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務(wù)的未來(lái),其中包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場(chǎng)景化、個(gè)性化模型為主的中間層;和以圖像、語(yǔ)音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

這意味著ChatGPT這樣的產(chǎn)品或?qū)⒅饾u成為一種類(lèi)似基礎(chǔ)設(shè)施的存在,一如pc和手機(jī)。

當(dāng)下,已經(jīng)有許多公司開(kāi)始利用 GPT-3 系列模型做應(yīng)用端的開(kāi)發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計(jì),現(xiàn)在已經(jīng)有了 628 個(gè)調(diào)用 GPT-3 系列模型開(kāi)發(fā)的應(yīng)用程序。背靠 GPT-3 模型的寫(xiě)作輔助工具 Jasper,成立 18 個(gè)月估值達(dá) 15 億美元。

簡(jiǎn)而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預(yù)見(jiàn)的,可以提升整個(gè)社會(huì)生產(chǎn)效率的可落地工具,就像蒸汽機(jī)解放雙手,汽車(chē)解放雙腿那樣。在這樣的大前提下,移動(dòng)互聯(lián)網(wǎng)時(shí)期字節(jié)超車(chē)百度的事件可能會(huì)再次重演。

ChatGPT 在 LinkedIn 分享的一篇,原本針對(duì)“ChatGPT會(huì)不會(huì)讓我失業(yè)”的帖子或許也適合回答開(kāi)頭末尾的那個(gè)問(wèn)題:“AI 不會(huì)取代你。一個(gè)使用 AI 的人將取代你”。

02 大廠(chǎng)的游戲

ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個(gè)游戲的玩家寥寥無(wú)幾。這點(diǎn)從OpenAI的發(fā)展歷程就能看出。

OpenAI 在2015年末成立時(shí)是一家非營(yíng)利性機(jī)構(gòu),創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見(jiàn)肘。

這和2018年以后,OpenAI堅(jiān)持大模型訓(xùn)練有關(guān)。2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯?duì)于硬件的要求較低,同時(shí)和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對(duì)通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對(duì)特定領(lǐng)域或者場(chǎng)景去進(jìn)行定制。

在這個(gè)背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個(gè)場(chǎng)景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開(kāi)發(fā)的特點(diǎn)。簡(jiǎn)單來(lái)說(shuō),就是大模型更加“通用”。

2019年,OpenAI推出了大型語(yǔ)言模型GPT-2,參數(shù)超過(guò)15億,是上一代語(yǔ)言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達(dá)到1750億。大模型的訓(xùn)練讓自然語(yǔ)言模型取得了突破性的進(jìn)展,GPT-2已經(jīng)能根據(jù)用戶(hù)輸入的文字生成看上去邏輯正常的文字。

但大模型太花錢(qián)了。布羅克曼等人測(cè)算,訓(xùn)練大模型消耗的計(jì)算量,每 3、4 個(gè)月會(huì)翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓(xùn)練 GPT-3 一年,僅算力成本就有 2000 萬(wàn)美元。

由于研發(fā)所需資金太大,OpenAI 在2019年轉(zhuǎn)變?yōu)橛舷扌徒M織,和微軟達(dá)成了資本掙到有限收益之后,后續(xù)收益歸非盈利實(shí)體。截至目前,微軟對(duì)OpenAI最新一輪投資額達(dá)100億美元。

無(wú)論是訓(xùn)練模型所需的龐大數(shù)據(jù)和算力,還是參與開(kāi)發(fā)的頂級(jí)人工智能科學(xué)家,亦或是推廣和普及所需的生態(tài)支持,都足見(jiàn)產(chǎn)業(yè)的門(mén)檻之高,國(guó)內(nèi)也只有互聯(lián)網(wǎng)巨頭們有這個(gè)數(shù)據(jù)優(yōu)勢(shì)和資金積累。

這也是為什么日前原美團(tuán)聯(lián)合創(chuàng)始人王慧文在社交平臺(tái)官宣出資5000萬(wàn)美元,要打造中國(guó)的OpenAI,卻被網(wǎng)友質(zhì)疑“5000萬(wàn)美元夠干什么?”的原因。

基于數(shù)據(jù)安全和應(yīng)用效果的考慮,國(guó)內(nèi)需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠(chǎng)們需要擔(dān)負(fù)起這個(gè)責(zé)任。

03 誰(shuí)能率先突圍?

ChatGPT的爆火也讓很多國(guó)內(nèi)媒體開(kāi)始反思,為什么中國(guó)的科技環(huán)境無(wú)法誕生這種創(chuàng)新?對(duì)于這類(lèi)看法,伯虎財(cái)經(jīng)認(rèn)為,對(duì)國(guó)內(nèi)AI產(chǎn)業(yè)的看法不應(yīng)如此悲觀(guān)。

首先需要承認(rèn)的是,在ChatGPT上,國(guó)內(nèi)確實(shí)存在一定差距,普遍的看法認(rèn)為這種技術(shù)上的差距在2年左右。

同時(shí)大模型在某種意義代表著一種暴力美學(xué),訓(xùn)練大模型需要空前的語(yǔ)料數(shù)據(jù)。相對(duì)于英語(yǔ)語(yǔ)境,中文互聯(lián)網(wǎng)在表達(dá)習(xí)慣上會(huì)缺乏嚴(yán)謹(jǐn),比如讓許多中年人頭疼的拼音簡(jiǎn)寫(xiě),YYDS。這類(lèi)表達(dá)必然會(huì)影響AI訓(xùn)練的效果和效率。這也是為什么ChatGPT爆火后,內(nèi)容質(zhì)量相對(duì)較高的知乎會(huì)迎來(lái)一波股價(jià)暴漲。

不過(guò)我們也要看到國(guó)內(nèi)AI產(chǎn)業(yè)也有足夠的底氣。

大模型的訓(xùn)練離不開(kāi)算法、算力和數(shù)據(jù)。算法決定了其本身的學(xué)習(xí)能力,算力則影響著算法的學(xué)習(xí)效率,數(shù)據(jù)決定了AI的訓(xùn)練效果。

國(guó)內(nèi)擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶(hù),在數(shù)據(jù)積累方面有一定優(yōu)勢(shì)。而根據(jù)《2021―2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,在算力上中美大致處于同一梯隊(duì)。

和芯片或者操作系統(tǒng)不同,國(guó)內(nèi)玩家在A(yíng)I產(chǎn)業(yè)不需要面對(duì)前者必須直面的困難,比如核心技術(shù)壟斷,制造上的門(mén)檻,即便是ChatGPT,其本質(zhì)仍然屬于自然語(yǔ)言NLP的范疇,是人工智能技術(shù)長(zhǎng)期發(fā)展和積累的結(jié)果。

Meta首席人工智能科學(xué)家Yann LeCun也曾評(píng)論:“就底層技術(shù)而言,ChatGPT 并沒(méi)有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開(kāi)展同樣的工作?!?/p>

也就是說(shuō),國(guó)內(nèi)具備追趕甚至超越的能力。當(dāng)前國(guó)內(nèi)大廠(chǎng)基本都具備訓(xùn)練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤(pán)古大模型,騰訊的混元AI大模型等。

從AI相關(guān)技術(shù)來(lái)看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專(zhuān)利儲(chǔ)備分列世界前兩位。

相對(duì)而言,字節(jié)在應(yīng)用端的開(kāi)發(fā)更領(lǐng)先。根據(jù)tech星球報(bào)道,在ChatGPT被用作寫(xiě)文章前,字節(jié)跳動(dòng)就研發(fā)了Xiaomingbot自動(dòng)寫(xiě)稿平臺(tái),自2016年上線(xiàn)以來(lái),已經(jīng)累計(jì)寫(xiě)了60萬(wàn)篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語(yǔ)言。

(圖源:Tech星球)

此前國(guó)內(nèi)AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當(dāng)下各家基本上確定了相關(guān)研發(fā)上線(xiàn)的時(shí)間表,最早的比如百度的“文心一言”在3月完成內(nèi)測(cè)后,就將和公眾見(jiàn)面。

Gartner預(yù)測(cè),到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個(gè)比例還不足1%。

在這波新的智能浪潮里,中國(guó)需要土生土長(zhǎng)的ChatGPT,互聯(lián)網(wǎng)大廠(chǎng)們也需要爭(zhēng)做潮頭的破浪者。

參考來(lái)源:

1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項(xiàng),問(wèn)什么答什么,網(wǎng)友直呼童年夢(mèng)想成真

2、騰訊研究院:《AIGC發(fā)展趨勢(shì)2023》

3、品玩:谷歌發(fā)布自己的ChatGPT!華人團(tuán)隊(duì)主導(dǎo),緊急上線(xiàn),新的搜索大戰(zhàn)要來(lái)了

4、騰訊研究院:一文讀懂:有關(guān)ChatGPT的十個(gè)問(wèn)題

5、晚點(diǎn)LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復(fù)制丨TECH TUESDAY

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

怎么書(shū)寫(xiě)ChatGPT的中國(guó)故事?

文|伯虎財(cái)經(jīng) 陳平安

如果非要用一個(gè)詞來(lái)形容ChatGPT最近的熱度,那我只能稱(chēng)之為“絕殺”。

已經(jīng)很久沒(méi)有一個(gè)科技圈的熱點(diǎn)能夠承包全網(wǎng)小編2周的KPI。從北京中關(guān)村到加州硅谷,從創(chuàng)投大佬到普通學(xué)生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。

這么些年來(lái),和AI相關(guān)的熱點(diǎn)不是沒(méi)有,比如之前阿爾法狗和自動(dòng)駕駛。熱度來(lái)的快去的也快,阿爾法狗幾乎已經(jīng)無(wú)人提及,自動(dòng)駕駛遭遇寒冬,企業(yè)集體降維求生。

但這次是真不一樣。ChatGPT顛覆了大眾對(duì)于A(yíng)I的認(rèn)知,真正把通用模型擺到了普通用戶(hù)的面前,不僅能幫你寫(xiě)材料,敲代碼,還能通過(guò)選拔性考試的測(cè)驗(yàn),美國(guó)賓夕法尼亞大學(xué)稱(chēng),ChatGPT能夠通過(guò)該校工商管理碩士MBA課程的期末考試。

ChatGPT的強(qiáng)大甚至還讓國(guó)際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。

業(yè)界大佬們也紛紛出來(lái)為它站臺(tái)。馬斯克和比爾蓋茨曾經(jīng)堅(jiān)定的相信“AI威脅論”,為了預(yù)防人工智能帶來(lái)的災(zāi)難性影響,推動(dòng)人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營(yíng)利機(jī)構(gòu),OpenAI。(是的,就是ChatGPT的研發(fā)公司)

現(xiàn)在這兩人,一個(gè)稱(chēng)贊“ChatGPT好嚇人,我們離強(qiáng)大到危險(xiǎn)的人工智慧不遠(yuǎn)了”,一個(gè)甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。

更為不同尋常的是大廠(chǎng)們的動(dòng)作。面對(duì)ChatGPT,大廠(chǎng)們的反應(yīng)強(qiáng)烈,谷歌冒著翻車(chē)的危險(xiǎn)也要強(qiáng)行上線(xiàn)內(nèi)測(cè)產(chǎn)品,國(guó)內(nèi)包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關(guān)的研發(fā)上線(xiàn)時(shí)間表。

小公司為提振股價(jià)強(qiáng)行蹭熱度還可以理解,業(yè)務(wù)穩(wěn)定的大公司為何非要冒這個(gè)風(fēng)險(xiǎn)呢?

01 AI不會(huì)取代你,一個(gè)使用AI的人會(huì)取代你

要理解ChatGPT的革命性,不如先從搜索聊起。

90后以前的互聯(lián)網(wǎng)用戶(hù)們應(yīng)該都知道,國(guó)內(nèi)的中文信息服務(wù)大致經(jīng)歷了三個(gè)階段。

第一個(gè)階段是導(dǎo)航網(wǎng)站和門(mén)戶(hù)網(wǎng)站階段,尋找信息要經(jīng)由導(dǎo)航網(wǎng)站。

第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶(hù)的開(kāi)放性問(wèn)題被轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性?xún)?yōu)先級(jí)的、一個(gè)更具體的選項(xiàng)擴(kuò)列,人們可以通過(guò)搜索來(lái)獲得自己想要的信息。

第三階段是移動(dòng)互聯(lián)網(wǎng)階段。智能手機(jī)的普及和字節(jié)的推薦算法讓那些你想要的信息自動(dòng)被推送到你的面前。

不難看出,每一個(gè)階段的更迭都伴隨著效率的提升。如果把以上三個(gè)階段的效率分別比作步行,馬車(chē)和汽車(chē),那么ChatGPT則更像是“導(dǎo)彈”。

這也就難怪谷歌CEO皮柴會(huì)如此火急火燎的在官網(wǎng)上宣布上馬類(lèi)ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對(duì)話(huà)AI服務(wù)Bard,即便這款產(chǎn)品在內(nèi)部算不上準(zhǔn)備充足。

因?yàn)榧叶伎毂煌盗恕?/p>

但ChatGPT,或者說(shuō)將其包含在內(nèi)的AIGC展現(xiàn)的潛力,遠(yuǎn)不止搜索這一個(gè)領(lǐng)域。

比如今年2月8日,微軟就推出了由 ChatGPT 提供技術(shù)支持的高級(jí) Teams 產(chǎn)品, 不僅可以自動(dòng)幫助參會(huì)者生成會(huì)議記錄,即使沒(méi)有參加會(huì)議,智能回顧功能也能幫助用戶(hù)生成會(huì)議記錄和要點(diǎn)。

由ChatGPT中分拆而出的CodeX則成為了自動(dòng)補(bǔ)齊代碼應(yīng)用 Copilot 的基礎(chǔ),這款旨在輔助程序員寫(xiě)代碼的應(yīng)用從去年 8 月開(kāi)始收費(fèi),每月 10 美元。

至于實(shí)際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。

游戲產(chǎn)業(yè)同樣面臨著來(lái)自ChatGPT的挑戰(zhàn)。國(guó)外開(kāi)發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開(kāi)發(fā)了一個(gè)實(shí)驗(yàn)性Mod,在ChatGPT的幫助下,原本相對(duì)呆板的NPC變得靈動(dòng)起來(lái),不再只能重復(fù)幾句固定的臺(tái)詞。

此前社交媒體上討論火熱的AI繪畫(huà)同樣如此。去年8月,游戲設(shè)計(jì)師Jason Allen通過(guò)AI繪圖工具M(jìn)idjourney生成原畫(huà),再經(jīng)過(guò)Photoshop潤(rùn)色而完成的作品《太空歌劇院》在科羅拉多州博覽會(huì)上獲得了數(shù)字類(lèi)別的一等獎(jiǎng)。雖然AI繪畫(huà)的能力并不能和資深的人類(lèi)畫(huà)師媲美,但無(wú)疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報(bào)道,有業(yè)內(nèi)人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分?!?/p>

根據(jù)騰訊研究院《AIGC發(fā)展趨勢(shì)2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務(wù)的未來(lái),其中包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場(chǎng)景化、個(gè)性化模型為主的中間層;和以圖像、語(yǔ)音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

這意味著ChatGPT這樣的產(chǎn)品或?qū)⒅饾u成為一種類(lèi)似基礎(chǔ)設(shè)施的存在,一如pc和手機(jī)。

當(dāng)下,已經(jīng)有許多公司開(kāi)始利用 GPT-3 系列模型做應(yīng)用端的開(kāi)發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計(jì),現(xiàn)在已經(jīng)有了 628 個(gè)調(diào)用 GPT-3 系列模型開(kāi)發(fā)的應(yīng)用程序。背靠 GPT-3 模型的寫(xiě)作輔助工具 Jasper,成立 18 個(gè)月估值達(dá) 15 億美元。

簡(jiǎn)而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預(yù)見(jiàn)的,可以提升整個(gè)社會(huì)生產(chǎn)效率的可落地工具,就像蒸汽機(jī)解放雙手,汽車(chē)解放雙腿那樣。在這樣的大前提下,移動(dòng)互聯(lián)網(wǎng)時(shí)期字節(jié)超車(chē)百度的事件可能會(huì)再次重演。

ChatGPT 在 LinkedIn 分享的一篇,原本針對(duì)“ChatGPT會(huì)不會(huì)讓我失業(yè)”的帖子或許也適合回答開(kāi)頭末尾的那個(gè)問(wèn)題:“AI 不會(huì)取代你。一個(gè)使用 AI 的人將取代你”。

02 大廠(chǎng)的游戲

ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個(gè)游戲的玩家寥寥無(wú)幾。這點(diǎn)從OpenAI的發(fā)展歷程就能看出。

OpenAI 在2015年末成立時(shí)是一家非營(yíng)利性機(jī)構(gòu),創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見(jiàn)肘。

這和2018年以后,OpenAI堅(jiān)持大模型訓(xùn)練有關(guān)。2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯?duì)于硬件的要求較低,同時(shí)和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對(duì)通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對(duì)特定領(lǐng)域或者場(chǎng)景去進(jìn)行定制。

在這個(gè)背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個(gè)場(chǎng)景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開(kāi)發(fā)的特點(diǎn)。簡(jiǎn)單來(lái)說(shuō),就是大模型更加“通用”。

2019年,OpenAI推出了大型語(yǔ)言模型GPT-2,參數(shù)超過(guò)15億,是上一代語(yǔ)言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達(dá)到1750億。大模型的訓(xùn)練讓自然語(yǔ)言模型取得了突破性的進(jìn)展,GPT-2已經(jīng)能根據(jù)用戶(hù)輸入的文字生成看上去邏輯正常的文字。

但大模型太花錢(qián)了。布羅克曼等人測(cè)算,訓(xùn)練大模型消耗的計(jì)算量,每 3、4 個(gè)月會(huì)翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓(xùn)練 GPT-3 一年,僅算力成本就有 2000 萬(wàn)美元。

由于研發(fā)所需資金太大,OpenAI 在2019年轉(zhuǎn)變?yōu)橛舷扌徒M織,和微軟達(dá)成了資本掙到有限收益之后,后續(xù)收益歸非盈利實(shí)體。截至目前,微軟對(duì)OpenAI最新一輪投資額達(dá)100億美元。

無(wú)論是訓(xùn)練模型所需的龐大數(shù)據(jù)和算力,還是參與開(kāi)發(fā)的頂級(jí)人工智能科學(xué)家,亦或是推廣和普及所需的生態(tài)支持,都足見(jiàn)產(chǎn)業(yè)的門(mén)檻之高,國(guó)內(nèi)也只有互聯(lián)網(wǎng)巨頭們有這個(gè)數(shù)據(jù)優(yōu)勢(shì)和資金積累。

這也是為什么日前原美團(tuán)聯(lián)合創(chuàng)始人王慧文在社交平臺(tái)官宣出資5000萬(wàn)美元,要打造中國(guó)的OpenAI,卻被網(wǎng)友質(zhì)疑“5000萬(wàn)美元夠干什么?”的原因。

基于數(shù)據(jù)安全和應(yīng)用效果的考慮,國(guó)內(nèi)需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠(chǎng)們需要擔(dān)負(fù)起這個(gè)責(zé)任。

03 誰(shuí)能率先突圍?

ChatGPT的爆火也讓很多國(guó)內(nèi)媒體開(kāi)始反思,為什么中國(guó)的科技環(huán)境無(wú)法誕生這種創(chuàng)新?對(duì)于這類(lèi)看法,伯虎財(cái)經(jīng)認(rèn)為,對(duì)國(guó)內(nèi)AI產(chǎn)業(yè)的看法不應(yīng)如此悲觀(guān)。

首先需要承認(rèn)的是,在ChatGPT上,國(guó)內(nèi)確實(shí)存在一定差距,普遍的看法認(rèn)為這種技術(shù)上的差距在2年左右。

同時(shí)大模型在某種意義代表著一種暴力美學(xué),訓(xùn)練大模型需要空前的語(yǔ)料數(shù)據(jù)。相對(duì)于英語(yǔ)語(yǔ)境,中文互聯(lián)網(wǎng)在表達(dá)習(xí)慣上會(huì)缺乏嚴(yán)謹(jǐn),比如讓許多中年人頭疼的拼音簡(jiǎn)寫(xiě),YYDS。這類(lèi)表達(dá)必然會(huì)影響AI訓(xùn)練的效果和效率。這也是為什么ChatGPT爆火后,內(nèi)容質(zhì)量相對(duì)較高的知乎會(huì)迎來(lái)一波股價(jià)暴漲。

不過(guò)我們也要看到國(guó)內(nèi)AI產(chǎn)業(yè)也有足夠的底氣。

大模型的訓(xùn)練離不開(kāi)算法、算力和數(shù)據(jù)。算法決定了其本身的學(xué)習(xí)能力,算力則影響著算法的學(xué)習(xí)效率,數(shù)據(jù)決定了AI的訓(xùn)練效果。

國(guó)內(nèi)擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶(hù),在數(shù)據(jù)積累方面有一定優(yōu)勢(shì)。而根據(jù)《2021―2022全球計(jì)算力指數(shù)評(píng)估報(bào)告》顯示,在算力上中美大致處于同一梯隊(duì)。

和芯片或者操作系統(tǒng)不同,國(guó)內(nèi)玩家在A(yíng)I產(chǎn)業(yè)不需要面對(duì)前者必須直面的困難,比如核心技術(shù)壟斷,制造上的門(mén)檻,即便是ChatGPT,其本質(zhì)仍然屬于自然語(yǔ)言NLP的范疇,是人工智能技術(shù)長(zhǎng)期發(fā)展和積累的結(jié)果。

Meta首席人工智能科學(xué)家Yann LeCun也曾評(píng)論:“就底層技術(shù)而言,ChatGPT 并沒(méi)有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開(kāi)展同樣的工作。”

也就是說(shuō),國(guó)內(nèi)具備追趕甚至超越的能力。當(dāng)前國(guó)內(nèi)大廠(chǎng)基本都具備訓(xùn)練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤(pán)古大模型,騰訊的混元AI大模型等。

從AI相關(guān)技術(shù)來(lái)看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專(zhuān)利儲(chǔ)備分列世界前兩位。

相對(duì)而言,字節(jié)在應(yīng)用端的開(kāi)發(fā)更領(lǐng)先。根據(jù)tech星球報(bào)道,在ChatGPT被用作寫(xiě)文章前,字節(jié)跳動(dòng)就研發(fā)了Xiaomingbot自動(dòng)寫(xiě)稿平臺(tái),自2016年上線(xiàn)以來(lái),已經(jīng)累計(jì)寫(xiě)了60萬(wàn)篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語(yǔ)言。

(圖源:Tech星球)

此前國(guó)內(nèi)AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當(dāng)下各家基本上確定了相關(guān)研發(fā)上線(xiàn)的時(shí)間表,最早的比如百度的“文心一言”在3月完成內(nèi)測(cè)后,就將和公眾見(jiàn)面。

Gartner預(yù)測(cè),到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個(gè)比例還不足1%。

在這波新的智能浪潮里,中國(guó)需要土生土長(zhǎng)的ChatGPT,互聯(lián)網(wǎng)大廠(chǎng)們也需要爭(zhēng)做潮頭的破浪者。

參考來(lái)源:

1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項(xiàng),問(wèn)什么答什么,網(wǎng)友直呼童年夢(mèng)想成真

2、騰訊研究院:《AIGC發(fā)展趨勢(shì)2023》

3、品玩:谷歌發(fā)布自己的ChatGPT!華人團(tuán)隊(duì)主導(dǎo),緊急上線(xiàn),新的搜索大戰(zhàn)要來(lái)了

4、騰訊研究院:一文讀懂:有關(guān)ChatGPT的十個(gè)問(wèn)題

5、晚點(diǎn)LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復(fù)制丨TECH TUESDAY

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。