正在閱讀:

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

掃一掃下載界面新聞APP

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

怎么書寫ChatGPT的中國故事?

文|伯虎財經(jīng) 陳平安

如果非要用一個詞來形容ChatGPT最近的熱度,那我只能稱之為“絕殺”。

已經(jīng)很久沒有一個科技圈的熱點(diǎn)能夠承包全網(wǎng)小編2周的KPI。從北京中關(guān)村到加州硅谷,從創(chuàng)投大佬到普通學(xué)生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。

這么些年來,和AI相關(guān)的熱點(diǎn)不是沒有,比如之前阿爾法狗和自動駕駛。熱度來的快去的也快,阿爾法狗幾乎已經(jīng)無人提及,自動駕駛遭遇寒冬,企業(yè)集體降維求生。

但這次是真不一樣。ChatGPT顛覆了大眾對于AI的認(rèn)知,真正把通用模型擺到了普通用戶的面前,不僅能幫你寫材料,敲代碼,還能通過選拔性考試的測驗(yàn),美國賓夕法尼亞大學(xué)稱,ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。

ChatGPT的強(qiáng)大甚至還讓國際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。

業(yè)界大佬們也紛紛出來為它站臺。馬斯克和比爾蓋茨曾經(jīng)堅(jiān)定的相信“AI威脅論”,為了預(yù)防人工智能帶來的災(zāi)難性影響,推動人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營利機(jī)構(gòu),OpenAI。(是的,就是ChatGPT的研發(fā)公司)

現(xiàn)在這兩人,一個稱贊“ChatGPT好嚇人,我們離強(qiáng)大到危險的人工智慧不遠(yuǎn)了”,一個甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。

更為不同尋常的是大廠們的動作。面對ChatGPT,大廠們的反應(yīng)強(qiáng)烈,谷歌冒著翻車的危險也要強(qiáng)行上線內(nèi)測產(chǎn)品,國內(nèi)包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關(guān)的研發(fā)上線時間表。

小公司為提振股價強(qiáng)行蹭熱度還可以理解,業(yè)務(wù)穩(wěn)定的大公司為何非要冒這個風(fēng)險呢?

01 AI不會取代你,一個使用AI的人會取代你

要理解ChatGPT的革命性,不如先從搜索聊起。

90后以前的互聯(lián)網(wǎng)用戶們應(yīng)該都知道,國內(nèi)的中文信息服務(wù)大致經(jīng)歷了三個階段。

第一個階段是導(dǎo)航網(wǎng)站和門戶網(wǎng)站階段,尋找信息要經(jīng)由導(dǎo)航網(wǎng)站。

第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶的開放性問題被轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性優(yōu)先級的、一個更具體的選項(xiàng)擴(kuò)列,人們可以通過搜索來獲得自己想要的信息。

第三階段是移動互聯(lián)網(wǎng)階段。智能手機(jī)的普及和字節(jié)的推薦算法讓那些你想要的信息自動被推送到你的面前。

不難看出,每一個階段的更迭都伴隨著效率的提升。如果把以上三個階段的效率分別比作步行,馬車和汽車,那么ChatGPT則更像是“導(dǎo)彈”。

這也就難怪谷歌CEO皮柴會如此火急火燎的在官網(wǎng)上宣布上馬類ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對話AI服務(wù)Bard,即便這款產(chǎn)品在內(nèi)部算不上準(zhǔn)備充足。

因?yàn)榧叶伎毂煌盗恕?/p>

但ChatGPT,或者說將其包含在內(nèi)的AIGC展現(xiàn)的潛力,遠(yuǎn)不止搜索這一個領(lǐng)域。

比如今年2月8日,微軟就推出了由 ChatGPT 提供技術(shù)支持的高級 Teams 產(chǎn)品, 不僅可以自動幫助參會者生成會議記錄,即使沒有參加會議,智能回顧功能也能幫助用戶生成會議記錄和要點(diǎn)。

由ChatGPT中分拆而出的CodeX則成為了自動補(bǔ)齊代碼應(yīng)用 Copilot 的基礎(chǔ),這款旨在輔助程序員寫代碼的應(yīng)用從去年 8 月開始收費(fèi),每月 10 美元。

至于實(shí)際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。

游戲產(chǎn)業(yè)同樣面臨著來自ChatGPT的挑戰(zhàn)。國外開發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開發(fā)了一個實(shí)驗(yàn)性Mod,在ChatGPT的幫助下,原本相對呆板的NPC變得靈動起來,不再只能重復(fù)幾句固定的臺詞。

此前社交媒體上討論火熱的AI繪畫同樣如此。去年8月,游戲設(shè)計(jì)師Jason Allen通過AI繪圖工具M(jìn)idjourney生成原畫,再經(jīng)過Photoshop潤色而完成的作品《太空歌劇院》在科羅拉多州博覽會上獲得了數(shù)字類別的一等獎。雖然AI繪畫的能力并不能和資深的人類畫師媲美,但無疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報道,有業(yè)內(nèi)人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分?!?/p>

根據(jù)騰訊研究院《AIGC發(fā)展趨勢2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務(wù)的未來,其中包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

這意味著ChatGPT這樣的產(chǎn)品或?qū)⒅饾u成為一種類似基礎(chǔ)設(shè)施的存在,一如pc和手機(jī)。

當(dāng)下,已經(jīng)有許多公司開始利用 GPT-3 系列模型做應(yīng)用端的開發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計(jì),現(xiàn)在已經(jīng)有了 628 個調(diào)用 GPT-3 系列模型開發(fā)的應(yīng)用程序。背靠 GPT-3 模型的寫作輔助工具 Jasper,成立 18 個月估值達(dá) 15 億美元。

簡而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預(yù)見的,可以提升整個社會生產(chǎn)效率的可落地工具,就像蒸汽機(jī)解放雙手,汽車解放雙腿那樣。在這樣的大前提下,移動互聯(lián)網(wǎng)時期字節(jié)超車百度的事件可能會再次重演。

ChatGPT 在 LinkedIn 分享的一篇,原本針對“ChatGPT會不會讓我失業(yè)”的帖子或許也適合回答開頭末尾的那個問題:“AI 不會取代你。一個使用 AI 的人將取代你”。

02 大廠的游戲

ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個游戲的玩家寥寥無幾。這點(diǎn)從OpenAI的發(fā)展歷程就能看出。

OpenAI 在2015年末成立時是一家非營利性機(jī)構(gòu),創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見肘。

這和2018年以后,OpenAI堅(jiān)持大模型訓(xùn)練有關(guān)。2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯τ谟布囊筝^低,同時和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對特定領(lǐng)域或者場景去進(jìn)行定制。

在這個背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個場景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點(diǎn)。簡單來說,就是大模型更加“通用”。

2019年,OpenAI推出了大型語言模型GPT-2,參數(shù)超過15億,是上一代語言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達(dá)到1750億。大模型的訓(xùn)練讓自然語言模型取得了突破性的進(jìn)展,GPT-2已經(jīng)能根據(jù)用戶輸入的文字生成看上去邏輯正常的文字。

但大模型太花錢了。布羅克曼等人測算,訓(xùn)練大模型消耗的計(jì)算量,每 3、4 個月會翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓(xùn)練 GPT-3 一年,僅算力成本就有 2000 萬美元。

由于研發(fā)所需資金太大,OpenAI 在2019年轉(zhuǎn)變?yōu)橛舷扌徒M織,和微軟達(dá)成了資本掙到有限收益之后,后續(xù)收益歸非盈利實(shí)體。截至目前,微軟對OpenAI最新一輪投資額達(dá)100億美元。

無論是訓(xùn)練模型所需的龐大數(shù)據(jù)和算力,還是參與開發(fā)的頂級人工智能科學(xué)家,亦或是推廣和普及所需的生態(tài)支持,都足見產(chǎn)業(yè)的門檻之高,國內(nèi)也只有互聯(lián)網(wǎng)巨頭們有這個數(shù)據(jù)優(yōu)勢和資金積累。

這也是為什么日前原美團(tuán)聯(lián)合創(chuàng)始人王慧文在社交平臺官宣出資5000萬美元,要打造中國的OpenAI,卻被網(wǎng)友質(zhì)疑“5000萬美元夠干什么?”的原因。

基于數(shù)據(jù)安全和應(yīng)用效果的考慮,國內(nèi)需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠們需要擔(dān)負(fù)起這個責(zé)任。

03 誰能率先突圍?

ChatGPT的爆火也讓很多國內(nèi)媒體開始反思,為什么中國的科技環(huán)境無法誕生這種創(chuàng)新?對于這類看法,伯虎財經(jīng)認(rèn)為,對國內(nèi)AI產(chǎn)業(yè)的看法不應(yīng)如此悲觀。

首先需要承認(rèn)的是,在ChatGPT上,國內(nèi)確實(shí)存在一定差距,普遍的看法認(rèn)為這種技術(shù)上的差距在2年左右。

同時大模型在某種意義代表著一種暴力美學(xué),訓(xùn)練大模型需要空前的語料數(shù)據(jù)。相對于英語語境,中文互聯(lián)網(wǎng)在表達(dá)習(xí)慣上會缺乏嚴(yán)謹(jǐn),比如讓許多中年人頭疼的拼音簡寫,YYDS。這類表達(dá)必然會影響AI訓(xùn)練的效果和效率。這也是為什么ChatGPT爆火后,內(nèi)容質(zhì)量相對較高的知乎會迎來一波股價暴漲。

不過我們也要看到國內(nèi)AI產(chǎn)業(yè)也有足夠的底氣。

大模型的訓(xùn)練離不開算法、算力和數(shù)據(jù)。算法決定了其本身的學(xué)習(xí)能力,算力則影響著算法的學(xué)習(xí)效率,數(shù)據(jù)決定了AI的訓(xùn)練效果。

國內(nèi)擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶,在數(shù)據(jù)積累方面有一定優(yōu)勢。而根據(jù)《2021―2022全球計(jì)算力指數(shù)評估報告》顯示,在算力上中美大致處于同一梯隊(duì)。

和芯片或者操作系統(tǒng)不同,國內(nèi)玩家在AI產(chǎn)業(yè)不需要面對前者必須直面的困難,比如核心技術(shù)壟斷,制造上的門檻,即便是ChatGPT,其本質(zhì)仍然屬于自然語言NLP的范疇,是人工智能技術(shù)長期發(fā)展和積累的結(jié)果。

Meta首席人工智能科學(xué)家Yann LeCun也曾評論:“就底層技術(shù)而言,ChatGPT 并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作。”

也就是說,國內(nèi)具備追趕甚至超越的能力。當(dāng)前國內(nèi)大廠基本都具備訓(xùn)練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤古大模型,騰訊的混元AI大模型等。

從AI相關(guān)技術(shù)來看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專利儲備分列世界前兩位。

相對而言,字節(jié)在應(yīng)用端的開發(fā)更領(lǐng)先。根據(jù)tech星球報道,在ChatGPT被用作寫文章前,字節(jié)跳動就研發(fā)了Xiaomingbot自動寫稿平臺,自2016年上線以來,已經(jīng)累計(jì)寫了60萬篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語言。

(圖源:Tech星球)

此前國內(nèi)AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當(dāng)下各家基本上確定了相關(guān)研發(fā)上線的時間表,最早的比如百度的“文心一言”在3月完成內(nèi)測后,就將和公眾見面。

Gartner預(yù)測,到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個比例還不足1%。

在這波新的智能浪潮里,中國需要土生土長的ChatGPT,互聯(lián)網(wǎng)大廠們也需要爭做潮頭的破浪者。

參考來源:

1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項(xiàng),問什么答什么,網(wǎng)友直呼童年夢想成真

2、騰訊研究院:《AIGC發(fā)展趨勢2023》

3、品玩:谷歌發(fā)布自己的ChatGPT!華人團(tuán)隊(duì)主導(dǎo),緊急上線,新的搜索大戰(zhàn)要來了

4、騰訊研究院:一文讀懂:有關(guān)ChatGPT的十個問題

5、晚點(diǎn)LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復(fù)制丨TECH TUESDAY

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

王慧文豪擲3.4億,眾人都想復(fù)制ChatGPT

怎么書寫ChatGPT的中國故事?

文|伯虎財經(jīng) 陳平安

如果非要用一個詞來形容ChatGPT最近的熱度,那我只能稱之為“絕殺”。

已經(jīng)很久沒有一個科技圈的熱點(diǎn)能夠承包全網(wǎng)小編2周的KPI。從北京中關(guān)村到加州硅谷,從創(chuàng)投大佬到普通學(xué)生,都在使用、討論和分享,真正屬于是“環(huán)球同此涼熱”。

這么些年來,和AI相關(guān)的熱點(diǎn)不是沒有,比如之前阿爾法狗和自動駕駛。熱度來的快去的也快,阿爾法狗幾乎已經(jīng)無人提及,自動駕駛遭遇寒冬,企業(yè)集體降維求生。

但這次是真不一樣。ChatGPT顛覆了大眾對于AI的認(rèn)知,真正把通用模型擺到了普通用戶的面前,不僅能幫你寫材料,敲代碼,還能通過選拔性考試的測驗(yàn),美國賓夕法尼亞大學(xué)稱,ChatGPT能夠通過該校工商管理碩士MBA課程的期末考試。

ChatGPT的強(qiáng)大甚至還讓國際頂刊《自然》雜志宣布,將人工智能工具列為作者的論文,不能在雜志上發(fā)表。

業(yè)界大佬們也紛紛出來為它站臺。馬斯克和比爾蓋茨曾經(jīng)堅(jiān)定的相信“AI威脅論”,為了預(yù)防人工智能帶來的災(zāi)難性影響,推動人工智能發(fā)揮積極作用,馬斯克還參與建立了一家非營利機(jī)構(gòu),OpenAI。(是的,就是ChatGPT的研發(fā)公司)

現(xiàn)在這兩人,一個稱贊“ChatGPT好嚇人,我們離強(qiáng)大到危險的人工智慧不遠(yuǎn)了”,一個甚至表示“ChatGPT的意義不亞于PC和互聯(lián)網(wǎng)的誕生”。

更為不同尋常的是大廠們的動作。面對ChatGPT,大廠們的反應(yīng)強(qiáng)烈,谷歌冒著翻車的危險也要強(qiáng)行上線內(nèi)測產(chǎn)品,國內(nèi)包括百度、阿里、騰訊、科大訊飛、京東等都宣布了相關(guān)的研發(fā)上線時間表。

小公司為提振股價強(qiáng)行蹭熱度還可以理解,業(yè)務(wù)穩(wěn)定的大公司為何非要冒這個風(fēng)險呢?

01 AI不會取代你,一個使用AI的人會取代你

要理解ChatGPT的革命性,不如先從搜索聊起。

90后以前的互聯(lián)網(wǎng)用戶們應(yīng)該都知道,國內(nèi)的中文信息服務(wù)大致經(jīng)歷了三個階段。

第一個階段是導(dǎo)航網(wǎng)站和門戶網(wǎng)站階段,尋找信息要經(jīng)由導(dǎo)航網(wǎng)站。

第二階段是搜索引擎階段。Page Rank算法的誕生讓用戶的開放性問題被轉(zhuǎn)換成互聯(lián)網(wǎng)信息圖譜上具有關(guān)聯(lián)性優(yōu)先級的、一個更具體的選項(xiàng)擴(kuò)列,人們可以通過搜索來獲得自己想要的信息。

第三階段是移動互聯(lián)網(wǎng)階段。智能手機(jī)的普及和字節(jié)的推薦算法讓那些你想要的信息自動被推送到你的面前。

不難看出,每一個階段的更迭都伴隨著效率的提升。如果把以上三個階段的效率分別比作步行,馬車和汽車,那么ChatGPT則更像是“導(dǎo)彈”。

這也就難怪谷歌CEO皮柴會如此火急火燎的在官網(wǎng)上宣布上馬類ChatGPT產(chǎn)品——一款實(shí)驗(yàn)性的對話AI服務(wù)Bard,即便這款產(chǎn)品在內(nèi)部算不上準(zhǔn)備充足。

因?yàn)榧叶伎毂煌盗恕?/p>

但ChatGPT,或者說將其包含在內(nèi)的AIGC展現(xiàn)的潛力,遠(yuǎn)不止搜索這一個領(lǐng)域。

比如今年2月8日,微軟就推出了由 ChatGPT 提供技術(shù)支持的高級 Teams 產(chǎn)品, 不僅可以自動幫助參會者生成會議記錄,即使沒有參加會議,智能回顧功能也能幫助用戶生成會議記錄和要點(diǎn)。

由ChatGPT中分拆而出的CodeX則成為了自動補(bǔ)齊代碼應(yīng)用 Copilot 的基礎(chǔ),這款旨在輔助程序員寫代碼的應(yīng)用從去年 8 月開始收費(fèi),每月 10 美元。

至于實(shí)際效果?特斯拉前任AI總監(jiān)Andrej Karpathy透露,現(xiàn)在他80%的代碼都是由AI生成的(GitHub Copilot),而且有80%的準(zhǔn)確率。

游戲產(chǎn)業(yè)同樣面臨著來自ChatGPT的挑戰(zhàn)。國外開發(fā)者Bloc利用ChatGPT為游戲《騎馬與砍殺2》開發(fā)了一個實(shí)驗(yàn)性Mod,在ChatGPT的幫助下,原本相對呆板的NPC變得靈動起來,不再只能重復(fù)幾句固定的臺詞。

此前社交媒體上討論火熱的AI繪畫同樣如此。去年8月,游戲設(shè)計(jì)師Jason Allen通過AI繪圖工具M(jìn)idjourney生成原畫,再經(jīng)過Photoshop潤色而完成的作品《太空歌劇院》在科羅拉多州博覽會上獲得了數(shù)字類別的一等獎。雖然AI繪畫的能力并不能和資深的人類畫師媲美,但無疑大大提高了創(chuàng)作的生產(chǎn)效率。據(jù)深燃報道,有業(yè)內(nèi)人士表示,“AI繪圖就已經(jīng)是生產(chǎn)力的一部分?!?/p>

根據(jù)騰訊研究院《AIGC發(fā)展趨勢2023》,AIGC產(chǎn)業(yè)生態(tài)正在加速形成和發(fā)展,走向模型及服務(wù)的未來,其中包括以預(yù)訓(xùn)練模型為主的基礎(chǔ)層;以垂直化、場景化、個性化模型為主的中間層;和以圖像、語音、文字生成等具體AIGC應(yīng)用為主的應(yīng)用層。

這意味著ChatGPT這樣的產(chǎn)品或?qū)⒅饾u成為一種類似基礎(chǔ)設(shè)施的存在,一如pc和手機(jī)。

當(dāng)下,已經(jīng)有許多公司開始利用 GPT-3 系列模型做應(yīng)用端的開發(fā),根據(jù) gpt3demo 網(wǎng)站統(tǒng)計(jì),現(xiàn)在已經(jīng)有了 628 個調(diào)用 GPT-3 系列模型開發(fā)的應(yīng)用程序。背靠 GPT-3 模型的寫作輔助工具 Jasper,成立 18 個月估值達(dá) 15 億美元。

簡而言之就是,以ChatGPT為代表的AIGC是目前少數(shù)可預(yù)見的,可以提升整個社會生產(chǎn)效率的可落地工具,就像蒸汽機(jī)解放雙手,汽車解放雙腿那樣。在這樣的大前提下,移動互聯(lián)網(wǎng)時期字節(jié)超車百度的事件可能會再次重演。

ChatGPT 在 LinkedIn 分享的一篇,原本針對“ChatGPT會不會讓我失業(yè)”的帖子或許也適合回答開頭末尾的那個問題:“AI 不會取代你。一個使用 AI 的人將取代你”。

02 大廠的游戲

ChatGPT所在的AI賽道是典型的資金密集型,能夠參與到這個游戲的玩家寥寥無幾。這點(diǎn)從OpenAI的發(fā)展歷程就能看出。

OpenAI 在2015年末成立時是一家非營利性機(jī)構(gòu),創(chuàng)始人都是硅谷大名鼎鼎的人物,比如特斯拉CEO馬斯克,YC總裁阿爾特曼等,但在“委身”微軟前,資金總是捉襟見肘。

這和2018年以后,OpenAI堅(jiān)持大模型訓(xùn)練有關(guān)。2015年以前,小模型被公認(rèn)為是AI模型的最優(yōu)選。這是因?yàn)樾⌒偷哪P蛯τ谟布囊筝^低,同時和大模型相比,小模型具有更高的可解釋性和穩(wěn)健性。但小模型的缺點(diǎn)在于,對通用任務(wù)的處理表現(xiàn)并不好。換言之,他們很難針對特定領(lǐng)域或者場景去進(jìn)行定制。

在這個背景下,大模型脫穎而出。大模型可泛化能力強(qiáng),可以做到“舉一反三”,同一模型利用少量數(shù)據(jù)進(jìn)行微調(diào)或不進(jìn)行微調(diào)就能完成多個場景的任務(wù),從而擺脫小模型應(yīng)用碎片化、作坊式開發(fā)的特點(diǎn)。簡單來說,就是大模型更加“通用”。

2019年,OpenAI推出了大型語言模型GPT-2,參數(shù)超過15億,是上一代語言模型 GPT 的十倍,后續(xù)迭代的GPT3的參數(shù)更是達(dá)到1750億。大模型的訓(xùn)練讓自然語言模型取得了突破性的進(jìn)展,GPT-2已經(jīng)能根據(jù)用戶輸入的文字生成看上去邏輯正常的文字。

但大模型太花錢了。布羅克曼等人測算,訓(xùn)練大模型消耗的計(jì)算量,每 3、4 個月會翻一倍。據(jù)多位業(yè)內(nèi)人士估算,OpenAI 訓(xùn)練 GPT-3 一年,僅算力成本就有 2000 萬美元。

由于研發(fā)所需資金太大,OpenAI 在2019年轉(zhuǎn)變?yōu)橛舷扌徒M織,和微軟達(dá)成了資本掙到有限收益之后,后續(xù)收益歸非盈利實(shí)體。截至目前,微軟對OpenAI最新一輪投資額達(dá)100億美元。

無論是訓(xùn)練模型所需的龐大數(shù)據(jù)和算力,還是參與開發(fā)的頂級人工智能科學(xué)家,亦或是推廣和普及所需的生態(tài)支持,都足見產(chǎn)業(yè)的門檻之高,國內(nèi)也只有互聯(lián)網(wǎng)巨頭們有這個數(shù)據(jù)優(yōu)勢和資金積累。

這也是為什么日前原美團(tuán)聯(lián)合創(chuàng)始人王慧文在社交平臺官宣出資5000萬美元,要打造中國的OpenAI,卻被網(wǎng)友質(zhì)疑“5000萬美元夠干什么?”的原因。

基于數(shù)據(jù)安全和應(yīng)用效果的考慮,國內(nèi)需要有自己的ChatGPT,互聯(lián)網(wǎng)大廠們需要擔(dān)負(fù)起這個責(zé)任。

03 誰能率先突圍?

ChatGPT的爆火也讓很多國內(nèi)媒體開始反思,為什么中國的科技環(huán)境無法誕生這種創(chuàng)新?對于這類看法,伯虎財經(jīng)認(rèn)為,對國內(nèi)AI產(chǎn)業(yè)的看法不應(yīng)如此悲觀。

首先需要承認(rèn)的是,在ChatGPT上,國內(nèi)確實(shí)存在一定差距,普遍的看法認(rèn)為這種技術(shù)上的差距在2年左右。

同時大模型在某種意義代表著一種暴力美學(xué),訓(xùn)練大模型需要空前的語料數(shù)據(jù)。相對于英語語境,中文互聯(lián)網(wǎng)在表達(dá)習(xí)慣上會缺乏嚴(yán)謹(jǐn),比如讓許多中年人頭疼的拼音簡寫,YYDS。這類表達(dá)必然會影響AI訓(xùn)練的效果和效率。這也是為什么ChatGPT爆火后,內(nèi)容質(zhì)量相對較高的知乎會迎來一波股價暴漲。

不過我們也要看到國內(nèi)AI產(chǎn)業(yè)也有足夠的底氣。

大模型的訓(xùn)練離不開算法、算力和數(shù)據(jù)。算法決定了其本身的學(xué)習(xí)能力,算力則影響著算法的學(xué)習(xí)效率,數(shù)據(jù)決定了AI的訓(xùn)練效果。

國內(nèi)擁有世界最大規(guī)模的互聯(lián)網(wǎng)用戶,在數(shù)據(jù)積累方面有一定優(yōu)勢。而根據(jù)《2021―2022全球計(jì)算力指數(shù)評估報告》顯示,在算力上中美大致處于同一梯隊(duì)。

和芯片或者操作系統(tǒng)不同,國內(nèi)玩家在AI產(chǎn)業(yè)不需要面對前者必須直面的困難,比如核心技術(shù)壟斷,制造上的門檻,即便是ChatGPT,其本質(zhì)仍然屬于自然語言NLP的范疇,是人工智能技術(shù)長期發(fā)展和積累的結(jié)果。

Meta首席人工智能科學(xué)家Yann LeCun也曾評論:“就底層技術(shù)而言,ChatGPT 并沒有什么特別的創(chuàng)新,也不是什么革命性的東西。許多研究實(shí)驗(yàn)室正在使用同樣的技術(shù),開展同樣的工作。”

也就是說,國內(nèi)具備追趕甚至超越的能力。當(dāng)前國內(nèi)大廠基本都具備訓(xùn)練大模型的能力,比如百度的文心大模型,阿里的“通義”大模型,華為的鵬城盤古大模型,騰訊的混元AI大模型等。

從AI相關(guān)技術(shù)來看,百度是少有的具備AI全棧能力的企業(yè),在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局。根據(jù)statista2021年的數(shù)據(jù),騰訊和百度的AI專利儲備分列世界前兩位。

相對而言,字節(jié)在應(yīng)用端的開發(fā)更領(lǐng)先。根據(jù)tech星球報道,在ChatGPT被用作寫文章前,字節(jié)跳動就研發(fā)了Xiaomingbot自動寫稿平臺,自2016年上線以來,已經(jīng)累計(jì)寫了60萬篇文章,覆蓋了17項(xiàng)的體育賽事,支持6種語言。

(圖源:Tech星球)

此前國內(nèi)AI產(chǎn)業(yè)的投入大多面向其他產(chǎn)業(yè)方向,ChatGPT的橫空出世等于把方向統(tǒng)一了。當(dāng)下各家基本上確定了相關(guān)研發(fā)上線的時間表,最早的比如百度的“文心一言”在3月完成內(nèi)測后,就將和公眾見面。

Gartner預(yù)測,到2025年,生成式AI將占到所有生成數(shù)據(jù)的10%,目前這個比例還不足1%。

在這波新的智能浪潮里,中國需要土生土長的ChatGPT,互聯(lián)網(wǎng)大廠們也需要爭做潮頭的破浪者。

參考來源:

1、量子位:ChatGPT讓游戲NPC活了!交流不再靠選項(xiàng),問什么答什么,網(wǎng)友直呼童年夢想成真

2、騰訊研究院:《AIGC發(fā)展趨勢2023》

3、品玩:谷歌發(fā)布自己的ChatGPT!華人團(tuán)隊(duì)主導(dǎo),緊急上線,新的搜索大戰(zhàn)要來了

4、騰訊研究院:一文讀懂:有關(guān)ChatGPT的十個問題

5、晚點(diǎn)LatePost:火雞追上雄鷹,OpenAI 的成功為何難以復(fù)制丨TECH TUESDAY

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。