正在閱讀:

AI大模型,駛向產(chǎn)業(yè)何方?

掃一掃下載界面新聞APP

AI大模型,駛向產(chǎn)業(yè)何方?

ChatGPT背后的TO B論題。

文|產(chǎn)業(yè)家 斗斗

“AI炒了那么多年,第一次感覺它真的要來了。”國(guó)內(nèi)某論壇中,帶有ChatGPT的詞條下,幾乎都會(huì)出現(xiàn)一句類似的表述。

ChatGPT是美國(guó)人工智能研究實(shí)驗(yàn)室OpenAI基于AI大模型打造的一款智能問答工具,用戶只需在ChatGPT網(wǎng)站頁面的對(duì)話框中輸入問題并點(diǎn)擊確認(rèn),便可以得到答案。

就是這么一個(gè)智能問答工具,在過去的兩周內(nèi),以各種形式席卷全球各大社區(qū)、論壇,占據(jù)各大新聞?lì)^版頭條。

不同于過去“AI革命”中,專屬于相關(guān)企業(yè)與技術(shù)人員的搖旗吶喊、獨(dú)自狂歡。這次將AI推向風(fēng)口的卻是C端用戶,這使得ChatGPT實(shí)現(xiàn)了快速“出圈”。

一組數(shù)據(jù)是,ChatGPT今年1月的月活躍用戶數(shù)已達(dá)1億,成為歷史上用戶增長(zhǎng)最快的消費(fèi)應(yīng)用。國(guó)外一家提供就業(yè)服務(wù)的平臺(tái)對(duì)1000家企業(yè)進(jìn)行了調(diào)查。結(jié)果顯示,近50%的企業(yè)表示,已經(jīng)在使用ChatGPT,30%表示有計(jì)劃使用。

國(guó)外科技巨頭也紛紛開始布局,例如曾all in元宇宙的Meta發(fā)布了新的大模型系列 —— LLaMA;微軟公司宣布ChatGPT將與旗下瀏覽器融合;谷歌宣布發(fā)布“Bard”AI聊天機(jī)器人服務(wù)。

ChatGPT帶來的熱潮,同時(shí)也涌向了國(guó)內(nèi)市場(chǎng)。

較為明顯的是,百度、騰訊、阿里等紛紛開始布局具體應(yīng)用。其中,百度宣布將基于文心大模型推出“文心一言”后,400多家公司相繼宣布接入,一度將其港股股價(jià)拉高超12%。

另外,在過去的兩周內(nèi),諸多以AI大模型為技術(shù)底層的廠商,開始獲得資本的青睞。

例如,致力于企業(yè)創(chuàng)新數(shù)智化平臺(tái)的銜遠(yuǎn)科技完成數(shù)億元(人民幣)天使輪融資;致力于對(duì)話機(jī)器人行業(yè)解決方案的竹間智能完成D+輪融資;醫(yī)療交互AI平臺(tái)聆心智能完成Pre-A輪融資。

更有已退休兩年的前美團(tuán)聯(lián)合創(chuàng)始人王慧文,在其朋友圈公開招納技術(shù)人才,助其打造“中國(guó)版OpenAI;快手前AI核心人物李巖創(chuàng)業(yè)投身AI大模型賽道。

而在學(xué)術(shù)界,復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室,發(fā)布了國(guó)內(nèi)首個(gè)類ChatGPT模型MOSS,公開平臺(tái)邀公眾參與內(nèi)測(cè)后,數(shù)萬名用戶申請(qǐng)參與內(nèi)測(cè)。

站在底層技術(shù)角度來看,從科技巨頭到互聯(lián)網(wǎng)大廠,從創(chuàng)業(yè)屆到學(xué)術(shù)屆,AI大模型正在成為各方搶灘市場(chǎng)的關(guān)鍵。

事實(shí)上,AI大模型本質(zhì)上是通過數(shù)據(jù)的訓(xùn)練,進(jìn)行歸集和表達(dá)。這意味著,如果對(duì)不同的數(shù)據(jù)進(jìn)行訓(xùn)練,便可以產(chǎn)生不同的模型。拿OpenAI來說,其就是基于底層大模型打造了“對(duì)話機(jī)器人”ChatGPT。除此之外,其還基于底層大模型打造了Dall-E“繪畫機(jī)器人”。

過去多年的一個(gè)市場(chǎng)共識(shí)是,如果要實(shí)現(xiàn)AI規(guī)?;a(chǎn)業(yè)落地,底層AI大模型就必須是一個(gè)通用的大模型平臺(tái),廠商根據(jù)用戶需求在平臺(tái)之上,進(jìn)行多場(chǎng)景、多領(lǐng)域的模型生產(chǎn),從而實(shí)現(xiàn)具體行業(yè)模型的落地。

對(duì)一眾廠商而言,這也是一個(gè)新的方向。即AI廠商以“通用模型+產(chǎn)業(yè)模型”不斷賦能企業(yè)、產(chǎn)業(yè),從而加速中國(guó)的產(chǎn)業(yè)數(shù)字化進(jìn)程。更為重要的是,這種模式一旦落地成功或?qū)⒖焖賹?shí)現(xiàn)規(guī)?;?yīng),或?qū)轭^部AI廠商帶來高回報(bào),擺脫當(dāng)下AI技術(shù)落地難,盈利難的現(xiàn)狀。

那么,AI大模型現(xiàn)在在國(guó)內(nèi)產(chǎn)業(yè)側(cè)的成長(zhǎng)如何?

一、看見AI大模型

“丫丫意識(shí)上傳550W后1.7秒月球危機(jī)就發(fā)生了?!边@是電影《流浪地球2》中的一句臺(tái)詞。

這個(gè)情節(jié)背后隱藏的是,超級(jí)AI大模型下的超級(jí)智能決策。

在電影的人物設(shè)定中,馬兆、圖恒宇都是550系列智能量子計(jì)算機(jī)的研究員。圖恒宇是為了留住在車禍中去世的女兒圖丫丫,將其“意識(shí)”植入初代智能量子計(jì)算機(jī)550A升級(jí)版550C中,試圖迭代出“數(shù)字人丫丫”,但由于算力問題,不能處理過多的數(shù)據(jù),導(dǎo)致“數(shù)字人丫丫”只能迭代出2分鐘的生命。

月球危機(jī)下,圖恒宇看到了550C的升級(jí)版550W,其超強(qiáng)算力可以讓丫丫“活得更久”。于是圖恒宇偷偷將丫丫的意識(shí)植入550W。

但在植入丫丫意識(shí)的1.7秒后,計(jì)算機(jī)開始超負(fù)荷運(yùn)行,這意味著,無法啟動(dòng)地球上的發(fā)動(dòng)機(jī),“流浪地球”計(jì)劃失敗,地球毀滅。

一個(gè)決定性的轉(zhuǎn)機(jī)在電影結(jié)尾,圖恒宇在臨死前將自己的“意識(shí)”植入了550W,使得其算力正常運(yùn)行,點(diǎn)燃了發(fā)動(dòng)機(jī)。

其實(shí),在550W量子計(jì)算機(jī)的超強(qiáng)算力下,AI大模型不斷的計(jì)算、學(xué)習(xí)、訓(xùn)練,讓原本負(fù)責(zé)管理空間站的AI系統(tǒng)迭代出自主意識(shí),并為自己取名MOSS。

由于其AI系統(tǒng)的設(shè)定便是堅(jiān)定執(zhí)行延續(xù)人類文明的使命,所以當(dāng)丫丫的意識(shí)植入大模型時(shí),在550W超強(qiáng)算力加持下,極端理性的人工智能遇到了感性的丫丫,MOSS實(shí)現(xiàn)了新的進(jìn)化,感受到了人性的惡,推算出毀滅即拯救,這也就導(dǎo)致了MOSS制造出計(jì)算機(jī)負(fù)荷運(yùn)載的假象,試圖毀滅地球。

但當(dāng)圖恒宇的意識(shí)的植入大模型后,使得MOSS學(xué)習(xí)到圖恒宇與丫丫之間的愛與和平,訓(xùn)練出新的意識(shí)形態(tài),即拯救人類。

從某種意義上來說,MOSS最后拯救人類,就是“理想AI大模型”下帶來的智能決策。

實(shí)現(xiàn)路徑可以概括為,基于大量的數(shù)據(jù)集,進(jìn)行學(xué)習(xí)、訓(xùn)練之后,在空間站管理場(chǎng)景中,利用550w量子計(jì)算機(jī)的算力,將空間站場(chǎng)景數(shù)據(jù)植入,進(jìn)行二次訓(xùn)練,就可以滿足空間站的場(chǎng)景需求,MOSS就是這種需求下的產(chǎn)物。

場(chǎng)景數(shù)據(jù)喂養(yǎng)后實(shí)現(xiàn)二次訓(xùn)練的模型也可以稱之為場(chǎng)景模型。而當(dāng)丫丫、圖恒宇意識(shí),即具體場(chǎng)景任務(wù)、行為數(shù)據(jù)植入場(chǎng)景模型中時(shí),便可以給出具體智能決策。

這也是AI大模型規(guī)?;涞氐囊环N路徑。

“中國(guó)科幻需要現(xiàn)實(shí)意義?!痹趧⒋刃揽磥恚骼说厍虻墓适略O(shè)定與現(xiàn)實(shí)科技發(fā)展存在著許多共性。

事實(shí)上,ChatGPT產(chǎn)業(yè)圖譜中,主要價(jià)值點(diǎn)有三層。一是開篇提到的ChatGPT應(yīng)用程序,將AI模型集成進(jìn)面向用戶的應(yīng)用軟件,它們或運(yùn)行著自己的模型(端到端應(yīng)用),或依賴于三方模型的API。目前來看,雖然這類應(yīng)用公司的營(yíng)收增長(zhǎng)得非???,但在留存率、產(chǎn)品差異化和毛利率上卻容易遇到瓶頸。

二是基礎(chǔ)設(shè)施提供商,如云廠商或硬件制造商,它們負(fù)載著生成式AI模型的訓(xùn)練和推理。這類廠商贏面較大,將賺取了流經(jīng)技術(shù)棧的大部分資金。以生成式AI為例,有業(yè)內(nèi)人士預(yù)測(cè),其總營(yíng)收的10%~20%將流向云服務(wù)提供商。但有這種能力的廠商屈指可數(shù),門檻高,頭部效應(yīng)明顯,競(jìng)爭(zhēng)空間極其有限。

三就是我們重點(diǎn)提到的模型提供商,致力于打造驅(qū)動(dòng)AI產(chǎn)品的底層大模型,它們要么以專有API的形式提供,要么開源提供。但絕大多數(shù)大模型廠商都還沒有實(shí)現(xiàn)大規(guī)模的商業(yè)化,屬于一片還未真正打開的戰(zhàn)場(chǎng),彎道超車機(jī)會(huì)很大。

值得注意的是,在整個(gè)AI規(guī)?;涞亓鞒讨?,最復(fù)雜的環(huán)節(jié)就是底層AI大模型的搭建。但這恰恰給AI大模型廠商帶來了新的機(jī)會(huì)。

換言之,想要實(shí)現(xiàn)AI大模型規(guī)?;漠a(chǎn)業(yè)落地,首先需要將整個(gè)落地路徑“簡(jiǎn)化”。讓AI變得“人人可用”,同時(shí)也要滿足具體場(chǎng)景、領(lǐng)域的個(gè)性化需求。

二、通用大模型+產(chǎn)業(yè)模型

底層AI大模型的研發(fā)具有數(shù)據(jù)規(guī)模大、質(zhì)量參差不齊、模型體積大、訓(xùn)練難度高、算力規(guī)模大、性能要求高等挑戰(zhàn)。這樣的高研發(fā)門檻,不利于人工智能技術(shù)在千行百業(yè)的推廣。

而具有數(shù)據(jù)、算力、算法綜合優(yōu)勢(shì)的企業(yè)可以將模型的復(fù)雜生產(chǎn)過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),向千行百業(yè)提供大模型服務(wù)。

各個(gè)行業(yè)的企業(yè)只需要通過生產(chǎn)平臺(tái)提出在實(shí)際AI應(yīng)用中的具體需求,生產(chǎn)大模型的少數(shù)企業(yè)就能夠根據(jù)應(yīng)用場(chǎng)景進(jìn)一步對(duì)大模型開發(fā)訓(xùn)練,幫助應(yīng)用方實(shí)現(xiàn)大模型的精調(diào),以達(dá)到各行業(yè)對(duì)于AI模型的直接應(yīng)用。

彼時(shí),AI大模型就會(huì)真正意義上實(shí)現(xiàn)產(chǎn)業(yè)化,成為產(chǎn)業(yè)模型。

目前,國(guó)內(nèi)布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業(yè),正在不斷夯實(shí)通用大模型,打造產(chǎn)業(yè)模型,助力AI大模型產(chǎn)業(yè)化。

其中,百度以文心大模型+飛槳PaddlePaddle深度學(xué)習(xí)平臺(tái);騰訊以hun yuan大模型+太極機(jī)器學(xué)習(xí)平臺(tái);阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了(自然語言處理)大模型、(計(jì)算機(jī)視覺)大模型以及多模態(tài)大模型方面。

可以發(fā)現(xiàn),主要參與者大多是云廠商,正如上文所言,云基礎(chǔ)設(shè)施很有可能是AI大模型這盤棋,最終的最大獲益者。所以,大模型也成了云廠商“的必爭(zhēng)之地”

值得注意的是,各個(gè)廠商AI大模型的布局,有所差異。

百度由于多年在AI領(lǐng)域的深耕,其文心大模型涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,打造大模型總量約40個(gè),產(chǎn)業(yè)應(yīng)用也較為廣泛,例如電力、燃?xì)?、金融、航天等,?gòu)建了國(guó)內(nèi)業(yè)界較大的產(chǎn)業(yè)大模型。

目前來看,屬于國(guó)內(nèi)大模型廠商的第一梯隊(duì)中的佼佼者。

騰訊產(chǎn)業(yè)化應(yīng)用方向則主要是騰訊自身生態(tài)的降本增效,其中廣告類應(yīng)用表現(xiàn)出色。

阿里更重技術(shù),例如M6大模型基于阿里云、達(dá)摩院打造的硬件優(yōu)勢(shì),可將大模型所需算力壓縮到極致;另外其底層技術(shù)優(yōu)勢(shì)還有利于構(gòu)建AI的統(tǒng)一底層。

目前,主要應(yīng)用方向是為下游任務(wù)提質(zhì)增效,例如在淘寶服飾類搜索場(chǎng)景中實(shí)現(xiàn)了以文搜圖的跨模態(tài)搜索。

華為的優(yōu)勢(shì)則在于其訓(xùn)練出業(yè)界首個(gè)2000 億參數(shù)以中文為核心的預(yù)訓(xùn)練生成語言模型。目前發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項(xiàng)較為重磅的行業(yè)大模型。

可以發(fā)現(xiàn),在商業(yè)模式上各個(gè)廠商都是通用大模型路徑,在通用大模型架構(gòu)之上,搭建具體行業(yè)模型。映射到產(chǎn)業(yè)層面,即“通用大模型+產(chǎn)業(yè)模型”的路徑。

但具體的產(chǎn)業(yè)化應(yīng)用有著較為明顯的差異。其實(shí),這與各個(gè)廠商喂養(yǎng)的數(shù)據(jù)有著極大地關(guān)系。例如華為的優(yōu)勢(shì)在G端,相對(duì)應(yīng)其在氣象、煤礦等央國(guó)企領(lǐng)域有大量服務(wù)經(jīng)驗(yàn)與數(shù)據(jù),在數(shù)據(jù)的計(jì)算、學(xué)習(xí)、訓(xùn)練下,更容易打造該產(chǎn)業(yè)的大模型。

然而,手握入場(chǎng)券,并不代表能跑到終點(diǎn)。

對(duì)于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產(chǎn)業(yè)模型到具體場(chǎng)景的應(yīng)用,并不意味著其可以打造出有真正價(jià)值的智能決策。

AI大模型產(chǎn)業(yè)化落地的瓶頸需要被正視。

三、“智商”堪憂

如果將產(chǎn)業(yè)模型看成一個(gè)公式:2×π+N=?

其中,公式“2×π=6.28318530718......”就是底層通用大模型,“N”則象征著具體場(chǎng)景的數(shù)據(jù)。公式“2×π+N=?”就是植入具體場(chǎng)景、領(lǐng)域數(shù)據(jù)后的產(chǎn)業(yè)模型。

在這個(gè)公式中,不難發(fā)現(xiàn)的是,π小數(shù)點(diǎn)后的數(shù)字越精確,得出的結(jié)果就越精確,最后產(chǎn)業(yè)模型下的智能決策也就越精確,相對(duì)應(yīng)的計(jì)算難度也就越大。另外“N”作為一個(gè)變量,需要收集場(chǎng)景下大量有價(jià)值的數(shù)據(jù)。

顯然,計(jì)算能力和數(shù)據(jù)集成,是AI最終做出有價(jià)值的智能決策的關(guān)鍵,即AI大模型產(chǎn)業(yè)化落地的關(guān)鍵。

對(duì)于國(guó)內(nèi)的AI大模型廠商而言,這不是一件容易的事情。

1、計(jì)算能力

在提升計(jì)算能力方面,首先比起一個(gè)人,100個(gè)人計(jì)算的效率會(huì)更高,所以計(jì)算人力數(shù)量是關(guān)鍵,人力數(shù)量對(duì)應(yīng)的則是芯片的數(shù)量;其次,計(jì)算器比紙算會(huì)更快,而Excel又比計(jì)算器效率更高,所以計(jì)算工具的性能改進(jìn)也是關(guān)鍵,對(duì)應(yīng)的則是芯片的性能。AI大模型需要在大量、高性能的芯片加持下,不斷的進(jìn)行模型訓(xùn)練,才能更加精準(zhǔn)。

目前,英偉達(dá)推出的A100/H100是目前性能最強(qiáng)的數(shù)據(jù)中心專用GPU。且市面上幾乎沒有可規(guī)模替代的方案。包括特斯拉、Facebook在內(nèi)的企業(yè),都利用A100芯片組建了AI計(jì)算集群。

根據(jù)市場(chǎng)研究顧問公司Compass Intelligence發(fā)布的AI芯片最新調(diào)研報(bào)告,全球前5大人工智能(AI)芯片企業(yè)排名依次為NVIDIA英偉達(dá)、Intel英特爾、IBM、Google、蘋果。

在性能方面,英偉達(dá)是AI大模型芯片選擇的第一順位。

值得注意的是,據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,以 ChatGPT在 1 月的獨(dú)立訪客平均數(shù) 1300 萬計(jì)算,其對(duì)應(yīng)芯片需求為 3 萬多片英偉達(dá) A100 GPU。從全球GPU的飽有量來看,擁有一萬顆GPU儲(chǔ)備的企業(yè)屈指可數(shù)。

即使有貨,但受困于美國(guó)對(duì)英偉達(dá)GPU產(chǎn)品A100和H100出口限制,目前也很難買到。

針對(duì)這一問題,英偉達(dá)為了留住難以割舍的中國(guó)市場(chǎng),推出了A100的替代A800。這是國(guó)內(nèi)廠商目前能買到的替代品。

但根據(jù)芯片經(jīng)銷商OMNISKY容天官網(wǎng)信息顯示,英偉達(dá)A800GPU數(shù)據(jù)傳輸速率為每秒400GB,傳輸速率有所下降。英偉達(dá)A100GPU傳輸速率為每秒600GB。A800數(shù)據(jù)傳輸速度降低了30%,性能明顯不高。

還有,訓(xùn)練通用大模型十分燒錢。據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,GPT-3 訓(xùn)練一次的成本約為 140 萬美元,對(duì)于一些更大的 LLM(大型語言模型),訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 3 萬多片 A100的采購(gòu)量來算,初始投入成本約為 8 億美元,每日電費(fèi)在 5 萬美元左右。

站在更大的層面看,如果要實(shí)現(xiàn)AI大模型最終的產(chǎn)業(yè)化落地,其成本將會(huì)高達(dá)幾十億甚至上百億。

根據(jù)New Street Research的一項(xiàng)估計(jì)發(fā)現(xiàn),Bing搜索中基于OpenAI的ChatGPT模型可能需要8個(gè)GPU才能在不到一秒的時(shí)間內(nèi)響應(yīng)問題。

按照這個(gè)速度,微軟將需要超過20,000臺(tái)8-GPU服務(wù)器才能將Bing中的模型部署給每個(gè)人,這表明微軟的功能可能需要40億美元的基礎(chǔ)設(shè)施支出。

燒錢、買不到大量高性能的AI芯片,制約著國(guó)內(nèi)AI大模型的計(jì)算能力。

2、數(shù)據(jù)集成管理

中外數(shù)據(jù)質(zhì)量有著巨大差異性。

IDC在一項(xiàng)有關(guān)“中國(guó)數(shù)據(jù)集成與數(shù)據(jù)質(zhì)量市場(chǎng)”調(diào)查的白皮書中指出,大部分中國(guó)企業(yè)數(shù)據(jù)集成項(xiàng)目難以達(dá)到預(yù)期的原因在于數(shù)據(jù)質(zhì)量問題。

從市場(chǎng)發(fā)展環(huán)境方面,可以看到的一些問題是。國(guó)內(nèi)企業(yè)IT系統(tǒng)大量建設(shè),數(shù)據(jù)環(huán)境較為復(fù)雜,造成數(shù)據(jù)的重復(fù)、不一致、格式混亂等問題。這些低質(zhì)量的數(shù)據(jù),即便在完成數(shù)據(jù)集成之后,得出的也可能是質(zhì)量不高的信息。

一組數(shù)據(jù)是,72%的接受調(diào)查的中國(guó)企業(yè)存在重復(fù)數(shù)據(jù),60%的企業(yè)存在不完整數(shù)據(jù)。

另外,國(guó)內(nèi)企業(yè)普遍存在跨系統(tǒng)利用數(shù)據(jù)、系統(tǒng)間數(shù)據(jù)傳遞不及時(shí)、以及業(yè)務(wù)指標(biāo)理解不一致也使得數(shù)據(jù)質(zhì)量出現(xiàn)問題。

“如果是靜態(tài)數(shù)據(jù),則要求完整、準(zhǔn)確、一致,格式規(guī)范;如果是動(dòng)態(tài)數(shù)據(jù),則要求能被及時(shí)調(diào)用,快速更新?!痹贗DC中國(guó)高級(jí)分析師劉飛認(rèn)為,這是衡量數(shù)據(jù)質(zhì)量好壞標(biāo)準(zhǔn)。

然而,在國(guó)內(nèi)由于企業(yè)數(shù)字化程度較低,甚至許多企業(yè)停留在最原始的信息化階段,導(dǎo)致標(biāo)準(zhǔn)化、規(guī)范化程度較低,集成管理困難。而在歐美,企業(yè)標(biāo)準(zhǔn)化程度高,相對(duì)應(yīng)的數(shù)據(jù)也較為標(biāo)準(zhǔn)化,數(shù)據(jù)質(zhì)量高。

數(shù)據(jù)挖掘方面,挖掘程度不同,一般國(guó)外把數(shù)據(jù)挖掘技術(shù)應(yīng)用于各個(gè)行業(yè)產(chǎn)業(yè)的過程中,建立不同的數(shù)據(jù)挖掘模型。國(guó)內(nèi)主要應(yīng)用于各個(gè)行業(yè)儲(chǔ)層評(píng)價(jià)、施工方式的選擇、生產(chǎn)指標(biāo)的預(yù)測(cè)以及各個(gè)行業(yè)系統(tǒng)的診斷。另外,國(guó)內(nèi)多專于橫截面式的數(shù)據(jù)分析。國(guó)外更注重同一批樣本量的縱向比較和追蹤研究。

在數(shù)據(jù)研究方面。由于國(guó)外注重?cái)?shù)據(jù)研究的意識(shí),國(guó)外數(shù)據(jù)治理研究主要集中在理論探索、模型框架以及實(shí)踐應(yīng)用三個(gè)方面; 國(guó)內(nèi)相比之下,技術(shù)研發(fā)的探索能力較弱一些,所以側(cè)重于理論分析尚且缺乏模型與框架等應(yīng)用研究。

在數(shù)據(jù)共享方面。國(guó)外許多國(guó)家都有很多大型的科學(xué)數(shù)據(jù)共享平臺(tái),特別是英國(guó)、美國(guó),并且許多平臺(tái)都對(duì)自己的數(shù)據(jù)有一定的質(zhì)量要求。且國(guó)外企業(yè)之間也有著良好的數(shù)據(jù)生態(tài)。

目前國(guó)內(nèi)的數(shù)據(jù)共享平臺(tái)發(fā)展還不夠成熟,國(guó)內(nèi)主要的數(shù)據(jù)平臺(tái)是中科院科學(xué)數(shù)據(jù)共享工程中開發(fā)的多個(gè)學(xué)科數(shù)據(jù)共享平臺(tái)。且企業(yè)之間數(shù)據(jù)生態(tài)并沒有像國(guó)外那么開放。

較為混亂的數(shù)據(jù)環(huán)境、缺乏數(shù)據(jù)深度和整體性研究以及數(shù)據(jù)生態(tài)的不成熟等問題,使得國(guó)內(nèi)產(chǎn)業(yè)數(shù)據(jù)在質(zhì)量、數(shù)量上普遍存在一些問題,導(dǎo)致場(chǎng)景無法真正實(shí)現(xiàn)數(shù)字化,且在短時(shí)間內(nèi),無法通過技術(shù)、管理手段迅速改善。比起歐美國(guó)家,仍有很長(zhǎng)一段路要走。

總結(jié)來看,以目前國(guó)內(nèi)AI大模型的計(jì)算能力以及數(shù)據(jù)集成管理能力,其最后產(chǎn)業(yè)化落地的智能預(yù)測(cè)很有可能價(jià)值點(diǎn)較低。即使做出語音交互機(jī)器人,可能也并不“聰明”。

但即使是這樣,我們?nèi)孕杩吹紸I 大模型對(duì)中國(guó)產(chǎn)業(yè)發(fā)展的巨大意義。

四、在中國(guó),談?wù)揂I模型的必要性

“以數(shù)據(jù)為關(guān)鍵要素,以價(jià)值釋放為核心,以數(shù)據(jù)賦能為主線,對(duì)產(chǎn)業(yè)鏈上下游的全要素?cái)?shù)字化升級(jí)、轉(zhuǎn)型和再造的過程”這是產(chǎn)業(yè)數(shù)字化的官方定義。

簡(jiǎn)單來說,產(chǎn)業(yè)數(shù)字化的前提就是讓數(shù)據(jù)從資源化奔向資產(chǎn)化。

好比煤炭、石油、天然氣等,只有少量存儲(chǔ)則不可能被稱做資源,只有在規(guī)模足夠大,具有使用價(jià)值之后,才會(huì)被稱做資源。

后期則需要對(duì)其進(jìn)行開采和加工,自然需要組織、制度、流程等來保證工作的有序運(yùn)轉(zhuǎn),并使資源轉(zhuǎn)化為資產(chǎn)。這時(shí),煤炭、石油、天然氣的價(jià)值才能釋放出來。

數(shù)據(jù)資源也是同樣的道理。當(dāng)數(shù)據(jù)資源達(dá)到一定規(guī)模,就需要組織對(duì)其進(jìn)行開發(fā)和利用,成為數(shù)據(jù)資產(chǎn),釋放其價(jià)值。

在當(dāng)下的大數(shù)據(jù)時(shí)代,企業(yè)愈發(fā)重視數(shù)據(jù)的采集,這其中不乏一些企業(yè)擁有龐大且豐富的數(shù)據(jù)集。然而,國(guó)內(nèi)企業(yè)大規(guī)模數(shù)據(jù)的開發(fā)和利用的鏈路十分復(fù)雜,普遍面臨數(shù)據(jù)“用不起來”和“用不好”的問題。

但AI大模型本身對(duì)應(yīng)的就是數(shù)據(jù)的高度歸集和表達(dá),其就像一條快速通道,高度歸集代表入口,表達(dá)則是出口,讓數(shù)據(jù)從生產(chǎn)到消費(fèi)的路徑變得簡(jiǎn)單,數(shù)據(jù)可以便捷、快速地進(jìn)行開發(fā)和利用,釋放數(shù)據(jù)的價(jià)值。

加之,在AI大模型+產(chǎn)業(yè)模型下,大模型可以實(shí)現(xiàn)具體場(chǎng)景、領(lǐng)域數(shù)據(jù)的學(xué)習(xí)、訓(xùn)練。所以在產(chǎn)業(yè)具體場(chǎng)景下的數(shù)據(jù)將更有價(jià)值,即更加貼合場(chǎng)景需求,可以直擊場(chǎng)景痛點(diǎn)。

可以預(yù)見,隨著產(chǎn)業(yè)模型的落地,將使得企業(yè)數(shù)據(jù)價(jià)值得到最大釋放,實(shí)現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型、再造,加速產(chǎn)業(yè)數(shù)字化滲透,推動(dòng)產(chǎn)業(yè)數(shù)字化歷程。

另外,AI大模型的隨著時(shí)間的推移,廠商的利潤(rùn)將越來越高。

根據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè),至2030年為止,AI訓(xùn)練成本將持續(xù)以每年70%的速度降低。

舉例來說,要將一款大型語言模型訓(xùn)練至GPT-3 (Generative Pre-trAIned Transformer 3,生成型預(yù)訓(xùn)練變換模型-3)等級(jí),2020年得花費(fèi)近460萬美元,2022年驟降至45萬美元,成本節(jié)約近90%。

這對(duì)于以往落地難、盈利難的AI廠商而言,無疑是一塊巨大的蛋糕??梢姡诮?jīng)營(yíng)者,于使用者,于產(chǎn)業(yè)發(fā)展,AI大模型的布局極其重要。

除此之外,在國(guó)家層面,AI大模型在今年兩會(huì)上亦被提上了新高度。

“ChatGPT之所以引起關(guān)注,在于它是一個(gè)大模型,對(duì)應(yīng)大數(shù)據(jù)、強(qiáng)計(jì)算、好算法。踢足球都是盤帶、射門,但要做到梅西那么好也不容易......要達(dá)到ChatGPT的效果,可能還有工作要做?!?/p>

科技部部長(zhǎng)王志剛希望國(guó)內(nèi)的科研院所、企業(yè)、廣大科研人員能有進(jìn)一步發(fā)展和進(jìn)步。

而這是他第二次談及AI大模型。

總體來看,AI大模型已然成為各個(gè)國(guó)家、企業(yè)發(fā)展的戰(zhàn)略要地。已經(jīng)到了不得不重視的地步。

寫在最后

回歸技術(shù)本質(zhì)來看,ChatGPT不是一個(gè)新鮮的事物,AI大模型更不是一個(gè)突破性的技術(shù),但ChatGPT卻讓其實(shí)現(xiàn)了現(xiàn)象級(jí)的爆發(fā),在當(dāng)下AI大模型風(fēng)口下,我們是否應(yīng)該思考一些更加深刻的問題,除了軟硬件、技術(shù),中國(guó)式AI到底缺少什么?或許這才是問題的根源。

技術(shù)更迭,已不是壁壘,國(guó)產(chǎn)式AI需要的是產(chǎn)品的創(chuàng)新思維,以及對(duì)需求的產(chǎn)品變現(xiàn)能力。這種亟需具備的特質(zhì),適用于所有領(lǐng)域。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

AI大模型,駛向產(chǎn)業(yè)何方?

ChatGPT背后的TO B論題。

文|產(chǎn)業(yè)家 斗斗

“AI炒了那么多年,第一次感覺它真的要來了?!眹?guó)內(nèi)某論壇中,帶有ChatGPT的詞條下,幾乎都會(huì)出現(xiàn)一句類似的表述。

ChatGPT是美國(guó)人工智能研究實(shí)驗(yàn)室OpenAI基于AI大模型打造的一款智能問答工具,用戶只需在ChatGPT網(wǎng)站頁面的對(duì)話框中輸入問題并點(diǎn)擊確認(rèn),便可以得到答案。

就是這么一個(gè)智能問答工具,在過去的兩周內(nèi),以各種形式席卷全球各大社區(qū)、論壇,占據(jù)各大新聞?lì)^版頭條。

不同于過去“AI革命”中,專屬于相關(guān)企業(yè)與技術(shù)人員的搖旗吶喊、獨(dú)自狂歡。這次將AI推向風(fēng)口的卻是C端用戶,這使得ChatGPT實(shí)現(xiàn)了快速“出圈”。

一組數(shù)據(jù)是,ChatGPT今年1月的月活躍用戶數(shù)已達(dá)1億,成為歷史上用戶增長(zhǎng)最快的消費(fèi)應(yīng)用。國(guó)外一家提供就業(yè)服務(wù)的平臺(tái)對(duì)1000家企業(yè)進(jìn)行了調(diào)查。結(jié)果顯示,近50%的企業(yè)表示,已經(jīng)在使用ChatGPT,30%表示有計(jì)劃使用。

國(guó)外科技巨頭也紛紛開始布局,例如曾all in元宇宙的Meta發(fā)布了新的大模型系列 —— LLaMA;微軟公司宣布ChatGPT將與旗下瀏覽器融合;谷歌宣布發(fā)布“Bard”AI聊天機(jī)器人服務(wù)。

ChatGPT帶來的熱潮,同時(shí)也涌向了國(guó)內(nèi)市場(chǎng)。

較為明顯的是,百度、騰訊、阿里等紛紛開始布局具體應(yīng)用。其中,百度宣布將基于文心大模型推出“文心一言”后,400多家公司相繼宣布接入,一度將其港股股價(jià)拉高超12%。

另外,在過去的兩周內(nèi),諸多以AI大模型為技術(shù)底層的廠商,開始獲得資本的青睞。

例如,致力于企業(yè)創(chuàng)新數(shù)智化平臺(tái)的銜遠(yuǎn)科技完成數(shù)億元(人民幣)天使輪融資;致力于對(duì)話機(jī)器人行業(yè)解決方案的竹間智能完成D+輪融資;醫(yī)療交互AI平臺(tái)聆心智能完成Pre-A輪融資。

更有已退休兩年的前美團(tuán)聯(lián)合創(chuàng)始人王慧文,在其朋友圈公開招納技術(shù)人才,助其打造“中國(guó)版OpenAI;快手前AI核心人物李巖創(chuàng)業(yè)投身AI大模型賽道。

而在學(xué)術(shù)界,復(fù)旦大學(xué)自然語言處理實(shí)驗(yàn)室,發(fā)布了國(guó)內(nèi)首個(gè)類ChatGPT模型MOSS,公開平臺(tái)邀公眾參與內(nèi)測(cè)后,數(shù)萬名用戶申請(qǐng)參與內(nèi)測(cè)。

站在底層技術(shù)角度來看,從科技巨頭到互聯(lián)網(wǎng)大廠,從創(chuàng)業(yè)屆到學(xué)術(shù)屆,AI大模型正在成為各方搶灘市場(chǎng)的關(guān)鍵。

事實(shí)上,AI大模型本質(zhì)上是通過數(shù)據(jù)的訓(xùn)練,進(jìn)行歸集和表達(dá)。這意味著,如果對(duì)不同的數(shù)據(jù)進(jìn)行訓(xùn)練,便可以產(chǎn)生不同的模型。拿OpenAI來說,其就是基于底層大模型打造了“對(duì)話機(jī)器人”ChatGPT。除此之外,其還基于底層大模型打造了Dall-E“繪畫機(jī)器人”。

過去多年的一個(gè)市場(chǎng)共識(shí)是,如果要實(shí)現(xiàn)AI規(guī)模化產(chǎn)業(yè)落地,底層AI大模型就必須是一個(gè)通用的大模型平臺(tái),廠商根據(jù)用戶需求在平臺(tái)之上,進(jìn)行多場(chǎng)景、多領(lǐng)域的模型生產(chǎn),從而實(shí)現(xiàn)具體行業(yè)模型的落地。

對(duì)一眾廠商而言,這也是一個(gè)新的方向。即AI廠商以“通用模型+產(chǎn)業(yè)模型”不斷賦能企業(yè)、產(chǎn)業(yè),從而加速中國(guó)的產(chǎn)業(yè)數(shù)字化進(jìn)程。更為重要的是,這種模式一旦落地成功或?qū)⒖焖賹?shí)現(xiàn)規(guī)?;?yīng),或?qū)轭^部AI廠商帶來高回報(bào),擺脫當(dāng)下AI技術(shù)落地難,盈利難的現(xiàn)狀。

那么,AI大模型現(xiàn)在在國(guó)內(nèi)產(chǎn)業(yè)側(cè)的成長(zhǎng)如何?

一、看見AI大模型

“丫丫意識(shí)上傳550W后1.7秒月球危機(jī)就發(fā)生了。”這是電影《流浪地球2》中的一句臺(tái)詞。

這個(gè)情節(jié)背后隱藏的是,超級(jí)AI大模型下的超級(jí)智能決策。

在電影的人物設(shè)定中,馬兆、圖恒宇都是550系列智能量子計(jì)算機(jī)的研究員。圖恒宇是為了留住在車禍中去世的女兒圖丫丫,將其“意識(shí)”植入初代智能量子計(jì)算機(jī)550A升級(jí)版550C中,試圖迭代出“數(shù)字人丫丫”,但由于算力問題,不能處理過多的數(shù)據(jù),導(dǎo)致“數(shù)字人丫丫”只能迭代出2分鐘的生命。

月球危機(jī)下,圖恒宇看到了550C的升級(jí)版550W,其超強(qiáng)算力可以讓丫丫“活得更久”。于是圖恒宇偷偷將丫丫的意識(shí)植入550W。

但在植入丫丫意識(shí)的1.7秒后,計(jì)算機(jī)開始超負(fù)荷運(yùn)行,這意味著,無法啟動(dòng)地球上的發(fā)動(dòng)機(jī),“流浪地球”計(jì)劃失敗,地球毀滅。

一個(gè)決定性的轉(zhuǎn)機(jī)在電影結(jié)尾,圖恒宇在臨死前將自己的“意識(shí)”植入了550W,使得其算力正常運(yùn)行,點(diǎn)燃了發(fā)動(dòng)機(jī)。

其實(shí),在550W量子計(jì)算機(jī)的超強(qiáng)算力下,AI大模型不斷的計(jì)算、學(xué)習(xí)、訓(xùn)練,讓原本負(fù)責(zé)管理空間站的AI系統(tǒng)迭代出自主意識(shí),并為自己取名MOSS。

由于其AI系統(tǒng)的設(shè)定便是堅(jiān)定執(zhí)行延續(xù)人類文明的使命,所以當(dāng)丫丫的意識(shí)植入大模型時(shí),在550W超強(qiáng)算力加持下,極端理性的人工智能遇到了感性的丫丫,MOSS實(shí)現(xiàn)了新的進(jìn)化,感受到了人性的惡,推算出毀滅即拯救,這也就導(dǎo)致了MOSS制造出計(jì)算機(jī)負(fù)荷運(yùn)載的假象,試圖毀滅地球。

但當(dāng)圖恒宇的意識(shí)的植入大模型后,使得MOSS學(xué)習(xí)到圖恒宇與丫丫之間的愛與和平,訓(xùn)練出新的意識(shí)形態(tài),即拯救人類。

從某種意義上來說,MOSS最后拯救人類,就是“理想AI大模型”下帶來的智能決策。

實(shí)現(xiàn)路徑可以概括為,基于大量的數(shù)據(jù)集,進(jìn)行學(xué)習(xí)、訓(xùn)練之后,在空間站管理場(chǎng)景中,利用550w量子計(jì)算機(jī)的算力,將空間站場(chǎng)景數(shù)據(jù)植入,進(jìn)行二次訓(xùn)練,就可以滿足空間站的場(chǎng)景需求,MOSS就是這種需求下的產(chǎn)物。

場(chǎng)景數(shù)據(jù)喂養(yǎng)后實(shí)現(xiàn)二次訓(xùn)練的模型也可以稱之為場(chǎng)景模型。而當(dāng)丫丫、圖恒宇意識(shí),即具體場(chǎng)景任務(wù)、行為數(shù)據(jù)植入場(chǎng)景模型中時(shí),便可以給出具體智能決策。

這也是AI大模型規(guī)?;涞氐囊环N路徑。

“中國(guó)科幻需要現(xiàn)實(shí)意義?!痹趧⒋刃揽磥?,流浪地球的故事設(shè)定與現(xiàn)實(shí)科技發(fā)展存在著許多共性。

事實(shí)上,ChatGPT產(chǎn)業(yè)圖譜中,主要價(jià)值點(diǎn)有三層。一是開篇提到的ChatGPT應(yīng)用程序,將AI模型集成進(jìn)面向用戶的應(yīng)用軟件,它們或運(yùn)行著自己的模型(端到端應(yīng)用),或依賴于三方模型的API。目前來看,雖然這類應(yīng)用公司的營(yíng)收增長(zhǎng)得非???,但在留存率、產(chǎn)品差異化和毛利率上卻容易遇到瓶頸。

二是基礎(chǔ)設(shè)施提供商,如云廠商或硬件制造商,它們負(fù)載著生成式AI模型的訓(xùn)練和推理。這類廠商贏面較大,將賺取了流經(jīng)技術(shù)棧的大部分資金。以生成式AI為例,有業(yè)內(nèi)人士預(yù)測(cè),其總營(yíng)收的10%~20%將流向云服務(wù)提供商。但有這種能力的廠商屈指可數(shù),門檻高,頭部效應(yīng)明顯,競(jìng)爭(zhēng)空間極其有限。

三就是我們重點(diǎn)提到的模型提供商,致力于打造驅(qū)動(dòng)AI產(chǎn)品的底層大模型,它們要么以專有API的形式提供,要么開源提供。但絕大多數(shù)大模型廠商都還沒有實(shí)現(xiàn)大規(guī)模的商業(yè)化,屬于一片還未真正打開的戰(zhàn)場(chǎng),彎道超車機(jī)會(huì)很大。

值得注意的是,在整個(gè)AI規(guī)?;涞亓鞒讨?,最復(fù)雜的環(huán)節(jié)就是底層AI大模型的搭建。但這恰恰給AI大模型廠商帶來了新的機(jī)會(huì)。

換言之,想要實(shí)現(xiàn)AI大模型規(guī)?;漠a(chǎn)業(yè)落地,首先需要將整個(gè)落地路徑“簡(jiǎn)化”。讓AI變得“人人可用”,同時(shí)也要滿足具體場(chǎng)景、領(lǐng)域的個(gè)性化需求。

二、通用大模型+產(chǎn)業(yè)模型

底層AI大模型的研發(fā)具有數(shù)據(jù)規(guī)模大、質(zhì)量參差不齊、模型體積大、訓(xùn)練難度高、算力規(guī)模大、性能要求高等挑戰(zhàn)。這樣的高研發(fā)門檻,不利于人工智能技術(shù)在千行百業(yè)的推廣。

而具有數(shù)據(jù)、算力、算法綜合優(yōu)勢(shì)的企業(yè)可以將模型的復(fù)雜生產(chǎn)過程封裝起來,通過低門檻、高效率的生產(chǎn)平臺(tái),向千行百業(yè)提供大模型服務(wù)。

各個(gè)行業(yè)的企業(yè)只需要通過生產(chǎn)平臺(tái)提出在實(shí)際AI應(yīng)用中的具體需求,生產(chǎn)大模型的少數(shù)企業(yè)就能夠根據(jù)應(yīng)用場(chǎng)景進(jìn)一步對(duì)大模型開發(fā)訓(xùn)練,幫助應(yīng)用方實(shí)現(xiàn)大模型的精調(diào),以達(dá)到各行業(yè)對(duì)于AI模型的直接應(yīng)用。

彼時(shí),AI大模型就會(huì)真正意義上實(shí)現(xiàn)產(chǎn)業(yè)化,成為產(chǎn)業(yè)模型。

目前,國(guó)內(nèi)布局AI大模型廠商百度、阿里、騰訊、商湯、華為等企業(yè),正在不斷夯實(shí)通用大模型,打造產(chǎn)業(yè)模型,助力AI大模型產(chǎn)業(yè)化。

其中,百度以文心大模型+飛槳PaddlePaddle深度學(xué)習(xí)平臺(tái);騰訊以hun yuan大模型+太極機(jī)器學(xué)習(xí)平臺(tái);阿里以通義大模型+M6-OFA;華為以盤古大模型+ModelArts,都打造了(自然語言處理)大模型、(計(jì)算機(jī)視覺)大模型以及多模態(tài)大模型方面。

可以發(fā)現(xiàn),主要參與者大多是云廠商,正如上文所言,云基礎(chǔ)設(shè)施很有可能是AI大模型這盤棋,最終的最大獲益者。所以,大模型也成了云廠商“的必爭(zhēng)之地”

值得注意的是,各個(gè)廠商AI大模型的布局,有所差異。

百度由于多年在AI領(lǐng)域的深耕,其文心大模型涵蓋基礎(chǔ)大模型、任務(wù)大模型、行業(yè)大模型的三級(jí)體系,打造大模型總量約40個(gè),產(chǎn)業(yè)應(yīng)用也較為廣泛,例如電力、燃?xì)?、金融、航天等,?gòu)建了國(guó)內(nèi)業(yè)界較大的產(chǎn)業(yè)大模型。

目前來看,屬于國(guó)內(nèi)大模型廠商的第一梯隊(duì)中的佼佼者。

騰訊產(chǎn)業(yè)化應(yīng)用方向則主要是騰訊自身生態(tài)的降本增效,其中廣告類應(yīng)用表現(xiàn)出色。

阿里更重技術(shù),例如M6大模型基于阿里云、達(dá)摩院打造的硬件優(yōu)勢(shì),可將大模型所需算力壓縮到極致;另外其底層技術(shù)優(yōu)勢(shì)還有利于構(gòu)建AI的統(tǒng)一底層。

目前,主要應(yīng)用方向是為下游任務(wù)提質(zhì)增效,例如在淘寶服飾類搜索場(chǎng)景中實(shí)現(xiàn)了以文搜圖的跨模態(tài)搜索。

華為的優(yōu)勢(shì)則在于其訓(xùn)練出業(yè)界首個(gè)2000 億參數(shù)以中文為核心的預(yù)訓(xùn)練生成語言模型。目前發(fā)布了盤古氣象大模型、盤古礦山大模型、盤古OCR大模型三項(xiàng)較為重磅的行業(yè)大模型。

可以發(fā)現(xiàn),在商業(yè)模式上各個(gè)廠商都是通用大模型路徑,在通用大模型架構(gòu)之上,搭建具體行業(yè)模型。映射到產(chǎn)業(yè)層面,即“通用大模型+產(chǎn)業(yè)模型”的路徑。

但具體的產(chǎn)業(yè)化應(yīng)用有著較為明顯的差異。其實(shí),這與各個(gè)廠商喂養(yǎng)的數(shù)據(jù)有著極大地關(guān)系。例如華為的優(yōu)勢(shì)在G端,相對(duì)應(yīng)其在氣象、煤礦等央國(guó)企領(lǐng)域有大量服務(wù)經(jīng)驗(yàn)與數(shù)據(jù),在數(shù)據(jù)的計(jì)算、學(xué)習(xí)、訓(xùn)練下,更容易打造該產(chǎn)業(yè)的大模型。

然而,手握入場(chǎng)券,并不代表能跑到終點(diǎn)。

對(duì)于廠商而言,其可以搭建通用大模型,并不意味著其能把通用大模型搭建的好;其有能力打通大模型到產(chǎn)業(yè)模型到具體場(chǎng)景的應(yīng)用,并不意味著其可以打造出有真正價(jià)值的智能決策。

AI大模型產(chǎn)業(yè)化落地的瓶頸需要被正視。

三、“智商”堪憂

如果將產(chǎn)業(yè)模型看成一個(gè)公式:2×π+N=?

其中,公式“2×π=6.28318530718......”就是底層通用大模型,“N”則象征著具體場(chǎng)景的數(shù)據(jù)。公式“2×π+N=?”就是植入具體場(chǎng)景、領(lǐng)域數(shù)據(jù)后的產(chǎn)業(yè)模型。

在這個(gè)公式中,不難發(fā)現(xiàn)的是,π小數(shù)點(diǎn)后的數(shù)字越精確,得出的結(jié)果就越精確,最后產(chǎn)業(yè)模型下的智能決策也就越精確,相對(duì)應(yīng)的計(jì)算難度也就越大。另外“N”作為一個(gè)變量,需要收集場(chǎng)景下大量有價(jià)值的數(shù)據(jù)。

顯然,計(jì)算能力和數(shù)據(jù)集成,是AI最終做出有價(jià)值的智能決策的關(guān)鍵,即AI大模型產(chǎn)業(yè)化落地的關(guān)鍵。

對(duì)于國(guó)內(nèi)的AI大模型廠商而言,這不是一件容易的事情。

1、計(jì)算能力

在提升計(jì)算能力方面,首先比起一個(gè)人,100個(gè)人計(jì)算的效率會(huì)更高,所以計(jì)算人力數(shù)量是關(guān)鍵,人力數(shù)量對(duì)應(yīng)的則是芯片的數(shù)量;其次,計(jì)算器比紙算會(huì)更快,而Excel又比計(jì)算器效率更高,所以計(jì)算工具的性能改進(jìn)也是關(guān)鍵,對(duì)應(yīng)的則是芯片的性能。AI大模型需要在大量、高性能的芯片加持下,不斷的進(jìn)行模型訓(xùn)練,才能更加精準(zhǔn)。

目前,英偉達(dá)推出的A100/H100是目前性能最強(qiáng)的數(shù)據(jù)中心專用GPU。且市面上幾乎沒有可規(guī)模替代的方案。包括特斯拉、Facebook在內(nèi)的企業(yè),都利用A100芯片組建了AI計(jì)算集群。

根據(jù)市場(chǎng)研究顧問公司Compass Intelligence發(fā)布的AI芯片最新調(diào)研報(bào)告,全球前5大人工智能(AI)芯片企業(yè)排名依次為NVIDIA英偉達(dá)、Intel英特爾、IBM、Google、蘋果。

在性能方面,英偉達(dá)是AI大模型芯片選擇的第一順位。

值得注意的是,據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,以 ChatGPT在 1 月的獨(dú)立訪客平均數(shù) 1300 萬計(jì)算,其對(duì)應(yīng)芯片需求為 3 萬多片英偉達(dá) A100 GPU。從全球GPU的飽有量來看,擁有一萬顆GPU儲(chǔ)備的企業(yè)屈指可數(shù)。

即使有貨,但受困于美國(guó)對(duì)英偉達(dá)GPU產(chǎn)品A100和H100出口限制,目前也很難買到。

針對(duì)這一問題,英偉達(dá)為了留住難以割舍的中國(guó)市場(chǎng),推出了A100的替代A800。這是國(guó)內(nèi)廠商目前能買到的替代品。

但根據(jù)芯片經(jīng)銷商OMNISKY容天官網(wǎng)信息顯示,英偉達(dá)A800GPU數(shù)據(jù)傳輸速率為每秒400GB,傳輸速率有所下降。英偉達(dá)A100GPU傳輸速率為每秒600GB。A800數(shù)據(jù)傳輸速度降低了30%,性能明顯不高。

還有,訓(xùn)練通用大模型十分燒錢。據(jù)國(guó)盛證券報(bào)告《ChatGPT 需要多少算力》估算,GPT-3 訓(xùn)練一次的成本約為 140 萬美元,對(duì)于一些更大的 LLM(大型語言模型),訓(xùn)練成本介于 200 萬美元至 1200 萬美元之間。以 ChatGPT 3 萬多片 A100的采購(gòu)量來算,初始投入成本約為 8 億美元,每日電費(fèi)在 5 萬美元左右。

站在更大的層面看,如果要實(shí)現(xiàn)AI大模型最終的產(chǎn)業(yè)化落地,其成本將會(huì)高達(dá)幾十億甚至上百億。

根據(jù)New Street Research的一項(xiàng)估計(jì)發(fā)現(xiàn),Bing搜索中基于OpenAI的ChatGPT模型可能需要8個(gè)GPU才能在不到一秒的時(shí)間內(nèi)響應(yīng)問題。

按照這個(gè)速度,微軟將需要超過20,000臺(tái)8-GPU服務(wù)器才能將Bing中的模型部署給每個(gè)人,這表明微軟的功能可能需要40億美元的基礎(chǔ)設(shè)施支出。

燒錢、買不到大量高性能的AI芯片,制約著國(guó)內(nèi)AI大模型的計(jì)算能力。

2、數(shù)據(jù)集成管理

中外數(shù)據(jù)質(zhì)量有著巨大差異性。

IDC在一項(xiàng)有關(guān)“中國(guó)數(shù)據(jù)集成與數(shù)據(jù)質(zhì)量市場(chǎng)”調(diào)查的白皮書中指出,大部分中國(guó)企業(yè)數(shù)據(jù)集成項(xiàng)目難以達(dá)到預(yù)期的原因在于數(shù)據(jù)質(zhì)量問題。

從市場(chǎng)發(fā)展環(huán)境方面,可以看到的一些問題是。國(guó)內(nèi)企業(yè)IT系統(tǒng)大量建設(shè),數(shù)據(jù)環(huán)境較為復(fù)雜,造成數(shù)據(jù)的重復(fù)、不一致、格式混亂等問題。這些低質(zhì)量的數(shù)據(jù),即便在完成數(shù)據(jù)集成之后,得出的也可能是質(zhì)量不高的信息。

一組數(shù)據(jù)是,72%的接受調(diào)查的中國(guó)企業(yè)存在重復(fù)數(shù)據(jù),60%的企業(yè)存在不完整數(shù)據(jù)。

另外,國(guó)內(nèi)企業(yè)普遍存在跨系統(tǒng)利用數(shù)據(jù)、系統(tǒng)間數(shù)據(jù)傳遞不及時(shí)、以及業(yè)務(wù)指標(biāo)理解不一致也使得數(shù)據(jù)質(zhì)量出現(xiàn)問題。

“如果是靜態(tài)數(shù)據(jù),則要求完整、準(zhǔn)確、一致,格式規(guī)范;如果是動(dòng)態(tài)數(shù)據(jù),則要求能被及時(shí)調(diào)用,快速更新?!痹贗DC中國(guó)高級(jí)分析師劉飛認(rèn)為,這是衡量數(shù)據(jù)質(zhì)量好壞標(biāo)準(zhǔn)。

然而,在國(guó)內(nèi)由于企業(yè)數(shù)字化程度較低,甚至許多企業(yè)停留在最原始的信息化階段,導(dǎo)致標(biāo)準(zhǔn)化、規(guī)范化程度較低,集成管理困難。而在歐美,企業(yè)標(biāo)準(zhǔn)化程度高,相對(duì)應(yīng)的數(shù)據(jù)也較為標(biāo)準(zhǔn)化,數(shù)據(jù)質(zhì)量高。

數(shù)據(jù)挖掘方面,挖掘程度不同,一般國(guó)外把數(shù)據(jù)挖掘技術(shù)應(yīng)用于各個(gè)行業(yè)產(chǎn)業(yè)的過程中,建立不同的數(shù)據(jù)挖掘模型。國(guó)內(nèi)主要應(yīng)用于各個(gè)行業(yè)儲(chǔ)層評(píng)價(jià)、施工方式的選擇、生產(chǎn)指標(biāo)的預(yù)測(cè)以及各個(gè)行業(yè)系統(tǒng)的診斷。另外,國(guó)內(nèi)多專于橫截面式的數(shù)據(jù)分析。國(guó)外更注重同一批樣本量的縱向比較和追蹤研究。

在數(shù)據(jù)研究方面。由于國(guó)外注重?cái)?shù)據(jù)研究的意識(shí),國(guó)外數(shù)據(jù)治理研究主要集中在理論探索、模型框架以及實(shí)踐應(yīng)用三個(gè)方面; 國(guó)內(nèi)相比之下,技術(shù)研發(fā)的探索能力較弱一些,所以側(cè)重于理論分析尚且缺乏模型與框架等應(yīng)用研究。

在數(shù)據(jù)共享方面。國(guó)外許多國(guó)家都有很多大型的科學(xué)數(shù)據(jù)共享平臺(tái),特別是英國(guó)、美國(guó),并且許多平臺(tái)都對(duì)自己的數(shù)據(jù)有一定的質(zhì)量要求。且國(guó)外企業(yè)之間也有著良好的數(shù)據(jù)生態(tài)。

目前國(guó)內(nèi)的數(shù)據(jù)共享平臺(tái)發(fā)展還不夠成熟,國(guó)內(nèi)主要的數(shù)據(jù)平臺(tái)是中科院科學(xué)數(shù)據(jù)共享工程中開發(fā)的多個(gè)學(xué)科數(shù)據(jù)共享平臺(tái)。且企業(yè)之間數(shù)據(jù)生態(tài)并沒有像國(guó)外那么開放。

較為混亂的數(shù)據(jù)環(huán)境、缺乏數(shù)據(jù)深度和整體性研究以及數(shù)據(jù)生態(tài)的不成熟等問題,使得國(guó)內(nèi)產(chǎn)業(yè)數(shù)據(jù)在質(zhì)量、數(shù)量上普遍存在一些問題,導(dǎo)致場(chǎng)景無法真正實(shí)現(xiàn)數(shù)字化,且在短時(shí)間內(nèi),無法通過技術(shù)、管理手段迅速改善。比起歐美國(guó)家,仍有很長(zhǎng)一段路要走。

總結(jié)來看,以目前國(guó)內(nèi)AI大模型的計(jì)算能力以及數(shù)據(jù)集成管理能力,其最后產(chǎn)業(yè)化落地的智能預(yù)測(cè)很有可能價(jià)值點(diǎn)較低。即使做出語音交互機(jī)器人,可能也并不“聰明”。

但即使是這樣,我們?nèi)孕杩吹紸I 大模型對(duì)中國(guó)產(chǎn)業(yè)發(fā)展的巨大意義。

四、在中國(guó),談?wù)揂I模型的必要性

“以數(shù)據(jù)為關(guān)鍵要素,以價(jià)值釋放為核心,以數(shù)據(jù)賦能為主線,對(duì)產(chǎn)業(yè)鏈上下游的全要素?cái)?shù)字化升級(jí)、轉(zhuǎn)型和再造的過程”這是產(chǎn)業(yè)數(shù)字化的官方定義。

簡(jiǎn)單來說,產(chǎn)業(yè)數(shù)字化的前提就是讓數(shù)據(jù)從資源化奔向資產(chǎn)化。

好比煤炭、石油、天然氣等,只有少量存儲(chǔ)則不可能被稱做資源,只有在規(guī)模足夠大,具有使用價(jià)值之后,才會(huì)被稱做資源。

后期則需要對(duì)其進(jìn)行開采和加工,自然需要組織、制度、流程等來保證工作的有序運(yùn)轉(zhuǎn),并使資源轉(zhuǎn)化為資產(chǎn)。這時(shí),煤炭、石油、天然氣的價(jià)值才能釋放出來。

數(shù)據(jù)資源也是同樣的道理。當(dāng)數(shù)據(jù)資源達(dá)到一定規(guī)模,就需要組織對(duì)其進(jìn)行開發(fā)和利用,成為數(shù)據(jù)資產(chǎn),釋放其價(jià)值。

在當(dāng)下的大數(shù)據(jù)時(shí)代,企業(yè)愈發(fā)重視數(shù)據(jù)的采集,這其中不乏一些企業(yè)擁有龐大且豐富的數(shù)據(jù)集。然而,國(guó)內(nèi)企業(yè)大規(guī)模數(shù)據(jù)的開發(fā)和利用的鏈路十分復(fù)雜,普遍面臨數(shù)據(jù)“用不起來”和“用不好”的問題。

但AI大模型本身對(duì)應(yīng)的就是數(shù)據(jù)的高度歸集和表達(dá),其就像一條快速通道,高度歸集代表入口,表達(dá)則是出口,讓數(shù)據(jù)從生產(chǎn)到消費(fèi)的路徑變得簡(jiǎn)單,數(shù)據(jù)可以便捷、快速地進(jìn)行開發(fā)和利用,釋放數(shù)據(jù)的價(jià)值。

加之,在AI大模型+產(chǎn)業(yè)模型下,大模型可以實(shí)現(xiàn)具體場(chǎng)景、領(lǐng)域數(shù)據(jù)的學(xué)習(xí)、訓(xùn)練。所以在產(chǎn)業(yè)具體場(chǎng)景下的數(shù)據(jù)將更有價(jià)值,即更加貼合場(chǎng)景需求,可以直擊場(chǎng)景痛點(diǎn)。

可以預(yù)見,隨著產(chǎn)業(yè)模型的落地,將使得企業(yè)數(shù)據(jù)價(jià)值得到最大釋放,實(shí)現(xiàn)企業(yè)數(shù)字化轉(zhuǎn)型、再造,加速產(chǎn)業(yè)數(shù)字化滲透,推動(dòng)產(chǎn)業(yè)數(shù)字化歷程。

另外,AI大模型的隨著時(shí)間的推移,廠商的利潤(rùn)將越來越高。

根據(jù)相關(guān)機(jī)構(gòu)預(yù)測(cè),至2030年為止,AI訓(xùn)練成本將持續(xù)以每年70%的速度降低。

舉例來說,要將一款大型語言模型訓(xùn)練至GPT-3 (Generative Pre-trAIned Transformer 3,生成型預(yù)訓(xùn)練變換模型-3)等級(jí),2020年得花費(fèi)近460萬美元,2022年驟降至45萬美元,成本節(jié)約近90%。

這對(duì)于以往落地難、盈利難的AI廠商而言,無疑是一塊巨大的蛋糕??梢姡诮?jīng)營(yíng)者,于使用者,于產(chǎn)業(yè)發(fā)展,AI大模型的布局極其重要。

除此之外,在國(guó)家層面,AI大模型在今年兩會(huì)上亦被提上了新高度。

“ChatGPT之所以引起關(guān)注,在于它是一個(gè)大模型,對(duì)應(yīng)大數(shù)據(jù)、強(qiáng)計(jì)算、好算法。踢足球都是盤帶、射門,但要做到梅西那么好也不容易......要達(dá)到ChatGPT的效果,可能還有工作要做?!?/p>

科技部部長(zhǎng)王志剛希望國(guó)內(nèi)的科研院所、企業(yè)、廣大科研人員能有進(jìn)一步發(fā)展和進(jìn)步。

而這是他第二次談及AI大模型。

總體來看,AI大模型已然成為各個(gè)國(guó)家、企業(yè)發(fā)展的戰(zhàn)略要地。已經(jīng)到了不得不重視的地步。

寫在最后

回歸技術(shù)本質(zhì)來看,ChatGPT不是一個(gè)新鮮的事物,AI大模型更不是一個(gè)突破性的技術(shù),但ChatGPT卻讓其實(shí)現(xiàn)了現(xiàn)象級(jí)的爆發(fā),在當(dāng)下AI大模型風(fēng)口下,我們是否應(yīng)該思考一些更加深刻的問題,除了軟硬件、技術(shù),中國(guó)式AI到底缺少什么?或許這才是問題的根源。

技術(shù)更迭,已不是壁壘,國(guó)產(chǎn)式AI需要的是產(chǎn)品的創(chuàng)新思維,以及對(duì)需求的產(chǎn)品變現(xiàn)能力。這種亟需具備的特質(zhì),適用于所有領(lǐng)域。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。