文|適道
Gary Marcus曾開過一個(gè)玩笑:“幾年前,如果你的初創(chuàng)公司域名中有.ai,那么你可以在你的估值后面加一個(gè)零?,F(xiàn)在呢,可能會(huì)是兩個(gè)零,尤其當(dāng)你說自己正在用生成式AI?!?/p>
這句話道出了行業(yè)的最大疑慮——就目前來看,生成式人工智能是被過度炒作了嗎?
今年10月,全球科技研究和咨詢公司CCS Insight發(fā)布預(yù)測報(bào)告稱:2023年大熱的生成式人工智能領(lǐng)域?qū)⒃?024年接受現(xiàn)實(shí)的檢驗(yàn)。具體表現(xiàn)為:技術(shù)炒作逐漸消退,運(yùn)行成本不斷上升,監(jiān)管呼聲越來越多,投資人不再像之前那樣興奮和樂觀。
近期,比爾.蓋茨在接受德國《商報(bào)》(Handelsblatt)采訪時(shí)也表示:“OpenAI內(nèi)部包括Atlman在內(nèi)的很多人,都相信GPT-5將明顯優(yōu)于GPT-4。但我有很多理由相信當(dāng)前生成式人工智能已經(jīng)達(dá)到極限?!?/p>
人們傾向于在短期內(nèi)高估一項(xiàng)技術(shù)的效果,并在長期低估其效果?,F(xiàn)在誰都知道生成式AI尚處在“尷尬的青春期”,但對(duì)這個(gè)青春期要持續(xù)多久,什么時(shí)候轉(zhuǎn)變,還不是非常清晰。
而對(duì)于早期投資者而言,能夠準(zhǔn)確判斷轉(zhuǎn)機(jī)至關(guān)重要。
前幾日,“華爾街TMT之王”美國對(duì)沖基金Coatue發(fā)布了一份115頁的報(bào)告(The AI Revolution),360度無死角分析了當(dāng)前AI所處的階段、AI能否跨越炒作周期、開源和閉源、以AI為中心的生態(tài)系統(tǒng)等等。
其中,Coatue明確指出:AI不是炒作,關(guān)于AI的黃金時(shí)代還沒有到來。
一直以來,Coatue對(duì)AI都寄予厚望。在今年6月發(fā)布的Investor Deck中,Coatue進(jìn)一步指出衰退時(shí)代已經(jīng)來了,但同時(shí)指出下一個(gè)科技超級(jí)周期的“突破”時(shí)刻:AI可能成為經(jīng)濟(jì)新的生命線。
而多年來,這家頭部基金在應(yīng)對(duì)不同周期的實(shí)際策略和對(duì)宏觀的理解也超過大多數(shù)同行,穩(wěn)穩(wěn)地把控著科技行業(yè)的脈絡(luò)。
例如2020年,全球疫情最糟糕的情況下,Coatue Management的創(chuàng)立者Philippe Laffont 憑借精準(zhǔn)的投資眼光,成為全球十大對(duì)沖基金經(jīng)理第七名。
2022年,在美國大通脹、未盈利科技股大幅下跌的時(shí)刻,Coatue提前謀劃回撤,騰出了近80%的現(xiàn)金。
這份115頁的報(bào)告更是信息量滿滿,適道將從中截取的關(guān)鍵信息,進(jìn)行整合。
01 2024年,AI炒作會(huì)結(jié)束?
首先,Coatue對(duì)AI的發(fā)展現(xiàn)狀給出了一個(gè)清晰的定位。
新技術(shù)在美國達(dá)到50%用戶滲透率的時(shí)間對(duì)比,PC用了20年,互聯(lián)網(wǎng)用了12年,智能手機(jī)用了6年,而生成式AI大概只用3年。
另一個(gè)對(duì)比:1986年,S&P 500公司創(chuàng)造$1m收入要雇傭約7.8人,現(xiàn)在是5.1人,而未來在AI時(shí)代,這個(gè)數(shù)字會(huì)少于3人。
在此背景下,Coatue于22/23年迅速擴(kuò)大了AI投資組合。其中就包括最近陷入風(fēng)波的 Stability AI 。據(jù)悉,Coatue Management寫信要求其創(chuàng)始人Mostaque 下臺(tái),并要求公司還要求提供 Mostaque 和其他高管的薪酬細(xì)節(jié)。
接著,報(bào)告進(jìn)入了第一個(gè)主題:AI是炒作嗎?
炒作有三大特征:1、入賬價(jià)值與投資不符,1990年代的光纖;2、高估技術(shù)發(fā)展的時(shí)間和能力,自動(dòng)駕駛;3、技術(shù)尚未成熟導(dǎo)致缺乏普遍的實(shí)用性,量子計(jì)算。
Coatue針對(duì)以上三點(diǎn)分別進(jìn)行回?fù)簦鞔_指出AI不是炒作。
一、大多數(shù) AI 投資都聚焦在模型層面(占比60%),入賬價(jià)值已經(jīng)顯現(xiàn);
不過,對(duì)于誰才是大模型的贏家,Coatue特意在報(bào)告中用了一頁ppt表示:我也不知道。。。
雖然,今年年中ChatGPT訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。至于未來情況如何,我們拭目以待。
二、比起從“L1——L4”花費(fèi)15年的“燒錢黑洞”自動(dòng)駕駛,在過去的5年間,AI 已經(jīng)表現(xiàn)出了自己的有效性,例如現(xiàn)在AI autopilots已經(jīng)能夠自主完成復(fù)雜任務(wù),大概達(dá)到了自動(dòng)駕駛L3的水平。即便處于早期階段,但有60%的企業(yè)都計(jì)劃采用AI。
而且,在基準(zhǔn)測試中,未來模型達(dá)到與人類水平的時(shí)間正在縮短。這點(diǎn)大家從ChatGPT3.5“小學(xué)生”和4.0“博士生”呈現(xiàn)出的巨大差異就能發(fā)現(xiàn)。
三、目前量子計(jì)算空有理論,甚至還沒有被證實(shí),但AI 已在各個(gè)領(lǐng)域證明了其實(shí)用性,例如開發(fā)人員使用CopilotGithub節(jié)省了55%時(shí)間;在 Runway 上編輯視頻節(jié)約了90%的時(shí)間等等。
一家名為的Finicch 公司,使用AI 的客服節(jié)省了95%的人工成本;將回復(fù)時(shí)間從45分鐘降至1分鐘;客戶滿意度從55%提高至69%。
另外,咨詢等知識(shí)型工作也會(huì)被 AI 改變。研究顯示,BCG 的顧問在使用 AI 后所有任務(wù)都表現(xiàn)更佳,工作質(zhì)量提高了 40%。
總體來看,Coatue認(rèn)為AI技術(shù)演進(jìn)日新月異,企業(yè)和民眾采用意愿積極,且AI已經(jīng)在一些領(lǐng)域切實(shí)地提升了生產(chǎn)力。因此,AI不是一場炒作。
總體來看,目前支持“AI炒作論”的聲音主要分三種:1、智能化程度不夠,以至于2023年勢頭太猛,需要洗個(gè)“冷水澡”;2、投資人不想花錢,運(yùn)行成本太高,畢竟連微軟的GitHub Copilot都在虧;3、監(jiān)管問題——懸在AI頭上的“達(dá)摩克利斯之劍”。
適道認(rèn)為:首先,與其說2024年AI會(huì)涼,不如說熱錢退潮期,一些產(chǎn)品匹配不上市場預(yù)期,沒有技術(shù)護(hù)城河的AI企業(yè)會(huì)涼,最多只算公司層面上的“炒作”(在此反復(fù)“鞭尸”Jasper),完全稱不上整個(gè)行業(yè)的炒作。
其次,算力成本過高其實(shí)是一個(gè)短期問題,畢竟任何新事物剛出現(xiàn)時(shí)成本都會(huì)很高,包括互聯(lián)網(wǎng)。就目前來看,可以通過優(yōu)化算法底層降低成本?,F(xiàn)在有許多開源的大型模型,發(fā)布了新的優(yōu)化方法,大家都在通過各種各樣的方法將訓(xùn)練微調(diào)模型的成本降到最低。
對(duì)于目前來看不那么容易“降本”的硬件。借用馬斯克的一句話:“英偉達(dá)不會(huì)永遠(yuǎn)在大規(guī)模訓(xùn)練和推理芯片市場占據(jù)壟斷地位?!?/p>
如今,六大門派正在圍攻英偉達(dá)的光明頂。前有英特爾、AMD等半導(dǎo)體巨頭公布新一輪的AI芯片研發(fā)計(jì)劃,后有OpenAI、微軟等下游客戶推動(dòng)自研芯片,自己做“鏟”自己挖。從國內(nèi)來看,也有 4-5 家企業(yè)卷在芯片的賽道里。甚至有業(yè)內(nèi)人士樂觀估計(jì):“AI芯片賽道會(huì)在年底再度爆發(fā),芯片危機(jī)最快會(huì)在明年解決?!?/p>
長期來看,根據(jù)萊特定律,AI相關(guān)計(jì)算單元(RCU)的生產(chǎn)成本和軟件成本將分別以每年57%和47%的速度下降。到2030年,硬件和軟件的融合可以使AI培訓(xùn)成本以每年70%的速度下降,生成式AI將創(chuàng)造數(shù)百萬億美元的經(jīng)濟(jì)價(jià)值。
降本的同時(shí)是增效。根據(jù)ARK的研究,2030年生成式AI將使知識(shí)工作者的生產(chǎn)力提高4倍以上。在100%采用AI的情況下,全球勞動(dòng)生產(chǎn)率將提高約200萬億美元。諸如Copilot等AI編碼助手在2030年可以使軟件工程師的產(chǎn)出增加10倍左右。
無論是現(xiàn)在還是未來,AI都完全稱不上一個(gè)“炒作”產(chǎn)物。
那么現(xiàn)在就只剩下了監(jiān)管問題。
對(duì)此,Coatue在報(bào)告明確表達(dá)了擔(dān)憂。在調(diào)查中,有83%的受訪者不信任AI安全,甚至有57%的受訪者支持此前的“暫停AI開發(fā)6個(gè)月”倡議。但根據(jù)斯坦福的研究,目前大部分AI模型不符合EU AI Act的要求。
今年11月初,首屆全球人工智能(AI)安全峰會(huì)在英國召開,包括中國、美國、英國和歐盟在內(nèi)的超25個(gè)國家代表,以及馬斯克、Sam Altman等科技巨頭與會(huì),最終參會(huì)所有成員國簽署《布萊切利宣言》,同意通過國際合作,建立人工智能(AI)監(jiān)管方法。
02 開源好還是閉源香?
對(duì)此,Coatue認(rèn)為開源是AI的心臟,且開放社區(qū)生態(tài)對(duì)AI的下一步發(fā)展至關(guān)重要——“AI is built in th open”。同時(shí)AI社區(qū)的開發(fā)者正在迅猛增長,軟件開發(fā)人員變成AI工程師,業(yè)余愛好者也參與其中。
但盡管如此,目前不同的AI模型開放程度不同。
Coatue認(rèn)為,在此背景下,數(shù)據(jù)就變成了一種貨幣,Reddit和X都已經(jīng)為訓(xùn)練數(shù)據(jù)讀取收費(fèi)。Reddit對(duì)5000 萬次API調(diào)用收取12000美元;X則是每月5000 美元可以刷100 萬篇帖子。
盡管如此,Coatue發(fā)現(xiàn)開源模型的水平也在迅速追趕閉源模型,藍(lán)色是開源,綠色是閉源。
其實(shí)對(duì)于開源和閉源之爭,適道在這里引用中科院院士、CCF開源發(fā)展委員會(huì)主任王懷民教授的一段話:在一個(gè)確定性的時(shí)代,比如確定性PC時(shí)代,微軟以它的企業(yè)組織模式封閉推進(jìn)一個(gè)產(chǎn)品的開發(fā),我們稱為單性繁殖,每個(gè)新的產(chǎn)品都由微軟定義,這種模式在應(yīng)對(duì)確定性的發(fā)展態(tài)勢的時(shí)候它是有競爭力的,個(gè)人計(jì)算機(jī)的發(fā)展是微軟的成功。
但是在互聯(lián)網(wǎng)時(shí)代到來時(shí),在一個(gè)不確定性的互聯(lián)網(wǎng)時(shí)代要適應(yīng)可能性,開源競爭力就強(qiáng)了,開源Linux這個(gè)社區(qū)發(fā)布一個(gè)核心版本,更多人在這個(gè)核心版本上根據(jù)他對(duì)需求和領(lǐng)域的理解進(jìn)行不斷地修改,形成了雙性繁殖,能夠產(chǎn)生或者低成本產(chǎn)生更多的適應(yīng)未來發(fā)展的新版本,就是有一個(gè)種子復(fù)制,大家都可以復(fù)制,根據(jù)自己對(duì)未來變化的理解產(chǎn)生一個(gè)新版本,開源出來來適應(yīng)一個(gè)環(huán)境,由環(huán)境來評(píng)價(jià),然后再迭代回來不斷地開發(fā),而這個(gè)新版本并不是由一家企業(yè)完成的,是由全社會(huì)參與者,當(dāng)然也包括一些新的創(chuàng)新企業(yè)在其中推動(dòng)這個(gè)工作。因此它產(chǎn)生適應(yīng)未來不確定性的新版本的參與的人數(shù)和對(duì)于參與者來講的成本相對(duì)于過去微軟的一家大公司的組織模式成為了一個(gè)模式。開源在不確定性的時(shí)代更加有競爭力?!?/p>
如今我們又站在了一個(gè)不那么確定的人工智能時(shí)代,開源更多是一個(gè)創(chuàng)新方向。而開源與閉源的競爭,并不是在某一個(gè)領(lǐng)域,而是各自走出一條差異化的道路,迎來自己的天地。
但就初創(chuàng)企業(yè)的角度來講,閉源大模型顯然更具商業(yè)價(jià)值。有觀點(diǎn)認(rèn)為:模型的的商業(yè)化盡頭是產(chǎn)業(yè),而大模型走向產(chǎn)業(yè),落地還是要靠閉源。
不過,如果已經(jīng)有了例如 Llama 2這樣強(qiáng)大的開源大模型,還有人愿意用閉源嗎?
有,但大家想用的一定是“卷王之王”。
例如ChatGPT,在 Llama 2(水平類似ChatGPT 3.5)已經(jīng)發(fā)布的背景下,如上文所述,即便今年年中訪問量有所下降,但在推出新功能后,其使用量比8月份增長了27%。
也就是說,一些本就占據(jù)優(yōu)勢的企業(yè)才能成為“閉源之王”,它們?cè)趯?shí)現(xiàn)大型模型的全面商業(yè)化和產(chǎn)業(yè)化方面也更具有優(yōu)勢。對(duì)此,其他企業(yè)還是不必“死磕”閉源大模型,畢竟數(shù)據(jù)都變成貨幣了,多刷點(diǎn)帖子又要給馬斯克添錢了。
03 以AI為中心的生態(tài)系統(tǒng)
在這部分,Coatue提出了一個(gè)新范式:CPU+Software=計(jì)算機(jī)——Gpu+AI=人類大腦
Coatue認(rèn)為,AI將開創(chuàng)“智能即服務(wù)IQaas”時(shí)代。
在提升模型性能方面,Coatue著重提出了數(shù)據(jù)的重要性,包括數(shù)據(jù)質(zhì)量、數(shù)據(jù)數(shù)量、數(shù)據(jù)稀缺性、優(yōu)化微調(diào)方法都會(huì)成為關(guān)鍵因素。
具體來看:
1、訓(xùn)練數(shù)據(jù)集中的 token 數(shù)量呈上升趨勢,訓(xùn)練模型的前提是增加數(shù)據(jù)集;
2、到2026年,高質(zhì)量文本數(shù)據(jù)可能很快耗盡,而圖像和視頻數(shù)據(jù)可以維持到2024年,數(shù)據(jù)稀缺性可能成為訓(xùn)練模型時(shí)的一項(xiàng)潛在障礙;
3、數(shù)據(jù)質(zhì)量和數(shù)量同樣重要,有證據(jù)表明,在精簡過的數(shù)據(jù)集上進(jìn)行訓(xùn)練,會(huì)達(dá)到與在完整數(shù)據(jù)集上訓(xùn)練相似甚至更好的效果;
4、合成生成的數(shù)據(jù)有助于清洗、提煉數(shù)據(jù)集,以便進(jìn)行微調(diào),盡管目前仍然無法與真實(shí)數(shù)據(jù)相媲美。
另外,通過用戶反饋數(shù)據(jù)改進(jìn)模型也是一條有效的優(yōu)化之路,以Midjourney為例。
在后面一部分,Coatue認(rèn)為對(duì)GPU的需求才剛剛開始。
同時(shí),Coatue預(yù)測到2026年將會(huì)帶來超過50%的新增能源需求,并會(huì)給云市場的增長和半導(dǎo)體行業(yè)帶來大量機(jī)會(huì)。
不過,在邊緣設(shè)備上運(yùn)行 AI 模型可能有助于緩解 GPU 短缺問題。比如Apple 芯片本地模型運(yùn)行的速度與 GPU 上運(yùn)行居然一樣快。
最后,Coatue提出了一個(gè)問題:AI到底是現(xiàn)有巨頭的游戲還是 AI 原生挑戰(zhàn)者的游戲?并得出結(jié)論:先發(fā)制人的現(xiàn)有企業(yè) > AI 原生企業(yè) > 落后的現(xiàn)有企業(yè)
與此同時(shí),Coatue用 Character AI 舉例指出AI初創(chuàng)企業(yè)的突破之路:像互聯(lián)網(wǎng)前輩那樣開創(chuàng)新模式。帶著各領(lǐng)域還沒解決的問題,在未來AI有望解鎖更多殺手級(jí)應(yīng)用。
04 Coatue觀點(diǎn):最好的AI還沒到來
收尾部分,Coatue做了一些總結(jié):
1、英語會(huì)成為未來的編程語言。
2、邊緣AI設(shè)備會(huì)被廣泛應(yīng)用,口袋大模型指日可待。
3、擴(kuò)展AI模型會(huì)是一項(xiàng)工程挑戰(zhàn),自GPT-3 發(fā)布以來,OpenAI 的工程師數(shù)量增加了 3倍多。
4、私有數(shù)據(jù)會(huì)解鎖更多的使用場景。生物技術(shù)領(lǐng)域出現(xiàn)個(gè)性化醫(yī)療;NETFLIX會(huì)按需定制節(jié)目;電商平臺(tái)成為AI購物管家;人人都能成為工程師等等。
5、多模態(tài)大模型是前沿創(chuàng)新方向,基礎(chǔ)架構(gòu)會(huì)有新的發(fā)展。例如,今年10月,斯坦福大學(xué)提出新架構(gòu):Monarch Mixer,無需Attention,有望成為Transformer的替代者等等。如果一旦實(shí)現(xiàn),真如Coatue在第一部分所提出的:Open AI還會(huì)是大模型最終贏家嗎?