文|定焦(dingjiaoone) 黎明
編輯|方展博
中國(guó)的大模型創(chuàng)業(yè)很火,但有些公司可能跑偏了。
“百模大戰(zhàn)”這半年,大大小小的科技公司,都推出了自己的大模型。仿佛不發(fā)布一個(gè)大模型,就不配坐上通往AI時(shí)代的列車。
這造成一種現(xiàn)象:高度雷同,同質(zhì)競(jìng)爭(zhēng)。大家一蜂窩撲上來(lái),重復(fù)造輪子。
11月15日在深圳舉行的西麗湖論壇上,百度董事長(zhǎng)兼CEO李彥宏發(fā)表演講時(shí)表示,他看到很多企業(yè)對(duì)大模型的本質(zhì)理解不深,被各種說(shuō)法忽悠,都想去自己搞個(gè)基礎(chǔ)模型,或者按照網(wǎng)上傳播的評(píng)測(cè)方法去挑選一款評(píng)分高的大模型,就以為這是擁抱AI了。
“殊不知大模型本身不僅不產(chǎn)生任何價(jià)值,還造成了對(duì)公司資源、社會(huì)資源的巨大浪費(fèi)?!?/p>
金沙江創(chuàng)投主管合伙人朱嘯虎近期也說(shuō)過(guò),今年上半年有一波AI的虛火,大家天天在講大模型。投資人FOMO,投了很多大模型,現(xiàn)在都后悔了。他認(rèn)為明年下半年大部分創(chuàng)業(yè)者會(huì)出局。
大模型創(chuàng)業(yè),方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。
跟風(fēng)搞大模型,AI創(chuàng)業(yè)的歧路
都知道大模型很重要,問題是,我們到底需要多少個(gè)大模型?
在15日的演講中,李彥宏引用公開數(shù)據(jù)說(shuō),截止10月份國(guó)內(nèi)已經(jīng)發(fā)布了238個(gè)大模型,而6月份的時(shí)候這個(gè)數(shù)字是79個(gè),相當(dāng)于4個(gè)月就翻了3倍。
平均下來(lái),每天至少有一個(gè)大模型面世。
200多個(gè)大模型,看似很多,實(shí)際差異很小,大家本質(zhì)都差不多。其中,還有一些是“套殼”——在Llama開源模型的基礎(chǔ)上訓(xùn)練而來(lái)。比如零一萬(wàn)物的Yi系列大模型,最近就被質(zhì)疑完全使用LLama架構(gòu),卻對(duì)外宣稱“原創(chuàng)”。
相對(duì)之下,美國(guó)作為大模型的發(fā)源地,也只有上十個(gè)大模型。
大模型不是越多越好,我們不需要那么多大模型,最終這些大模型也不會(huì)全部活下來(lái)。
李彥宏認(rèn)為,大模型可以被視為AI時(shí)代的操作系統(tǒng),是各類原生應(yīng)用的基礎(chǔ)底座。他做了一個(gè)類比:縱觀互聯(lián)網(wǎng)發(fā)展史,不論是PC時(shí)代,還是移動(dòng)互聯(lián)網(wǎng)時(shí)代,操作系統(tǒng)都只剩下少數(shù)幾個(gè)——PC是Windows系統(tǒng),移動(dòng)時(shí)代是安卓和iOS。
那么同理,大家普遍認(rèn)為,最終能活下來(lái)的通用大模型,也會(huì)是個(gè)位數(shù)級(jí)別。這意味著,國(guó)內(nèi)一股腦冒出來(lái)的200多個(gè)大模型,絕大部分都是炮灰。
一家AI設(shè)計(jì)公司的創(chuàng)始人對(duì)「定焦」說(shuō),大模型是一種基礎(chǔ)設(shè)施建設(shè),需要集中力量辦大事,投入產(chǎn)出比才最高,生態(tài)里的各種人匯集在平臺(tái)上,就會(huì)形成平臺(tái)效應(yīng)和規(guī)模效應(yīng)。
不是所有公司都能成為基礎(chǔ)設(shè)施般的存在,這與野心無(wú)關(guān),而與能力有關(guān)。要做出一款好用、可用的大模型,技術(shù)門檻和成本門檻極高。
OpenAI潛心研發(fā)這么多年,背靠微軟的支持,投入數(shù)十億美金,才取得今天的成績(jī)。國(guó)內(nèi)的百度、華為、阿里等互聯(lián)網(wǎng)大廠,也是因?yàn)橛羞^(guò)去多年的積累,今天才能快速跟上潮流。那些跟風(fēng)入場(chǎng)、從零起步的創(chuàng)業(yè)公司,想要自研一款通用大模型,難度可想而知。
即便技術(shù)實(shí)力過(guò)關(guān),或者借用開源方案,訓(xùn)練模型的成本也讓很多公司吃不消。訓(xùn)練一遍,耗資幾百萬(wàn)人民幣,不在少數(shù)。關(guān)鍵是,訓(xùn)練出來(lái)的模型本質(zhì)上不是原創(chuàng),也沒什么人使用。
按照李彥宏的說(shuō)法,“國(guó)內(nèi)有200多個(gè)大模型,很多上了這個(gè)榜單、那個(gè)排名,其實(shí)都沒有什么使用量。”他認(rèn)為,“重復(fù)造輪子其實(shí)是對(duì)社會(huì)資源的極大浪費(fèi)?!?/p>
有一些公司劍走偏鋒,想從頭訓(xùn)練自己的專用大模型,這樣成本可控。但李彥宏認(rèn)為,這樣煉出來(lái)的大模型是沒有智能涌現(xiàn)能力的。因?yàn)橹挥袇?shù)規(guī)模足夠大,算法、數(shù)據(jù)訓(xùn)練都做對(duì)的時(shí)候,并且能夠持續(xù)投入,不斷迭代,才能夠產(chǎn)生智能涌現(xiàn),大模型才具有觸類旁通的能力。
做不了通才,又成不了專才,就沒有核心競(jìng)爭(zhēng)力。
“今天你推出一個(gè)大模型,花錢打了榜,有很多人用,可能明天就有個(gè)新的模型迅速替代掉。”另一家人工智能公司的創(chuàng)始人對(duì)「定焦」說(shuō)。
所以,一些跟風(fēng)搞大模型創(chuàng)業(yè)者,跑偏了。
創(chuàng)業(yè)者真正的機(jī)會(huì)
如果不做通用大模型,創(chuàng)業(yè)者應(yīng)該做什么?
李彥宏的答案是:AI原生應(yīng)用?!癆I原生時(shí)代,我們需要的不是100個(gè)所謂的大模型,而是100萬(wàn)量級(jí)的AI原生應(yīng)用。”他說(shuō)。
互聯(lián)網(wǎng)歷史上的幾波創(chuàng)業(yè)潮,漲潮的標(biāo)志性事件,都是原生應(yīng)用的爆發(fā)。距離我們最近的移動(dòng)互聯(lián)網(wǎng),是由iPhone手機(jī)掀起的,業(yè)內(nèi)公認(rèn)的起點(diǎn)是2010年。
但事實(shí)上,初代iPhone在2007年就誕生了,一直到三年后,具有劃時(shí)代意義的iphone 4發(fā)布,手機(jī)行業(yè)才整體進(jìn)入智能化時(shí)代。iphone 4除了亮眼的外觀設(shè)計(jì),最大的貢獻(xiàn)是搭建了系統(tǒng)生態(tài),讓無(wú)數(shù)開發(fā)者創(chuàng)造了大量原生應(yīng)用,由此開啟了創(chuàng)業(yè)者的黃金年代。
過(guò)去十多年,互聯(lián)網(wǎng)行業(yè)最成功的公司、最亮眼的產(chǎn)品、最明星的創(chuàng)業(yè)者,都集中在應(yīng)用層。微信、抖音、美團(tuán)、滴滴,都是從零開始成為超級(jí)應(yīng)用。
李彥宏認(rèn)為,人類進(jìn)入AI時(shí)代的標(biāo)志,是出現(xiàn)大量的AI原生應(yīng)用,而不是出現(xiàn)大量的大模型?;诨A(chǔ)大模型開發(fā)出來(lái)的應(yīng)用,才是模型存在的意義。
AI原生應(yīng)用,就是基于大模型智能涌現(xiàn)后產(chǎn)生的理解、生成、邏輯和記憶四大核心能力開發(fā)出來(lái)的應(yīng)用。這些能力是過(guò)去的時(shí)代所不具備的,能解決過(guò)去解決不了或解決不好的問題,因而才能打開無(wú)限的創(chuàng)新空間。
那么,AI原生應(yīng)用進(jìn)展如何?
答案是尚未爆發(fā)。
國(guó)內(nèi)的AI原生應(yīng)用屈指可數(shù)。9月初,國(guó)內(nèi)才開放第一批大模型備案,允許公開注冊(cè)使用,此前都只能內(nèi)測(cè)。百度的文心一言APP第一批上線,迅速登頂手機(jī)應(yīng)用商店排行榜。11月1日,百度正式上線文心一言專業(yè)版,開啟訂閱收費(fèi),每月59.9元。這是國(guó)內(nèi)首個(gè)采用會(huì)員模式面向C端收費(fèi)的大模型產(chǎn)品。
國(guó)外的進(jìn)展更快一些,AI原生應(yīng)用的數(shù)量已經(jīng)有上千個(gè)。據(jù)應(yīng)用商店監(jiān)測(cè)平臺(tái)Sensor Tower的數(shù)據(jù),美國(guó)市場(chǎng)貢獻(xiàn)了55%的AI應(yīng)用總收入,歐洲市場(chǎng)占20%,包括中國(guó)在內(nèi)的其他市場(chǎng),加起來(lái)只占比25%。
10個(gè)大模型里找不出1個(gè)應(yīng)用,這就是中國(guó)大模型創(chuàng)業(yè)的現(xiàn)狀。
對(duì)于創(chuàng)業(yè)者而言,必須要考慮清楚,是去跟風(fēng)砸錢做基礎(chǔ)大模型,還是做大模型在垂直行業(yè)的精調(diào),抑或是基于大模型打造新的應(yīng)用。
在李彥宏看來(lái),直到今天,不論中國(guó)還是美國(guó),最好的AI原生應(yīng)用還沒出現(xiàn)。這恰恰就是創(chuàng)業(yè)者千載難逢的機(jī)會(huì)。
是時(shí)候?qū)ふ冶顟?yīng)用了
中國(guó)的AI原生應(yīng)用發(fā)展緩慢,不是中國(guó)創(chuàng)業(yè)者不努力,而是起步晚了。
大模型創(chuàng)業(yè)分為三大類:一是做基礎(chǔ)大模型,二是做行業(yè)大模型,三是基于前兩類大模型開發(fā)應(yīng)用。
在中國(guó),基礎(chǔ)大模型和應(yīng)用層的創(chuàng)業(yè),幾乎是同步展開的。去年底ChatGPT火了之后,中國(guó)的創(chuàng)業(yè)者一方面研發(fā)基礎(chǔ)大模型,同時(shí)也嘗試AI原生應(yīng)用的各種可能性。但基礎(chǔ)模型不成熟,意味著應(yīng)用層發(fā)展所倚賴的條件不具備。
大半年的“軍備競(jìng)賽”之后,一些頭部的大模型廠商脫穎而出?;ヂ?lián)網(wǎng)大廠中,典型的如百度,創(chuàng)業(yè)公司中,也有一些發(fā)展很快。這些基礎(chǔ)大模型是AI原生應(yīng)用的底層驅(qū)動(dòng)力,為爆款應(yīng)用的出現(xiàn)提供了基礎(chǔ)。
按照李彥宏的話說(shuō):“只有用好最強(qiáng)大的基礎(chǔ)大模型,中國(guó)的開發(fā)者和創(chuàng)業(yè)者才可能做出更多超級(jí)應(yīng)用?!?/p>
根據(jù)與大模型接入的深度,應(yīng)用層創(chuàng)業(yè)可以分為兩類:自建模型開發(fā)應(yīng)用,以及直接調(diào)用已有大模型開發(fā)應(yīng)用。
百度正在孵化全新的AI原生應(yīng)用。比如智能代碼助手Comate。據(jù)百度透露,百度現(xiàn)在每新增100行代碼,就有20行是AI生成的,而且這個(gè)比例還在快速增長(zhǎng)中。這樣的AI原生應(yīng)用,通過(guò)人機(jī)協(xié)同,大幅提升了研發(fā)效率。
與此同時(shí),百度在內(nèi)的一些頭部大模型廠商,以及一些開源平臺(tái),對(duì)開發(fā)者提供全套開發(fā)工具,降低了應(yīng)用層的創(chuàng)業(yè)門檻。對(duì)于那些無(wú)力獨(dú)立訓(xùn)練一個(gè)大模型的中小開發(fā)者,接入大廠的API,成為一個(gè)性價(jià)比較高的選擇。
前幾天OpenAI召開首屆開發(fā)者大會(huì),推出Assistants API,讓開發(fā)者能夠調(diào)用GPT上幾乎所有的新功能,面向普通用戶推出的GPTs,則讓不懂代碼的人也能輕松編程。這“殺死”了一些模型層和中間層創(chuàng)業(yè)者的生意,卻為應(yīng)用層的繁榮打下了基礎(chǔ)。
這是一個(gè)重要的風(fēng)向轉(zhuǎn)變。國(guó)外已經(jīng)將重點(diǎn)轉(zhuǎn)向了應(yīng)用層的AI agent(智能體),而國(guó)內(nèi)還在卷大模型。
李彥宏說(shuō),API是AI原生應(yīng)用調(diào)用基礎(chǔ)大模型的主要方式。未來(lái),每一家企業(yè)跟自己客戶打交道的方式,都將被改造為AI原生應(yīng)用,這將大幅度提升企業(yè)的競(jìng)爭(zhēng)力?!鞍俣鹊哪繕?biāo),就是打造好大模型的基礎(chǔ)能力,支持好AI原生應(yīng)用開發(fā)?!?/p>
百度擁有800萬(wàn)AI開發(fā)者,不久前上線的大模型插件平臺(tái),讓個(gè)人和企業(yè)都能把自己的數(shù)據(jù)和能力,快速變成插件。插件是一種特殊的AI原生應(yīng)用,大大降低了開發(fā)者門檻,有利于構(gòu)建繁榮的AI原生應(yīng)用生態(tài)。
在巨頭們已經(jīng)鋪好路、建好基礎(chǔ)設(shè)施的情況下,創(chuàng)業(yè)者與其重復(fù)造輪子與巨頭對(duì)抗,不如將重點(diǎn)放在應(yīng)用開發(fā)上,尋找下一個(gè)爆款應(yīng)用。
梳理清楚自己的核心優(yōu)勢(shì)和競(jìng)爭(zhēng)壁壘,在生態(tài)里找到自己的位置,才能在大模型創(chuàng)業(yè)潮里借勢(shì)而起。
*題圖及文中配圖來(lái)源于Unsplash。