文|定焦(dingjiaoone) 黎明
編輯|方展博
中國的大模型創(chuàng)業(yè)很火,但有些公司可能跑偏了。
“百模大戰(zhàn)”這半年,大大小小的科技公司,都推出了自己的大模型。仿佛不發(fā)布一個大模型,就不配坐上通往AI時代的列車。
這造成一種現(xiàn)象:高度雷同,同質(zhì)競爭。大家一蜂窩撲上來,重復(fù)造輪子。
11月15日在深圳舉行的西麗湖論壇上,百度董事長兼CEO李彥宏發(fā)表演講時表示,他看到很多企業(yè)對大模型的本質(zhì)理解不深,被各種說法忽悠,都想去自己搞個基礎(chǔ)模型,或者按照網(wǎng)上傳播的評測方法去挑選一款評分高的大模型,就以為這是擁抱AI了。
“殊不知大模型本身不僅不產(chǎn)生任何價值,還造成了對公司資源、社會資源的巨大浪費?!?/p>
金沙江創(chuàng)投主管合伙人朱嘯虎近期也說過,今年上半年有一波AI的虛火,大家天天在講大模型。投資人FOMO,投了很多大模型,現(xiàn)在都后悔了。他認為明年下半年大部分創(chuàng)業(yè)者會出局。
大模型創(chuàng)業(yè),方向比努力更重要。要想持久坐在牌桌上,就得看清浪潮的流向。
跟風(fēng)搞大模型,AI創(chuàng)業(yè)的歧路
都知道大模型很重要,問題是,我們到底需要多少個大模型?
在15日的演講中,李彥宏引用公開數(shù)據(jù)說,截止10月份國內(nèi)已經(jīng)發(fā)布了238個大模型,而6月份的時候這個數(shù)字是79個,相當(dāng)于4個月就翻了3倍。
平均下來,每天至少有一個大模型面世。
200多個大模型,看似很多,實際差異很小,大家本質(zhì)都差不多。其中,還有一些是“套殼”——在Llama開源模型的基礎(chǔ)上訓(xùn)練而來。比如零一萬物的Yi系列大模型,最近就被質(zhì)疑完全使用LLama架構(gòu),卻對外宣稱“原創(chuàng)”。
相對之下,美國作為大模型的發(fā)源地,也只有上十個大模型。
大模型不是越多越好,我們不需要那么多大模型,最終這些大模型也不會全部活下來。
李彥宏認為,大模型可以被視為AI時代的操作系統(tǒng),是各類原生應(yīng)用的基礎(chǔ)底座。他做了一個類比:縱觀互聯(lián)網(wǎng)發(fā)展史,不論是PC時代,還是移動互聯(lián)網(wǎng)時代,操作系統(tǒng)都只剩下少數(shù)幾個——PC是Windows系統(tǒng),移動時代是安卓和iOS。
那么同理,大家普遍認為,最終能活下來的通用大模型,也會是個位數(shù)級別。這意味著,國內(nèi)一股腦冒出來的200多個大模型,絕大部分都是炮灰。
一家AI設(shè)計公司的創(chuàng)始人對「定焦」說,大模型是一種基礎(chǔ)設(shè)施建設(shè),需要集中力量辦大事,投入產(chǎn)出比才最高,生態(tài)里的各種人匯集在平臺上,就會形成平臺效應(yīng)和規(guī)模效應(yīng)。
不是所有公司都能成為基礎(chǔ)設(shè)施般的存在,這與野心無關(guān),而與能力有關(guān)。要做出一款好用、可用的大模型,技術(shù)門檻和成本門檻極高。
OpenAI潛心研發(fā)這么多年,背靠微軟的支持,投入數(shù)十億美金,才取得今天的成績。國內(nèi)的百度、華為、阿里等互聯(lián)網(wǎng)大廠,也是因為有過去多年的積累,今天才能快速跟上潮流。那些跟風(fēng)入場、從零起步的創(chuàng)業(yè)公司,想要自研一款通用大模型,難度可想而知。
即便技術(shù)實力過關(guān),或者借用開源方案,訓(xùn)練模型的成本也讓很多公司吃不消。訓(xùn)練一遍,耗資幾百萬人民幣,不在少數(shù)。關(guān)鍵是,訓(xùn)練出來的模型本質(zhì)上不是原創(chuàng),也沒什么人使用。
按照李彥宏的說法,“國內(nèi)有200多個大模型,很多上了這個榜單、那個排名,其實都沒有什么使用量?!彼J為,“重復(fù)造輪子其實是對社會資源的極大浪費?!?/p>
有一些公司劍走偏鋒,想從頭訓(xùn)練自己的專用大模型,這樣成本可控。但李彥宏認為,這樣煉出來的大模型是沒有智能涌現(xiàn)能力的。因為只有參數(shù)規(guī)模足夠大,算法、數(shù)據(jù)訓(xùn)練都做對的時候,并且能夠持續(xù)投入,不斷迭代,才能夠產(chǎn)生智能涌現(xiàn),大模型才具有觸類旁通的能力。
做不了通才,又成不了專才,就沒有核心競爭力。
“今天你推出一個大模型,花錢打了榜,有很多人用,可能明天就有個新的模型迅速替代掉?!绷硪患胰斯ぶ悄芄镜膭?chuàng)始人對「定焦」說。
所以,一些跟風(fēng)搞大模型創(chuàng)業(yè)者,跑偏了。
創(chuàng)業(yè)者真正的機會
如果不做通用大模型,創(chuàng)業(yè)者應(yīng)該做什么?
李彥宏的答案是:AI原生應(yīng)用?!癆I原生時代,我們需要的不是100個所謂的大模型,而是100萬量級的AI原生應(yīng)用?!彼f。
互聯(lián)網(wǎng)歷史上的幾波創(chuàng)業(yè)潮,漲潮的標志性事件,都是原生應(yīng)用的爆發(fā)。距離我們最近的移動互聯(lián)網(wǎng),是由iPhone手機掀起的,業(yè)內(nèi)公認的起點是2010年。
但事實上,初代iPhone在2007年就誕生了,一直到三年后,具有劃時代意義的iphone 4發(fā)布,手機行業(yè)才整體進入智能化時代。iphone 4除了亮眼的外觀設(shè)計,最大的貢獻是搭建了系統(tǒng)生態(tài),讓無數(shù)開發(fā)者創(chuàng)造了大量原生應(yīng)用,由此開啟了創(chuàng)業(yè)者的黃金年代。
過去十多年,互聯(lián)網(wǎng)行業(yè)最成功的公司、最亮眼的產(chǎn)品、最明星的創(chuàng)業(yè)者,都集中在應(yīng)用層。微信、抖音、美團、滴滴,都是從零開始成為超級應(yīng)用。
李彥宏認為,人類進入AI時代的標志,是出現(xiàn)大量的AI原生應(yīng)用,而不是出現(xiàn)大量的大模型?;诨A(chǔ)大模型開發(fā)出來的應(yīng)用,才是模型存在的意義。
AI原生應(yīng)用,就是基于大模型智能涌現(xiàn)后產(chǎn)生的理解、生成、邏輯和記憶四大核心能力開發(fā)出來的應(yīng)用。這些能力是過去的時代所不具備的,能解決過去解決不了或解決不好的問題,因而才能打開無限的創(chuàng)新空間。
那么,AI原生應(yīng)用進展如何?
答案是尚未爆發(fā)。
國內(nèi)的AI原生應(yīng)用屈指可數(shù)。9月初,國內(nèi)才開放第一批大模型備案,允許公開注冊使用,此前都只能內(nèi)測。百度的文心一言APP第一批上線,迅速登頂手機應(yīng)用商店排行榜。11月1日,百度正式上線文心一言專業(yè)版,開啟訂閱收費,每月59.9元。這是國內(nèi)首個采用會員模式面向C端收費的大模型產(chǎn)品。
國外的進展更快一些,AI原生應(yīng)用的數(shù)量已經(jīng)有上千個。據(jù)應(yīng)用商店監(jiān)測平臺Sensor Tower的數(shù)據(jù),美國市場貢獻了55%的AI應(yīng)用總收入,歐洲市場占20%,包括中國在內(nèi)的其他市場,加起來只占比25%。
10個大模型里找不出1個應(yīng)用,這就是中國大模型創(chuàng)業(yè)的現(xiàn)狀。
對于創(chuàng)業(yè)者而言,必須要考慮清楚,是去跟風(fēng)砸錢做基礎(chǔ)大模型,還是做大模型在垂直行業(yè)的精調(diào),抑或是基于大模型打造新的應(yīng)用。
在李彥宏看來,直到今天,不論中國還是美國,最好的AI原生應(yīng)用還沒出現(xiàn)。這恰恰就是創(chuàng)業(yè)者千載難逢的機會。
是時候?qū)ふ冶顟?yīng)用了
中國的AI原生應(yīng)用發(fā)展緩慢,不是中國創(chuàng)業(yè)者不努力,而是起步晚了。
大模型創(chuàng)業(yè)分為三大類:一是做基礎(chǔ)大模型,二是做行業(yè)大模型,三是基于前兩類大模型開發(fā)應(yīng)用。
在中國,基礎(chǔ)大模型和應(yīng)用層的創(chuàng)業(yè),幾乎是同步展開的。去年底ChatGPT火了之后,中國的創(chuàng)業(yè)者一方面研發(fā)基礎(chǔ)大模型,同時也嘗試AI原生應(yīng)用的各種可能性。但基礎(chǔ)模型不成熟,意味著應(yīng)用層發(fā)展所倚賴的條件不具備。
大半年的“軍備競賽”之后,一些頭部的大模型廠商脫穎而出?;ヂ?lián)網(wǎng)大廠中,典型的如百度,創(chuàng)業(yè)公司中,也有一些發(fā)展很快。這些基礎(chǔ)大模型是AI原生應(yīng)用的底層驅(qū)動力,為爆款應(yīng)用的出現(xiàn)提供了基礎(chǔ)。
按照李彥宏的話說:“只有用好最強大的基礎(chǔ)大模型,中國的開發(fā)者和創(chuàng)業(yè)者才可能做出更多超級應(yīng)用?!?/p>
根據(jù)與大模型接入的深度,應(yīng)用層創(chuàng)業(yè)可以分為兩類:自建模型開發(fā)應(yīng)用,以及直接調(diào)用已有大模型開發(fā)應(yīng)用。
百度正在孵化全新的AI原生應(yīng)用。比如智能代碼助手Comate。據(jù)百度透露,百度現(xiàn)在每新增100行代碼,就有20行是AI生成的,而且這個比例還在快速增長中。這樣的AI原生應(yīng)用,通過人機協(xié)同,大幅提升了研發(fā)效率。
與此同時,百度在內(nèi)的一些頭部大模型廠商,以及一些開源平臺,對開發(fā)者提供全套開發(fā)工具,降低了應(yīng)用層的創(chuàng)業(yè)門檻。對于那些無力獨立訓(xùn)練一個大模型的中小開發(fā)者,接入大廠的API,成為一個性價比較高的選擇。
前幾天OpenAI召開首屆開發(fā)者大會,推出Assistants API,讓開發(fā)者能夠調(diào)用GPT上幾乎所有的新功能,面向普通用戶推出的GPTs,則讓不懂代碼的人也能輕松編程。這“殺死”了一些模型層和中間層創(chuàng)業(yè)者的生意,卻為應(yīng)用層的繁榮打下了基礎(chǔ)。
這是一個重要的風(fēng)向轉(zhuǎn)變。國外已經(jīng)將重點轉(zhuǎn)向了應(yīng)用層的AI agent(智能體),而國內(nèi)還在卷大模型。
李彥宏說,API是AI原生應(yīng)用調(diào)用基礎(chǔ)大模型的主要方式。未來,每一家企業(yè)跟自己客戶打交道的方式,都將被改造為AI原生應(yīng)用,這將大幅度提升企業(yè)的競爭力。“百度的目標,就是打造好大模型的基礎(chǔ)能力,支持好AI原生應(yīng)用開發(fā)。”
百度擁有800萬AI開發(fā)者,不久前上線的大模型插件平臺,讓個人和企業(yè)都能把自己的數(shù)據(jù)和能力,快速變成插件。插件是一種特殊的AI原生應(yīng)用,大大降低了開發(fā)者門檻,有利于構(gòu)建繁榮的AI原生應(yīng)用生態(tài)。
在巨頭們已經(jīng)鋪好路、建好基礎(chǔ)設(shè)施的情況下,創(chuàng)業(yè)者與其重復(fù)造輪子與巨頭對抗,不如將重點放在應(yīng)用開發(fā)上,尋找下一個爆款應(yīng)用。
梳理清楚自己的核心優(yōu)勢和競爭壁壘,在生態(tài)里找到自己的位置,才能在大模型創(chuàng)業(yè)潮里借勢而起。
*題圖及文中配圖來源于Unsplash。