文|獵云網(wǎng) 盛佳瑩
“盡管在泡沫期,貼上大模型標(biāo)簽的公司都很貴,沖上十幾億甚至數(shù)十億估值,但這依然是出手的窗口期?!背D昕碅I賽道的天堂硅谷高級合伙人王偉興奮地說道,他堅(jiān)信,將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個(gè)全新的商業(yè)帝國。
由ChatGPT掀起的這一波大模型浪潮中, 百度、阿里等大廠相繼下場,王慧文、王小川、李開復(fù)等大佬也紛紛入場,而創(chuàng)業(yè)公司在這波浪潮里的最大機(jī)會在哪里?
大多數(shù)人都并不看好創(chuàng)業(yè)公司入局通用大模型,遠(yuǎn)望資本創(chuàng)始合伙人程浩就曾公開表示,大廠肯定比創(chuàng)業(yè)公司有流量、有錢,而重要的是大廠的核心優(yōu)勢是自帶場景,不論是百度的問答和搜索,還是騰訊的微信、阿里的天貓精靈和釘釘,都具備成熟的落地場景。
既然通用大模型機(jī)會鮮少,不少創(chuàng)業(yè)公司瞄準(zhǔn)了垂直大模型。
如今,通用大模型數(shù)據(jù)來源于公開互聯(lián)網(wǎng)場景,但互聯(lián)網(wǎng)數(shù)據(jù)并不等同于全世界的數(shù)據(jù),尤其在垂直賽道,依然有很多私有數(shù)據(jù)。
而深耕垂直領(lǐng)域的創(chuàng)業(yè)公司已經(jīng)積累大量數(shù)據(jù)和know-how,具備核心優(yōu)勢,而大廠的基因并不在垂直領(lǐng)域。范特科技CTO郭長柱表示,大模型對于大廠而言在通用和垂直領(lǐng)域之間是魚和熊掌不可兼得,“做通用大模型的大廠,它要的是生態(tài),讓眾多的企業(yè)接入它的大模型,以它的大模型作為底座去賦能百業(yè),這個(gè)時(shí)候它自己也下場踢球就和它的身份不符,所以它們一般不會輕易這樣做。”
如果在互聯(lián)網(wǎng)時(shí)代,每個(gè)行業(yè)都值得用互聯(lián)網(wǎng)重做一次,那么在大模型時(shí)代,每個(gè)行業(yè)依然如此,甚至此前在互聯(lián)網(wǎng)時(shí)代依然保守的賽道,極有可能被大模型重塑。
這讓投資人足夠興奮,在奇績創(chuàng)壇2022年11月舉辦的秋季路演日中,陸奇投了55個(gè)項(xiàng)目,其中有16個(gè)是“預(yù)訓(xùn)練大模型”方向,而彼時(shí)ChatGPT還未發(fā)布。
而到今年,前四個(gè)月國內(nèi)AI領(lǐng)域就已經(jīng)完成融資243起。面對越來越熱的風(fēng)口,創(chuàng)業(yè)公司們都拿出渾身解數(shù),捕捉這輪機(jī)遇。
垂直大模型:變革的生產(chǎn)力
在ChatGPT爆火前,大模型已經(jīng)默默發(fā)展了數(shù)年,極驗(yàn)AI實(shí)驗(yàn)室負(fù)責(zé)人曹佳豪坦言,多模態(tài)大模型的核心技術(shù)本質(zhì)并沒有發(fā)生大的改變。但是在訓(xùn)練規(guī)模大到一個(gè)量級以后確實(shí)出現(xiàn)了一些感受上是質(zhì)變的效果。最終大模型能否走到通用人工智能,還是一個(gè)未知數(shù)。
三維家CEO蔡志森也表示,大模型是AI從量變到了質(zhì)變的階段性里程碑,最大價(jià)值在于通過千億數(shù)據(jù)訓(xùn)練,其生成的內(nèi)容超出想象,驗(yàn)證了這條路徑是正確的。
可以說,這波熱浪更多得益于ChatGPT商業(yè)和營銷方面的成功,而不是技術(shù)迭代。
但不可否認(rèn)的是,大模型會改變很多垂直行業(yè)的業(yè)務(wù)和商業(yè)模式。
對于驗(yàn)證碼這個(gè)行業(yè)而言,垂直大模型可以幫助驗(yàn)證碼廠商管理圖集,也可以誕生新的驗(yàn)證形式,甚至基于文生圖和圖生圖模式,可以與客戶共創(chuàng)圖集,增強(qiáng)交互體驗(yàn)。
但對于這樣一個(gè)需要人機(jī)對抗的領(lǐng)域,大模型也極有可能被用于驗(yàn)證識別,為黑產(chǎn)所用,這也更推動極驗(yàn)在垂直大模型領(lǐng)域進(jìn)行投入,從防御角度而言,只有了解黑產(chǎn)的工作模式,才能精準(zhǔn)研發(fā)破解手段。
從目前的情況而言,極驗(yàn)已小規(guī)模上線一批由垂直大模型自動生成的圖集,用于驗(yàn)證碼圖形,極驗(yàn)發(fā)現(xiàn),雖然大模型對防御黑產(chǎn)程度有限,但卻可以縮小對抗領(lǐng)域,進(jìn)而優(yōu)化對抗資源,從被動防御轉(zhuǎn)變?yōu)橹鲃臃烙?/p>
而像金融行業(yè)而言,過去長尾算法數(shù)據(jù)收集難、標(biāo)注時(shí)間長、數(shù)據(jù)不均衡導(dǎo)致落地效果差,即便一些擁有算法自訓(xùn)練平臺的AI基礎(chǔ)設(shè)施供應(yīng)商,像范特科技,其長尾算法的落地難度依然大且周期長。
郭長柱告訴獵云網(wǎng),主要是因?yàn)槠渲邪舜罅康娜斯すぷ?。而如今結(jié)合CV大模型的能力之后,對于常見物體的檢測和分割可以實(shí)現(xiàn)全自動訓(xùn)練,對于特殊物品也可以借助CV大模型把人工作業(yè)降到最低。
“不僅工作量降低了,工作難度也降低了?!?郭長柱表示:“原來做分割時(shí)需要沿著物體邊緣仔細(xì)描邊,現(xiàn)在只需要點(diǎn)一下就能自動分割,這樣我們把系統(tǒng)私有化部署到客戶那里,打通內(nèi)部網(wǎng)絡(luò)的云邊兩端,客戶自己坐在辦公室里就可以對模型進(jìn)行升級和維護(hù),而我們專注做基礎(chǔ)算法和底層平臺能力建設(shè),這樣實(shí)際上分工也產(chǎn)生了變化?!?/p>
這意味著,垂直大模型將作為基礎(chǔ)能力對外標(biāo)準(zhǔn)輸出,端到端的解決用戶需求。目前,范特科技已完成語言類大模型、視覺大模型以及多模態(tài)大模型的技術(shù)預(yù)研,將于近期推出相關(guān)產(chǎn)品進(jìn)行落地。
而像家居和電商內(nèi)容這樣的行業(yè),垂直大模型可以賦能全流程。
聚焦電商內(nèi)容解決方案的極??萍紕?chuàng)始人武彬告訴獵云網(wǎng),在電商內(nèi)容生成全領(lǐng)域,從拍攝-場景圖-種草-直播切片-短視頻,過去的AI解決方案只能賦能部分流程,而垂直大模型可以全流程自動生成,這可以極大地降本增效。
專注家居行業(yè)的三維家CEO蔡志森也表示,不論在設(shè)計(jì)場景、營銷場景還是制造場景,垂直大模型可以生產(chǎn)3D矢量化的內(nèi)容,做到“所想即所見”、 “所見即所得”,甚至在生產(chǎn)制造端,垂直大模型將取代規(guī)則驅(qū)動,生產(chǎn)自動化提效,優(yōu)化人員結(jié)構(gòu)和人機(jī)交互模式。
目前三維家已構(gòu)建起室內(nèi)空間大模型、定制家居大模型等垂類模型,應(yīng)用于戶型識別、智能樣板間、智能柜體、智能硬裝、智能水電、智能家居布置等多種設(shè)計(jì)環(huán)節(jié)。
基于室內(nèi)空間大模型通過可配置的AI知識圖譜和大規(guī)模神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)海量家居家裝方案,可以自動完成智能設(shè)計(jì)。
而基于真實(shí)柜體數(shù)據(jù)的定制家居大模型,則可根據(jù)尺寸輸入、對話文本生成參數(shù)化的定制衣柜、櫥柜設(shè)計(jì),生產(chǎn)合理的柜體方案,可直接對接生產(chǎn),將大大縮減復(fù)雜易出錯(cuò)的柜體設(shè)計(jì)時(shí)間。
對于各行各業(yè)來說,垂直大模型是一種全新的生產(chǎn)力,底層能力的突破不僅可以降本增效,長期來看必然帶來上層應(yīng)用的躍遷和變革。
如蔡志森所說,一方面,在當(dāng)前中國的智能化浪潮下,產(chǎn)業(yè)側(cè)數(shù)字化革新本就有廣闊的市場需求;另一方面,在toB生態(tài)下,基于垂直大模型的應(yīng)用實(shí)踐也有利于形成數(shù)據(jù)飛輪與場景飛輪。
天堂硅谷高級合伙人王偉也表示,大模型最大的價(jià)值在于建立新的商業(yè)模式和新的經(jīng)營思想,重新改造商業(yè)組織的每一個(gè)環(huán)節(jié)。
這也是為什么創(chuàng)業(yè)公司紛紛擁抱大模型的原因。
創(chuàng)業(yè)公司垂直大模型第一仗:控本增效
雖然大模型“很香”,但眾所周知,過去大模型的一次性投入成本極高。此前,有市場消息稱GPT3單次訓(xùn)練的成本為400萬美元,因此,不少聲音認(rèn)為訓(xùn)練大模型門檻至少在數(shù)千萬元。
但在垂直行業(yè),盲目追求“大”規(guī)模沒有意義,OpenCSG創(chuàng)始人& CEO陳冉將大模型比作一塊“玉”,“如何用好大模型能力,也就是說雕琢這塊玉更為重要?!?/p>
郭長柱也提到,大模型的標(biāo)準(zhǔn)并不能以參數(shù)規(guī)模一概而論,核心在于其是否具備“涌現(xiàn)”能力,即其準(zhǔn)確率是否達(dá)到突然躍升的階段?!霸诖怪鳖I(lǐng)域,同樣的效果,通用大模型要千億甚至萬億參數(shù),垂直大模型百億數(shù)據(jù)也可以達(dá)到。”
參數(shù)規(guī)模的指數(shù)級下降,疊加這段時(shí)間涌現(xiàn)的眾多開源模型和蒸餾法等變革性技術(shù),過去千萬級的訓(xùn)練大模型“門票”已降至百萬級。
但這對于創(chuàng)業(yè)公司們而言,這仍然是一筆不大不小的開支,控制成本和提升效率成為各家公司在百模大戰(zhàn)中的第一仗。
極驗(yàn)在優(yōu)化投入產(chǎn)出比方面,采取彈性計(jì)算環(huán)境,以按量計(jì)算完成前期零碎的探索任務(wù)。在明確方向后,再轉(zhuǎn)化為周期性訓(xùn)練。
極睿科技則聯(lián)合清華大學(xué)人工智能研究院,由學(xué)術(shù)團(tuán)隊(duì)提供算力支持,優(yōu)化投入產(chǎn)出比。
而三維家則打造了一套多服務(wù)器、多GPU并行的計(jì)算網(wǎng)絡(luò),優(yōu)化算力調(diào)配和運(yùn)行機(jī)制,同時(shí),三維家作為英偉達(dá)的高級初創(chuàng)會員,得到高效利用GPU的技術(shù)支持,這也加速了三維家垂直大模型的迭代速度。
范特科技在成本和生成效率方面,一方面,通過在現(xiàn)有的產(chǎn)品中整合大模型能力,大幅提升了內(nèi)部創(chuàng)新效率;另一方面,通過自研的推理引擎優(yōu)化技術(shù)和并行計(jì)算技術(shù)最大限度的提升大模型推理速度和硬件利用效率,通過自研業(yè)務(wù)流編排引擎解決最后一公里的業(yè)務(wù)流自定義問題,完成基于大模型的端到端的解決問題完整閉環(huán)。
事實(shí)上,控制成本不僅僅是為了控制投入,小苗朗程合伙人俞佳偉坦言,對于用戶側(cè)而言,成本太高也難以被接受,尤其是在算力低、功耗低的終端場景。
垂直大模型:數(shù)據(jù)和know-how為王
訓(xùn)練大模型的成本下降,對于創(chuàng)業(yè)公司而言,只是拿到了入場券。對于垂直大模型而言,核心和關(guān)鍵離不開算力、算法和數(shù)據(jù)。
在一定程度上,錢可以解決算力和算法,但卻很難買到數(shù)據(jù),尤其是在垂直領(lǐng)域,很多都是私有數(shù)據(jù),能買到的數(shù)據(jù)意義并不大。
這對一直深耕在垂直行業(yè)的公司而言,是天然的優(yōu)勢。
蔡志森告訴獵云網(wǎng),依托其在線的3D設(shè)計(jì)軟件和3D制造軟件,三維家已經(jīng)具備2800萬+覆蓋全國小區(qū)的戶型數(shù)據(jù)、8100萬+軟硬裝、家具家電、材質(zhì)飾品素材庫、16.3億+風(fēng)格種類多樣的設(shè)計(jì)方案庫,此外,還擁有數(shù)千萬參數(shù)數(shù)據(jù)的真實(shí)定制柜體數(shù)據(jù)集。
與此同時(shí),用戶不斷使用,這些數(shù)據(jù)集仍按照三維家定義的方向在自動實(shí)時(shí)生成。
和三維家一樣,深耕電商內(nèi)容領(lǐng)域的極??萍济磕甓荚诋a(chǎn)生數(shù)百萬乃至數(shù)千萬的電商內(nèi)容數(shù)據(jù)。
除了數(shù)據(jù)壁壘,定位清晰的應(yīng)用場景、掌握垂直大模型落地的全流程也是核心競爭力,這對了解行業(yè)know-how提出了極高的要求。
實(shí)際上,大模型提供的是基礎(chǔ)能力,具體業(yè)務(wù)則是專有能力的組合。
在郭長柱看來,目前基于大模型的模型即服務(wù)(MaaS)是一種創(chuàng)新的模式,即把大模型作為基礎(chǔ)能力對外標(biāo)準(zhǔn)輸出,端到端的解決用戶需求。但直接使用大模型端到端的解決問題相對較少,尤其是在CV領(lǐng)域,更多的是在基礎(chǔ)能力之上針對垂直領(lǐng)域做定制。
“比如使用大模型自動標(biāo)注訓(xùn)練垂直領(lǐng)域小模型,使用大模型更加general的特征做VQA、檢測、分割和識別等二次開發(fā)。除此之外,部分業(yè)務(wù)可能涉及多項(xiàng)大模型能力的組合,甚至需要語言和視覺特征對齊的多模態(tài)能力。這就要求我們在實(shí)際的業(yè)務(wù)中必須支持多種大模型的自定義業(yè)務(wù)流,實(shí)現(xiàn)大模型的自由組合和業(yè)務(wù)的深度定制?!?/p>
OpenCSG也從實(shí)踐中積累了大量大模型落地通用行業(yè)的實(shí)踐,包括垂直行業(yè)語料產(chǎn)生,大模型微調(diào),業(yè)務(wù)結(jié)合等方面。
王偉也表示,投資大模型他看好在核心行業(yè)有海量行業(yè)數(shù)據(jù),懂行業(yè)know-how的企業(yè)。
俞佳偉則看好有實(shí)際落地場景的企業(yè),尤其是需求強(qiáng)、專業(yè)性強(qiáng)的場景,例如醫(yī)療、金融、法律等行業(yè)。
在陳冉看來,大模型具備了推演、舉一反三的能力,在一定程度上,具備類似人類的腦神經(jīng),可以替代不少人類的工作?!斑^去最大的創(chuàng)業(yè)成本是人,而利用好大模型,重塑工作流,可以極大降低創(chuàng)業(yè)成本,這對創(chuàng)業(yè)公司來說是極大的利好?!?/p>
王偉也持相同觀點(diǎn):“將大模型的思想和技術(shù)武裝到牙齒,必然會建立起一個(gè)全新的商業(yè)帝國?!?/p>
時(shí)代的大幕已然拉開,燦若繁星。