文|IT時報記者 賈天榮
編輯|郝俊慧 孫妍
12月6日,當(dāng)ChatGPT低調(diào)地慶祝它的“一周歲”生日之際,谷歌推出Gemini大模型,引發(fā)科技圈“地震”。Gemini將大模型帶入原生多模態(tài)時代,不僅可以處理文本內(nèi)容,還可以處理代碼、音頻、圖像和視頻等多種模態(tài)信息,是谷歌目前規(guī)模最大、能力最強(qiáng)的大模型。
一年前,ChatGPT的問世,掀起人工智能的巨浪。如今,不斷“涌現(xiàn)”的AI能力,正讓未來變得更加未知。
誰都不想錯過一個時代的來臨。
一面是科技巨頭紛紛加入,另一面是眾多初創(chuàng)公司積極參與,試圖以技術(shù)創(chuàng)新和市場占領(lǐng)贏得先機(jī)。然而隨著大模型創(chuàng)業(yè)的逐漸升溫,競爭的火焰也變得愈發(fā)熾熱。在這場角逐中,資源投入巨大,無論是研發(fā)、硬件基建還是人才爭奪,都成為創(chuàng)業(yè)公司需要克服的巨大困境。
01 奔騰的浪潮
一年以來,各行各業(yè)的公司都在爭先恐后推出自己的“大模型”,大模型創(chuàng)業(yè)潮如同一場狂風(fēng)驟雨,讓整個科技產(chǎn)業(yè)陷入了一片熱潮,百度、阿里、華為、京東等互聯(lián)網(wǎng)大廠重金押注,無一缺席。他們不僅投入大量的資金和資源,還積極招募人才,加強(qiáng)技術(shù)研發(fā),以保持自己在人工智能領(lǐng)域的領(lǐng)先地位。在這之中,也有無數(shù)創(chuàng)業(yè)者奔涌而至,希望能在這個新興的市場中搶占先機(jī)。
最新發(fā)布的《北京市人工智能行業(yè)大模型創(chuàng)新應(yīng)用白皮書(2023年)》顯示,僅國內(nèi)而言,截至2023年10月,我國擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所共計254家,分布于20多個省市/地區(qū),國內(nèi)大模型總數(shù)達(dá)238個,“百模大戰(zhàn)”再次升級。
面對持續(xù)火爆的“百模大戰(zhàn)”,業(yè)內(nèi)也開始出現(xiàn)一些“冷”思考?!爸袊拇竽P秃芏?,但是基于大模型開發(fā)出來的AI原生應(yīng)用卻非常少?!?1月15日,在深圳2023西麗湖論壇上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏談及國內(nèi)AI行業(yè)現(xiàn)狀時表示。
國內(nèi)目前大模型創(chuàng)業(yè)企業(yè)的現(xiàn)狀如何?《IT時報》記者了解到,目前的大模型可分為通用大模型和垂類行業(yè)大模型。通用大模型具有強(qiáng)大泛化能力,可在不進(jìn)行微調(diào)或少量微調(diào)的情況下完成多場景任務(wù),相當(dāng)于完成了“通識教育”的AI,ChatGPT、百度的文心一言、阿里的通義千問等都是通用大模型。
行業(yè)大模型則是利用行業(yè)知識對大模型進(jìn)行微調(diào),讓AI完成“專業(yè)教育”,以滿足在能源、金融、醫(yī)療、制造、傳媒等不同領(lǐng)域的需求。
基礎(chǔ)大模型的技術(shù)創(chuàng)新,更多是大公司的角斗場,對于大多數(shù)創(chuàng)業(yè)公司而言,不管是算力、資金還是數(shù)據(jù),有限的創(chuàng)業(yè)資源都決定了垂直行業(yè)大模型是創(chuàng)業(yè)者們的主戰(zhàn)場。
02 旋渦中的競爭與困境
多位接受《IT時報》采訪的業(yè)內(nèi)人士認(rèn)為,“數(shù)據(jù)”和“人才”是如今大模型創(chuàng)業(yè)公司的競爭中最重要的核心資源。
數(shù)據(jù)是推動大模型能力演進(jìn)的核心“能源”,浦因科技(上海)有限公司首席科學(xué)家秦興虎告訴《IT時報》記者,不管是模型的訓(xùn)練還是后續(xù)對模型的進(jìn)一步更新以滿足其實際應(yīng)用,都需要大量的數(shù)據(jù)來支撐,在模型開發(fā)的成本中,數(shù)據(jù)成本也占據(jù)了很大的比重。
從事醫(yī)學(xué)垂直AI模型研究的英國鄧迪大學(xué)博士研究員王宸禹也表示,AI醫(yī)療行業(yè)的數(shù)據(jù)獲取難度較高,成本也更大。
北京醫(yī)者信息科技有限公司(以下簡稱“醫(yī)者AI”)CEO劉呈輝認(rèn)為,即使早期各大公司之間技術(shù)有所差距,但隨著競爭到后期,技術(shù)的鴻溝被抹平,數(shù)據(jù)會成為最重要的戰(zhàn)略資源,尤其是專業(yè)領(lǐng)域里的高質(zhì)量私域數(shù)據(jù),更是稀缺資源,還涉及數(shù)據(jù)資產(chǎn)的采集、產(chǎn)權(quán)、安全隱私等問題。
在秦興虎看來,從事醫(yī)療行業(yè)大模型的開發(fā)需要既懂人工智能技術(shù),又懂相關(guān)生物信息技術(shù),專業(yè)性要求極高,人才爭奪成了創(chuàng)業(yè)公司需要克服的另一個困境,“一方面是要求高,另一方面,初創(chuàng)公司對于人工智能人才的吸引力很多時候是不如大廠的?!?/p>
“現(xiàn)在國內(nèi)做基座類模型的人才90%都出自清華,國內(nèi)真正會調(diào)模型、訓(xùn)練模型的甚至不超過200個人。”劉呈輝也表示,由于行業(yè)本身的人才儲備有限,加上大模型的突然“火爆”,人才短缺問題顯得尤為突出,如果不在高校具備一定的人才資源,創(chuàng)業(yè)公司連招人都會變得很困難。
脈脈高聘人才智庫發(fā)布的《2023泛人工智能人才洞察》顯示,今年1月到8月,新發(fā)AI崗位平均月薪超4.6萬元,人才供需比僅為0.39,相當(dāng)于5個崗位爭奪2個人才。
vivo副總裁周圍接受媒體采訪時曾表示,“vivo大模型現(xiàn)在每年20億~30億元的投入成本,總投入成本已經(jīng)超過200億元,人才和數(shù)據(jù)算力各占一半,人才成本平均每人稅后100萬元?!?/p>
03 日漸“降溫”的投資潮
創(chuàng)業(yè)公司們不斷崛起的另一面,是投資人對于大模型賽道初創(chuàng)公司的熱情肉眼可見“降溫”了。今年以來,幾家大模型初創(chuàng)公司拿到融資,數(shù)據(jù)顯示,今年中國AI領(lǐng)域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場尤為受歡迎,融資額占比超過30%。
但除了頭部三家,其他初創(chuàng)公司的融資情況可能并非那么樂觀。據(jù)《財經(jīng)十一人》報道,第三方數(shù)據(jù)機(jī)構(gòu)企名片數(shù)據(jù)顯示,今年國內(nèi)共有26家大模型初創(chuàng)公司拿到融資,基本是種子輪或天使輪。與此相對應(yīng)的是,截至目前,共有超過130家公司發(fā)布大模型相關(guān)產(chǎn)品。
“市場上的投資人正越來越謹(jǐn)慎,資金也在逐漸減少。”秦興虎注意到,相比“井噴期”投資者的“一擲千金”,如今的他們對大模型項目的市場需求、技術(shù)實力、商業(yè)模式以及團(tuán)隊能力等方面的情況會有更多考量。于是他選擇先在一些醫(yī)院開展試點項目,以證明自己的技術(shù)實力和市場潛力,從而吸引更多的投資。
“現(xiàn)在吸引投資人的核心就是能實際產(chǎn)生經(jīng)濟(jì)效益,你只有掙錢了,才能證明是有價值的?!眱H僅幾個月間,劉呈輝的明顯感受是,投資人對于“投概念”和“產(chǎn)生收入”的包容周期正越來越短。
《IT時報》記者了解到,目前大模型商業(yè)模式分為to B和to C兩類,其中像ChatGPT這樣靠訂閱付費實現(xiàn)盈利的爆款A(yù)pp走的是面向C端的模式,而國內(nèi)面向C端的人工智能應(yīng)用則多為免費。
關(guān)于國內(nèi)的大模型創(chuàng)業(yè)公司商業(yè)化,王宸禹指出了目前的兩個主要路徑:首先是將國產(chǎn)大模型作為云端API服務(wù),提供給開發(fā)者和企業(yè),通過訂閱或按計時計費的方式進(jìn)行商業(yè)化運營。
其次是垂直領(lǐng)域的解決方案,即開發(fā)專門針對特定垂直領(lǐng)域的解決方案,比如醫(yī)療、金融、法律等,為不同行業(yè)提供定制化的大模型服務(wù),降低門檻,提高行業(yè)滿足度。
在兩個路徑中,定制化的解決方案似乎成為未來大模型創(chuàng)業(yè)的一大趨勢。
如浦因科技自主研發(fā)的“以眼識病”人工智能模型,可以識別幾乎所有的眼科疾病,同時還能識別人體系統(tǒng)性疾病,包括糖尿病、缺血性中風(fēng)、心肌梗死、心衰和帕金森病等。秦興虎表示,公司另一項基于人工智能的技術(shù),通過訓(xùn)練之后,建立的模型可以提供超過50多種常見慢性病和復(fù)雜性疾病的風(fēng)險預(yù)測。
大模型創(chuàng)業(yè)公司們掙到錢了嗎?“目前的環(huán)境是雷聲大雨點小,公司多收入少?!眲⒊瘦x認(rèn)為,如今國內(nèi)在應(yīng)用層能產(chǎn)生實際應(yīng)用和實際收入的場景和公司還非常少,相比之下,有自己垂直模型、場景能掙到錢的公司,才能真正獲得投資者青睞。
劉呈輝舉例,如醫(yī)者AI專注“大模型+大健康”的領(lǐng)域,以自研的MoE架構(gòu)健康大模型,賦能“大健康”賽道公司,以AI Agents方式為消費者提供健康管理服務(wù),“我們和體檢機(jī)構(gòu)合作,提供SARS、健康問題解答和報告解讀,干的是健康產(chǎn)業(yè)鏈中人力密集度特別高的事情,大模型在這個場景下解決了之前技術(shù)無法解決的問題,為企業(yè)節(jié)約了大量人工成本,企業(yè)才愿意為此買單?!?/p>
排版/ 季嘉穎