文|新摘商業(yè)評(píng)論 洛枳 辛夷
ChatGPT上線的兩百天里,國(guó)內(nèi)大模型發(fā)展開啟“狂飆”模式。
據(jù)稱,中國(guó)10億參數(shù)規(guī)模以上的大模型已發(fā)布79個(gè)。
大模型進(jìn)化場(chǎng),講究一個(gè)百模混戰(zhàn):百度文心大模型已進(jìn)化至3.5形態(tài);阿里通義千問構(gòu)建家族模式;京東言犀大模型則是為自己“量身定做”的產(chǎn)業(yè)大模型;美團(tuán)牽手清華系,領(lǐng)投AI公司智譜華章;360智腦將接入“360全家桶”……
大廠大模型進(jìn)化論,殘酷又現(xiàn)實(shí),要么趕超,要么被淘汰。物競(jìng)天擇,適者生存,大廠大模型紛紛趕超ChatGPT。
可以看出,大廠大模式,拼研發(fā)的時(shí)刻到了。
大廠大模型哪家強(qiáng)?
今年上半年正式公開宣布做大模型的企業(yè)就有近百家,各家大模型正陷入酣戰(zhàn)。其中,有阿里、百度、騰訊、京東、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠玩家,也有科大訊飛、商湯科技等AI公司,還有其他“雜牌軍”也混入其中。
半年時(shí)間,大模型賽道完成了從概念到落地的進(jìn)程,這放在任何賽道都很炸裂。
但是,到目前為止,都沒有明確的指標(biāo)或者準(zhǔn)則去驗(yàn)證誰(shuí)家的大模型更優(yōu)質(zhì),一個(gè)接著一個(gè)發(fā)布會(huì),“王婆賣瓜自賣自夸”式的自我評(píng)價(jià),令人眼花繚亂之余,并沒有太多客觀性。
那么,百模大戰(zhàn),究竟誰(shuí)更勝一籌?
在IDC最新發(fā)布的《AI大模型技術(shù)能力評(píng)估報(bào)告,2023》中,首次提出AI大模型技術(shù)能力評(píng)估框架。
評(píng)估大模型共有三大維度:產(chǎn)品技術(shù)、服務(wù)生態(tài)、行業(yè)應(yīng)用。
具體細(xì)分指標(biāo)可達(dá)12個(gè):算法模型、服務(wù)能力、通用能力、創(chuàng)新能力、平臺(tái)能力、安全可解釋、生態(tài)合作、行業(yè)覆蓋、金融、工業(yè)、醫(yī)療、能源。
其中,算法模型和行業(yè)覆蓋,是衡量大模型能力最重要的2個(gè)指標(biāo),特別是,二者可以形成持續(xù)迭代提升的飛輪。
產(chǎn)品技術(shù)能力中,“算法模型”維度是大模型能力最為核心的要素,也是決定大模型應(yīng)用效果的根本所在。
原因在于,只有通過(guò)算法模型技術(shù)的突破,實(shí)現(xiàn)具有通用效果優(yōu)勢(shì)的大模型底座,才能支撐更廣泛的行業(yè)覆蓋,使各行各業(yè)充分享受技術(shù)突破帶來(lái)的紅利,破解AI落地門檻高的困境。
行業(yè)應(yīng)用能力中,應(yīng)用覆蓋的廣度是當(dāng)下大模型廠商最為關(guān)注的指標(biāo),是大模型效果通用領(lǐng)先性、行業(yè)結(jié)合能力的綜合體現(xiàn)。
所以,“行業(yè)覆蓋”通過(guò)企業(yè)級(jí)客戶數(shù)量和落地行業(yè)數(shù),體現(xiàn)了大模型在產(chǎn)業(yè)落地上的實(shí)力。
國(guó)內(nèi)主流大模型,包括百度、阿里、騰訊、華為、科大訊飛、360、商湯、第四范式等14家廠商參與了本次評(píng)估。
大廠大模型的競(jìng)爭(zhēng)咬合度很高,百度特點(diǎn)具有“芯片-框架-模型-應(yīng)用”四層技術(shù)棧完整布局的獨(dú)特優(yōu)勢(shì):芯片層-昆侖芯、框架層-飛槳、模型層-文心大模型,以及各種AI的落地應(yīng)用。
阿里云,也很亮眼,12項(xiàng)指標(biāo)獲得6項(xiàng)滿分,且是唯一獲得“服務(wù)能力”滿分的廠商。作為基礎(chǔ)模型提供方,大模型廠商的平臺(tái)能力、服務(wù)能力和生態(tài)合作水平對(duì)行業(yè)發(fā)展至為重要。阿里云在這三個(gè)指標(biāo)上都獲得了滿分。
目前,阿里云的通義大模型家族現(xiàn)已具備處理或生成文本、語(yǔ)音和圖片等多種模態(tài)的能力。過(guò)去3個(gè)月,阿里云先后推出了基礎(chǔ)模型“通義千問”、音視頻大模型產(chǎn)品“通義聽悟”、 AI繪畫創(chuàng)作大模型“通義萬(wàn)相”,通義大模型家族仍在不斷迭代和進(jìn)化中。
同為互聯(lián)網(wǎng)大廠的騰訊云和京東云,都選擇根據(jù)自身特色,深耕產(chǎn)業(yè)側(cè),發(fā)布行業(yè)大模型。
騰訊云在構(gòu)建行業(yè)大模型的基礎(chǔ)上,用自身數(shù)據(jù)進(jìn)行微調(diào),打造出數(shù)據(jù)精準(zhǔn)性更高、隱私安全性更強(qiáng)的專屬模型。
對(duì)于深耕數(shù)年供應(yīng)鏈的京東來(lái)說(shuō),長(zhǎng)期扎根于電商業(yè)務(wù)和物流業(yè)務(wù),選擇奔向產(chǎn)業(yè)大模型,專注于供應(yīng)鏈?zhǔn)歉玫倪x擇。正如京東在言犀大模型發(fā)布會(huì)上所言,“只有將供應(yīng)鏈做實(shí),才能將大模型做實(shí)”。
科大訊飛等AI廠家在垂直賽道也拿到了滿分,這些玩家在做透垂直行業(yè)上有機(jī)會(huì),在廠商競(jìng)爭(zhēng)中,垂直領(lǐng)域優(yōu)勢(shì)明顯企業(yè)將領(lǐng)先。
以科大訊飛為例,科大訊飛專注人工智能領(lǐng)域20多年,多項(xiàng)核心技術(shù)均處于國(guó)際領(lǐng)先水平,星火大模型將大模型的語(yǔ)言理解能力、概括表達(dá)能力結(jié)合類搜索插件,有效解決了新知識(shí)難以更新、事實(shí)類問答容易“張冠李戴”等行業(yè)難題,實(shí)現(xiàn)了知識(shí)問答能力相比原來(lái)24%的提升。
由于訓(xùn)練大模型的成本極高,普通開發(fā)者和中小企業(yè)無(wú)從下手,這從報(bào)告結(jié)果也能看出:其他廠也很努力,但前途漫漫,說(shuō)得更殘酷些,可能連上桌吃飯的機(jī)會(huì)都少有。
大模型未來(lái)通往何方?
在前不久的WAIC大會(huì)上,入場(chǎng)大模型的玩家們其實(shí)已經(jīng)劃出了重點(diǎn):首先解決技術(shù)問題,再是場(chǎng)景落地,最后實(shí)現(xiàn)商業(yè)與規(guī)?;?。
目前,我們看到大模型已經(jīng)開始與場(chǎng)景、行業(yè)進(jìn)行深度融合,例如,代碼生成、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)等領(lǐng)域的大模型,驗(yàn)證了大模型已不僅在科技企業(yè)中應(yīng)用,也邁出了走向各行各業(yè)的步伐。
國(guó)內(nèi)大模型飛快躍過(guò)大模型概念股階段,AI大模型已經(jīng)從拼參數(shù)發(fā)展到拼應(yīng)用。
比如,華為盤古大模型已經(jīng)在氣象、醫(yī)藥研發(fā)、電力、語(yǔ)種等領(lǐng)域落地,并交付了多個(gè)千億參數(shù)大模型。騰訊云行業(yè)大模型能力將應(yīng)用到金融風(fēng)控、交互翻譯、數(shù)智人客服等場(chǎng)景中,提升了智能應(yīng)用效率,一站式MaaS服務(wù)為企業(yè)減負(fù)。
具體到應(yīng)用場(chǎng)景,以金融領(lǐng)域?yàn)槔?,行業(yè)大模型可以加持金融風(fēng)控解決方案,相比之前有了10倍效率提升。
大模型結(jié)合過(guò)往積累的多年黑灰產(chǎn)對(duì)抗經(jīng)驗(yàn)和上千個(gè)真實(shí)業(yè)務(wù)場(chǎng)景,整體反欺詐效果相較于傳統(tǒng)模式,提升了20%左右。企業(yè)則可以基于prompt模式,迭代風(fēng)控能力,從樣本收集、模型訓(xùn)練到部署上線,實(shí)現(xiàn)全流程零人工參與,建模時(shí)間也從2周減少到僅需2天。
即便樣本積累有限的情況下,也可以完成快速搭建,跳過(guò)“冷啟動(dòng)”過(guò)程。
如何落地及商業(yè)化,正在成為廠商追求的重點(diǎn)。
這意味著,AI進(jìn)入大規(guī)??蓮?fù)制的產(chǎn)業(yè)落地階段,僅利用下游的小樣本或者零樣本學(xué)習(xí)就可以達(dá)到很好的效果,從而降低AI開發(fā)成本。百度文心大模型在升級(jí)后,就成功將成本降至過(guò)去的10%。
任何行業(yè),最終都會(huì)形成寡頭態(tài)勢(shì),大模型也不例外。
過(guò)去短短幾個(gè)月,大量新的大模型涌現(xiàn),是瘋狂想抓住風(fēng)口,害怕掉隊(duì),還是長(zhǎng)遠(yuǎn)布局賽道,潛心鉆研,每位玩家只有自己心知肚明。
百?;鞈?zhàn)只會(huì)是一個(gè)階段性的現(xiàn)象,終局仍然集中在少量的幾個(gè)大模型。原因不外乎以下幾點(diǎn):
一是,在演變過(guò)程中,各企業(yè)和機(jī)構(gòu)逐漸找到了自己的定位,逐漸走向細(xì)分方向,最終被更完善的大模型收入麾下。
二是,需要多年積累。真正從底層做起來(lái)的大模型,成本非常高,需要非常綜合的能力,在心態(tài)上也必須抱有絕對(duì)的長(zhǎng)期主義,這就意味著沒有絕對(duì)經(jīng)濟(jì)實(shí)力的玩家,會(huì)被甩在半路或者“死”在通往光明的路上。
三是,大模型在應(yīng)用層面未來(lái)想象空間非常大。假設(shè)每一個(gè)行業(yè)都有巨大的發(fā)展空間,可以通過(guò)新AI技術(shù)提效,應(yīng)用層面的價(jià)值一定會(huì)分流,依托幾個(gè)頭部大模型會(huì)有非常廣泛的應(yīng)用生態(tài)。
不可否認(rèn)的是,未來(lái)所有的企業(yè)都會(huì)強(qiáng)依賴大模型,所有的產(chǎn)品都會(huì)基于大模型來(lái)開發(fā)。
而行業(yè)滲透率和市場(chǎng)份額,儼然成為企業(yè)大模型走向寡頭最重要的挑戰(zhàn)元素。