文 | 產(chǎn)業(yè)家 斗斗
編輯 | 皮爺
政企領(lǐng)域,似乎正在成為AI落地的又一標(biāo)的。
幾個(gè)最新的動(dòng)態(tài)是:新華三針對(duì)政企客戶發(fā)布私域大模型“百業(yè)靈犀”LinSeer、中國(guó)電科發(fā)布專為黨政企行業(yè)用戶服務(wù)的AIGC大模型“小可”、百應(yīng)科技發(fā)布政務(wù)行業(yè)專有大模型“萬(wàn)機(jī)”……百度智能云、阿里云、三六零、科大訊飛、商湯等也都在針對(duì)政企客戶,發(fā)布了相關(guān)產(chǎn)品和解決方案。
這一趨勢(shì)同樣發(fā)生在海外。有消息稱微軟正在使用其 Azure 云服務(wù)把 OpenAI 的強(qiáng)大的語(yǔ)言生成模型引入政府機(jī)構(gòu),這些模型包括 OpenAI 最新、最先進(jìn)的大型語(yǔ)言模型(LLM)GPT-4以及 GPT-3。
然而,從國(guó)內(nèi)發(fā)布政企大模型的各大廠商的動(dòng)作來(lái)看,并未有較多的落地案例。背后的原因有很多,一是產(chǎn)品發(fā)布時(shí)間短,無(wú)法及時(shí)得到較大反饋;二是由大模型引起的AI熱潮還處于爆發(fā)期,政企對(duì)于合作廠商的選擇還需考量。
除了這些因素之外,幾個(gè)關(guān)鍵的問(wèn)題是,這些廠商針對(duì)政企客戶發(fā)布的AI產(chǎn)品,真的是政企所需要的嗎?再或者,于政企而言,其需要什么樣的AI產(chǎn)品與服務(wù)?
一、政企市場(chǎng),“觀望”AI
“我們接觸的客戶都在探索這方面的內(nèi)容,政企會(huì)有這方面的訴求。”某業(yè)內(nèi)人士告訴產(chǎn)業(yè)家,“但對(duì)于AI大模型在政企領(lǐng)域的應(yīng)用,大家都處于觀望+探索的階段?!?/p>
在國(guó)內(nèi),政企普遍體量大、業(yè)務(wù)復(fù)雜、定制化要求高,有著沉重的IT建設(shè)包袱,各部門、業(yè)務(wù)之間難以協(xié)同,數(shù)據(jù)壁壘也難以打破,這使得政企的數(shù)字化轉(zhuǎn)型困難重重。
而大模型可以把人與人、人與機(jī)器之間的交互過(guò)程數(shù)據(jù)完整的沉淀下來(lái),讓它自主學(xué)習(xí)進(jìn)步,持續(xù)演進(jìn)。杜絕了過(guò)去的煙囪式建設(shè),降本增效的同時(shí)還能推動(dòng)政企數(shù)字化進(jìn)程。
這種技術(shù)應(yīng)用的趨勢(shì),推動(dòng)著諸多廠商開(kāi)始將自身的TOG產(chǎn)品與大模型結(jié)合。
不過(guò)客觀來(lái)看,當(dāng)下雖然深耕AI產(chǎn)業(yè)鏈的玩家眾多,但在政企領(lǐng)域,出于對(duì)算力、行業(yè)專業(yè)度、數(shù)據(jù)安全、國(guó)產(chǎn)化等各方因素的考量,廠商難以給出合適的AI解決方案。
AI大模型作為數(shù)字化的新基建,如何賦能行業(yè)仍需不斷探索、實(shí)踐。很多企業(yè)也在不斷進(jìn)行新的嘗試。
周鴻祎曾在微博上發(fā)文表示,“大型企業(yè)或者政府要私有化大模型。即在加入公有GPT知識(shí)和能力的基礎(chǔ)上,再訓(xùn)練一個(gè)私有的GPT,只給企業(yè)自己或客戶使用。”
與周鴻祎有相同見(jiàn)解的,還有新華三安全產(chǎn)品研發(fā)總監(jiān)韓小平。
“政企大模型一方面數(shù)據(jù)不能出域;一方面需要結(jié)合其業(yè)務(wù)場(chǎng)景數(shù)據(jù)進(jìn)行喂養(yǎng)訓(xùn)練,生成實(shí)際的業(yè)務(wù)場(chǎng)景App?!?/p>
他認(rèn)為,政企大模型技術(shù)本身其實(shí)不是唯一考量的因素,更重要的是對(duì)用戶業(yè)務(wù)的理解。政企AI服務(wù),行業(yè)Know-how仍是關(guān)鍵,沒(méi)有政企業(yè)務(wù)服務(wù)經(jīng)驗(yàn)的廠商,難以結(jié)合大模型設(shè)計(jì)出個(gè)性化的解決方案。
兩人都將政企AI大模型的落地方式瞄準(zhǔn)了私有化。
二、私有化,會(huì)是一個(gè)好的選擇嗎?
“全面禁止使用ChatGPT”這句話時(shí)不時(shí)就會(huì)喜提科技榜熱搜,最近一次的主角是三星。
具體源于三星允許半導(dǎo)體部門的工程師使用ChatGPT參與修復(fù)源代碼問(wèn)題。但在過(guò)程當(dāng)中,員工們輸入了機(jī)密數(shù)據(jù),包括新程序的源代碼本體、與硬件相關(guān)的內(nèi)部會(huì)議記錄等數(shù)據(jù)。
起初三星全面禁止使用ChatGPT,自3月11日開(kāi)始才部分開(kāi)放給DS部門使用,卻沒(méi)想到在短短時(shí)間內(nèi)就傳出機(jī)密外泄。
諸如此類機(jī)密數(shù)據(jù)泄漏事件,層出不窮。
在海外市場(chǎng),蘋果、三星、摩根大通、花旗銀行等知名企業(yè)都曾明確表示,禁止或限制員工在工作場(chǎng)合使用ChatGPT等大模型產(chǎn)品。
事實(shí)上,大模型的底層邏輯是將行業(yè)數(shù)據(jù)標(biāo)注出來(lái)進(jìn)行深度學(xué)習(xí),訓(xùn)練出專注于某一行業(yè)的垂直模型。這也意味著,企業(yè)的數(shù)據(jù)要集成到通用大模型的數(shù)據(jù)池中。
然而,政企的數(shù)據(jù)大多涉及商業(yè)機(jī)密、個(gè)人隱私等問(wèn)題,對(duì)數(shù)據(jù)安全要求甚高。
所以,數(shù)據(jù)不出域,成為關(guān)鍵。而私有大模型無(wú)疑是政企的必選項(xiàng)。
不過(guò),私有化意味著需要政企客戶自己收集數(shù)據(jù)進(jìn)行訓(xùn)練。一般情況下,AI決策的及時(shí)性和準(zhǔn)確性,取決于數(shù)據(jù)質(zhì)量、數(shù)量以及算力。這意味著輸入預(yù)訓(xùn)練模型的數(shù)據(jù)維度、數(shù)量越多,質(zhì)量越高,才能真正發(fā)揮大模型真正價(jià)值。
一個(gè)有爭(zhēng)議的點(diǎn)是,專業(yè)廠商打造的私有模型,比起通用大模型的能力,能否滿足政企需求。
3月30日,彭博社創(chuàng)始人布隆伯格發(fā)布了一片論文,即BloombergGPT: A Large Language Model for Finance。
在論文中,介紹了其以模3630億token的金融領(lǐng)域數(shù)據(jù)集以及3450億token的通用數(shù)據(jù)集訓(xùn)練出來(lái)的金融大語(yǔ)言模型。并進(jìn)行金融領(lǐng)域評(píng)估與通用領(lǐng)域評(píng)估。
結(jié)果顯示,在金融領(lǐng)域任務(wù)上,該模型綜合表現(xiàn)最好;在通用任務(wù)上,該模型的綜合得分同樣優(yōu)于相同參數(shù)量級(jí)的其他模型,并且在某些任務(wù)上的得分要高于參數(shù)量更大的模型。
這意味著,基于專業(yè)領(lǐng)域語(yǔ)料訓(xùn)練的大模型,在領(lǐng)域內(nèi)的理解要超過(guò)通用大模型。
一個(gè)啟示是,在其他特定領(lǐng)域,也可以開(kāi)發(fā)專用的大語(yǔ)言模型,并且效果可能比通用大模型更好。
然而,這個(gè)評(píng)估實(shí)驗(yàn)的結(jié)論仍無(wú)法代表所有行業(yè),有些問(wèn)題仍需要被正視,例如中外金融數(shù)據(jù)維度、質(zhì)量其實(shí)有著較大的差距,該金融模型作為第一個(gè)行業(yè)模型,更換不同維度、質(zhì)量的數(shù)據(jù),能否保持其結(jié)論的準(zhǔn)確性,還未得知。
另外,除政務(wù)系統(tǒng)、城市大腦以及金融等數(shù)據(jù)敏感的政企場(chǎng)景,其他終端場(chǎng)景,通用大模型的語(yǔ)料數(shù)據(jù)仍有很大優(yōu)勢(shì)。
所以,對(duì)于政企而言,其需要的AI服務(wù)是能在保證數(shù)據(jù)安全的同時(shí),還可以能集成通用大模型作為能力補(bǔ)充。
三、政企大模型,亦需“群戰(zhàn)”
術(shù)業(yè)有專攻,大模型能力同樣如此。
在政務(wù)AI大模型應(yīng)用方面,周鴻祎曾直言,預(yù)測(cè)未來(lái)中國(guó)不會(huì)只有一個(gè)大模型,每個(gè)城市、每個(gè)政府部門都會(huì)有自己的專有大模型。
信創(chuàng)化的浪潮下,全技術(shù)棧的國(guó)產(chǎn)化已經(jīng)成為服務(wù)政企客戶的準(zhǔn)入門檻。所以對(duì)于政企而言,信創(chuàng)生態(tài)能力成為其選擇廠商的重要標(biāo)準(zhǔn)。
目前來(lái)看,能實(shí)現(xiàn)全技術(shù)棧國(guó)產(chǎn)化的AI大模型廠商屈指可數(shù)。能否吸引更多信創(chuàng)伙伴成為關(guān)鍵,取長(zhǎng)補(bǔ)短,或?qū)?shí)現(xiàn)雙贏。
此外,在國(guó)產(chǎn)化的基礎(chǔ)上,不同的場(chǎng)景應(yīng)用,也需要與不同的廠商合作,例如互聯(lián)網(wǎng)云廠商在終端軟件應(yīng)用的優(yōu)勢(shì);運(yùn)營(yíng)商的網(wǎng)絡(luò)優(yōu)勢(shì);華為在芯片、系統(tǒng)上的優(yōu)勢(shì)。
除了基于客戶需求的合作,還有來(lái)自算力等資源稀缺所帶來(lái)的壓力。
AI新一輪熱潮襲來(lái),服務(wù)器需要配備大量GPU/NPU/FPGA/ASIC等芯片以支持高算力,但就目前來(lái)看,算力不僅價(jià)格高昂且資源緊張。
目前,支撐包括ChatGPT大模型在內(nèi)的95%用于機(jī)器學(xué)習(xí)的芯片都是英偉達(dá)的A100(或者國(guó)內(nèi)使用的替代產(chǎn)品A800),該芯片的單價(jià)超過(guò)1萬(wàn)美元。此外,英偉達(dá)最新一代的H100芯片的性能也遠(yuǎn)超A100,但價(jià)格也更高,約合25萬(wàn)元人民幣。
而在取長(zhǎng)補(bǔ)短的AI大模型產(chǎn)業(yè)生態(tài)下,將大幅度杜絕模型的重復(fù)搭建、實(shí)現(xiàn)數(shù)據(jù)的重復(fù)利用,大大節(jié)約算力資源利用率。同時(shí)還可以減少政企客戶的AI部署成本。
所以,對(duì)于布局政企大模型的廠商而言,在私有化的前提下,通過(guò)開(kāi)源、API接口等形式,以通用大模型和客戶或自身集成的數(shù)據(jù),幫助客戶調(diào)教模型,形成定制化的AI產(chǎn)品,或?qū)⑼苿?dòng)政企大模型快速落地。
一些廠商也正在驗(yàn)證了這種路徑的可行性。
例如中國(guó)電科面向黨政企,提供“通用智能模型大循環(huán) + 行業(yè)智能模型小循環(huán)”雙循環(huán)、“模型訓(xùn)練 + 測(cè)試評(píng)估 + 場(chǎng)景精調(diào) + 可信增強(qiáng)”四階段的行業(yè)應(yīng)用新范式。
再比如,新華三面向政企發(fā)布的百業(yè)靈犀LinSeer既支持“私域大模型+新華三ICT基礎(chǔ)架構(gòu)”的模式保障數(shù)據(jù)安全,也支持“客戶自選大模型+新華三ICT基礎(chǔ)架構(gòu)”的模式滿足多種需求。
政企AI服務(wù)的走向逐漸清晰,即政企或許更需要“自助餐”式的服務(wù)模式??蛻艨梢赃x擇適合自身需求的芯片、模型技術(shù)方、數(shù)據(jù)集成方、軟件廠商等。
經(jīng)歷過(guò)多次寒冬的AI,能否抓住這次時(shí)代的機(jī)遇,仍需時(shí)間來(lái)驗(yàn)證。