正在閱讀:

大模型落地,痛并堅(jiān)持著

掃一掃下載界面新聞APP

大模型落地,痛并堅(jiān)持著

當(dāng)下國內(nèi)業(yè)界對(duì)大模型態(tài)度發(fā)生轉(zhuǎn)變,落地預(yù)期回歸理性,左手閉源,右手開源。兩手都要抓,兩手都要硬。

文|數(shù)智前線 趙艷秋 周享玥

編輯|牛慧

在經(jīng)歷數(shù)個(gè)月的探索后,國內(nèi)首批大模型的行業(yè)落地進(jìn)展浮出水面,而這些代表性企業(yè)的動(dòng)作引發(fā)業(yè)界關(guān)注。

大模型已給一些行業(yè)帶去質(zhì)變,但也并不像當(dāng)初憧憬的那樣豐富多彩,而開源大模型給市場界格局帶來變數(shù),產(chǎn)業(yè)界暗流涌動(dòng)。

01、浮出水面的行業(yè)實(shí)踐

8月15日,在北京舉辦的百度WAVE SUMMIT 2023峰會(huì)期間,國家電網(wǎng)智研院知識(shí)計(jì)算技術(shù)主管張強(qiáng)分享了大模型在國網(wǎng)電力設(shè)備運(yùn)檢上的落地探索。

“整個(gè)電網(wǎng)的設(shè)備規(guī)模超過了4萬億,而與設(shè)備相關(guān)的標(biāo)準(zhǔn)、產(chǎn)品資料、故障案例等,是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素?!睆垙?qiáng)說。目前大模型實(shí)踐以設(shè)備為核心切入點(diǎn)。會(huì)后,張強(qiáng)打開手機(jī)上的工作App為數(shù)智前線演示,相關(guān)業(yè)務(wù)模塊已接入大模型,基層班組可獲得設(shè)備運(yùn)檢中的相關(guān)判據(jù)和依據(jù)來源。

區(qū)別于互聯(lián)網(wǎng)行業(yè),工業(yè)的專業(yè)知識(shí)樣本稀缺,積累困難,大模型的訓(xùn)練過程,也是對(duì)這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程,這期間有很多挑戰(zhàn)?,F(xiàn)在,國網(wǎng)智研院的行業(yè)預(yù)訓(xùn)練語言模型參數(shù)超過70億,正在進(jìn)行150億參數(shù)的電力認(rèn)知大模型全量精調(diào)訓(xùn)練。

一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,類似國網(wǎng),他們落地中進(jìn)度較好的也是面向內(nèi)部員工的文檔知識(shí)問答。此前,員工檢索企業(yè)內(nèi)部文獻(xiàn)文檔很費(fèi)勁。原先知識(shí)圖譜技術(shù)手段,成本高,需要標(biāo)注很多數(shù)據(jù),訓(xùn)練很多小模型,而回答問題的覆蓋度還較低。有了大模型,只要把文檔做簡單預(yù)處理,“丟給”大模型,大模型學(xué)習(xí)后就能直接回答問題,還能提供知識(shí)溯源出處,回答的覆蓋度也較高,“這是對(duì)原來知識(shí)管理賽道很大的顛覆”。

除了能源企業(yè),在7月華為開發(fā)者大會(huì)HDC期間,工商銀行人工智能和大數(shù)據(jù)實(shí)驗(yàn)室副總經(jīng)理黃炳也介紹了大模型的初步實(shí)踐,例如輔助客服人員,能將專業(yè)知識(shí)轉(zhuǎn)化為“大白話”的知識(shí)運(yùn)營助手,為投研團(tuán)隊(duì)提供晨報(bào)的生成服務(wù),以及工行辦公系統(tǒng)中的文案創(chuàng)作、網(wǎng)訊編寫、會(huì)議摘要等。有趣的是,網(wǎng)訊編寫經(jīng)過模型訓(xùn)練,會(huì)有“工行文風(fēng)”。

黃炳介紹,這些場景都是人機(jī)協(xié)作,對(duì)員工和管理層有感知。比如,投研團(tuán)隊(duì)用的晨報(bào)生成服務(wù),過去雇傭?qū)嵙?xí)生花費(fèi)1個(gè)小時(shí),現(xiàn)在只需5分鐘。

在能源、金融之外,上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,基于通用大模型訓(xùn)練的行業(yè)模型,在三類醫(yī)藥相關(guān)場景中最先落地。

其中一類是與幾家連鎖藥店做的藥事服務(wù),可提升店員的專業(yè)度;一類是輔助醫(yī)生的臨床科研,比如文獻(xiàn)整理和自動(dòng)總結(jié)、醫(yī)療領(lǐng)域?qū)I(yè)的Meta分析?!耙郧白鲆黄狹eta分析至少3~6個(gè)月,現(xiàn)在只需花10分鐘。”唐珂軻說,自己之前做過科研,能感知到大模型對(duì)臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,這部分此前基本是缺失的。他們目前在廣東、湖南等地,與不同醫(yī)院落地了針對(duì)不同腫瘤的模型,支撐乳腺癌、肝癌、肺癌等患者出院后的服務(wù),這是腫瘤患者非常需要的。

唐珂軻稱,醫(yī)療數(shù)據(jù)相對(duì)的封閉性,會(huì)給行業(yè)模型訓(xùn)練帶來挑戰(zhàn)。但他看好大模型對(duì)行業(yè)的前景改變?!叭ツ暝诖罱ɑ颊呋卦L系統(tǒng)時(shí),技術(shù)實(shí)施復(fù)雜度“令人頭疼”,但今年在大模型基礎(chǔ)上投喂幾千條數(shù)據(jù),效果就不錯(cuò)”。

上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線,在落地實(shí)踐中,大模型在AI助手、知識(shí)管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司。談到大模型成本,曾佑軒介紹,目前AI助手的費(fèi)用已做到每月每人10元。這并不像大家想象中那么高昂。

大模型已在為企業(yè)降本增效。一位云計(jì)算資深人士告訴數(shù)智前線,他了解原來某大型家具企業(yè),外包客服要請(qǐng)數(shù)百人,現(xiàn)在已縮減到小幾十人。“像這種項(xiàng)目,企業(yè)幾十萬可以搞定,又能節(jié)約成本,是比較好的落地。”

02、“大家都冷靜理性了”

在大模型的落地實(shí)踐中,行業(yè)對(duì)大模型有了更深入的認(rèn)知,很多企業(yè)調(diào)整了預(yù)期,“大家冷靜理性了。”

“我們從今年初開始重點(diǎn)關(guān)注大模型,當(dāng)時(shí)的想法是要把大模型更好地用起來?!币晃荒茉创笃髽I(yè)人工智能專家近日告訴數(shù)智前線,“但在逐漸用的過程中,我們發(fā)現(xiàn)不是那么理想,也不會(huì)那么快。”

他們現(xiàn)在偏向于先支撐內(nèi)部人員,因?yàn)椤按竽P偷幕卮穑绕涫鞘聦?shí)類的還不是太好”,直接開放給客戶還有一定風(fēng)險(xiǎn)。而面向內(nèi)部,會(huì)經(jīng)過大家的過濾、判斷和把關(guān)。內(nèi)部人員再結(jié)合他們的理解,對(duì)外來服務(wù)?!拔覀儠?huì)灰度地去過渡,逐步開放一些功能。”

無獨(dú)有偶,工行目前的應(yīng)用也先從內(nèi)部開始,優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,且“場景肯定有錯(cuò)誤容忍度”。

實(shí)際上,大模型的實(shí)際落地與當(dāng)初的預(yù)期存在一定落差?!按竽P湍芙鉀Q的問題,比一開始想象的要少很多。”一位行業(yè)資深人士告訴數(shù)智前線。

造成這個(gè)落差的原因有多方面。從場景上說,ChatGPT剛出來時(shí),大家對(duì)大模型有很多憧憬,一位云計(jì)算人士舉例,曾有企業(yè)找他咨詢,AI能不能替代采購,因?yàn)椴少彮h(huán)節(jié)最易滋生腐敗,老板都想把這塊監(jiān)管或考慮用技術(shù)取代。但采購不是一個(gè)簡單決策,需要綜合考量。

“很多企業(yè)要么完全不知道怎么用,要么就是天馬行空,但因?yàn)樘岢龅膱鼍皬?fù)雜、決策鏈太長,實(shí)際做不到?!彼f。而另一些人士認(rèn)為,大家可能把大模型與通用人工智能混為一談。

從技術(shù)角度看,在醫(yī)療、教育等一些專業(yè)度、準(zhǔn)確度要求高的客服場景,大語言模型的幻覺是個(gè)問題。當(dāng)他們把行業(yè)數(shù)據(jù)注入到基礎(chǔ)大模型時(shí),不管是微調(diào),還是其他手段,模型能吸納并能轉(zhuǎn)化成正確輸出的,大概有70%到80%。這就要求不得不用更多辦法,去處理那20%到30%的錯(cuò)誤率。

“但目前沒有特別低成本和快速的辦法。”上述人士反饋,很多東西需要去做強(qiáng)化學(xué)習(xí)和復(fù)雜的人工標(biāo)定,所花的成本可能是現(xiàn)在成本基礎(chǔ)再乘以10甚至更多,這讓很多企業(yè)難以接受。

針對(duì)上述兩個(gè)問題,聚焦領(lǐng)域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,在場景選擇上,他覺得接下來適合大模型進(jìn)一步落地的較好賽道,是專業(yè)性較高,且容錯(cuò)性較高的場景,如企業(yè)知識(shí)問答、營銷機(jī)器人、坐席助手。而通用性太高或容錯(cuò)性又比較低的場景,如自動(dòng)駕駛,不是特別好的商業(yè)賽道。

從技術(shù)層面,張杰認(rèn)為不是某一套大模型的應(yīng)用技術(shù)路線,就可以非常完美地解決問題,他介紹了三種由淺入深的應(yīng)用技術(shù)路線。

從落地實(shí)踐看,目前,前兩種接受度高。“這三種方法不是3選1,在具體場景下,肯定是一套組合拳。”他補(bǔ)充道。

“大家其實(shí)看到iPhone在2006就出來了,但整個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的開啟是在2012年。”中信建投證券研究所所長、武超則在不久前的行業(yè)會(huì)議上稱,“這個(gè)過程才剛剛開始”。

她認(rèn)為大模型有幾個(gè)階段的演進(jìn),從能聽會(huì)說、能看會(huì)認(rèn)開始,到能夠像人一樣去組合使用工具,從而讓每個(gè)人配一個(gè)“斯坦福畢業(yè)的助理”,再到通用人工智能中的會(huì)規(guī)劃、會(huì)決策。

行業(yè)在不斷深入探索。一位行業(yè)資深人士告訴數(shù)智前線,他們在做教育等行業(yè),客戶數(shù)量較大,在將大模型融入業(yè)務(wù)工作流的過程中,遇到很多問題,“還在去尋找有沒有更能解決問題的方式”。

03、企業(yè)紛紛涌向開源大模型

在大模型落地的過程中,越來越多的國內(nèi)企業(yè)開始采用開源大模型。

一位南方電網(wǎng)人士告訴數(shù)智前線,內(nèi)部現(xiàn)在進(jìn)行大模型嘗試時(shí),“都是基于Llama吧”。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,包含了70億、130億和700億參數(shù)3個(gè)版本。另一位南方電網(wǎng)人士稱,內(nèi)部對(duì)不同開閉源模型正進(jìn)行測試賽馬。

8月,金蝶發(fā)布的財(cái)務(wù)大模型,也基于開源大模型訓(xùn)練而來。金蝶CTO趙燕錫告訴數(shù)智前線,就像手機(jī)操作系統(tǒng)有iOS、安卓一樣,開源模型要打造生成式AI的安卓系統(tǒng),國內(nèi)有像清華ChatGLM,國際上有MPT、Llama,未來是一個(gè)多模型合作的想法。

在金融領(lǐng)域落地中,有資深人士告訴數(shù)智前線,開源、閉源大模型都有,因?yàn)楦鹘鹑跈C(jī)構(gòu)體量不一,策略也不一樣。很多公司先在一個(gè)具體場景下用開源模型做出實(shí)際效果,再考慮復(fù)制推廣,也有幾個(gè)大行對(duì)平臺(tái)做一些戰(zhàn)略性投入,在閉源基礎(chǔ)大模型上,建了一個(gè)類似于中臺(tái)的平臺(tái),期望將來同時(shí)對(duì)接多個(gè)場景。

“之前我們自己訓(xùn)練了兩個(gè)不同參數(shù)的模型,最近我們也在用開源。”中科深智CTO宋健告訴數(shù)智前線。他認(rèn)為,目前絕大部分文本寫作、上下文匹配,130億參數(shù)的模型已夠用,而三四百億參數(shù)的模型,在解決很多垂類問題上已經(jīng)足夠,無論國內(nèi)百川,還是國外的Llama,效果都不錯(cuò)。

一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線,目前開源大模型發(fā)展較快,開源社區(qū)也發(fā)布了很多模型,大部分基于Llama 2微調(diào)而來?!拔覀円矞y試過很多開源和閉源模型,由于我們的目標(biāo)市場需要多語言支持,會(huì)更多考慮Llama 2。如果是面向國內(nèi)市場,一些國內(nèi)的模型也很優(yōu)秀。”

“選擇開源和閉源,實(shí)際上各有優(yōu)缺點(diǎn)。使用開源模型的好處主要是較為自由,包括部署、微調(diào)、升級(jí)和免費(fèi)。閉源的好處是有質(zhì)量保證,免自己部署和應(yīng)用門檻較低?!鄙鲜鲑Y深人士介紹。

他選擇開源的一個(gè)重要原因是認(rèn)為,目前開源模型的繁榮和水平提高呈現(xiàn)一個(gè)明顯趨勢。他打了一個(gè)比喻,開源大模型的水平就好比海平面,閉源大模型相當(dāng)于一個(gè)個(gè)島嶼。目前這些島嶼上漲的速度,跟不上海平面上漲的速度,大部分島嶼將會(huì)被海水淹沒,可能世界上最后就剩下幾座上漲比較快的島嶼。

模型本身現(xiàn)在可選的很多,多位業(yè)內(nèi)人士也贊同,開源和閉源不是客戶會(huì)關(guān)心的問題,“極少客戶會(huì)去指定用哪一款模型”。因?yàn)榭蛻舨⒉恢苯邮褂没A(chǔ)大模型,最終客戶是沒有感知的?!翱蛻舾P(guān)心的是精度、速度和價(jià)格。當(dāng)然最終保證無害性、合法性,這是應(yīng)用開發(fā)商必須解決的問題?!鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說。

張杰告訴數(shù)智前線,因?yàn)殚_源可商用大模型,每一款可能都有自己的優(yōu)缺點(diǎn),比如說有些適合做一些分類型的任務(wù),有些性能比較好,有些可能就生成式的任務(wù)表現(xiàn)比較好,還是要根據(jù)具體場景,一些ROI的需求,選擇不同的模型。

“總體來講,我們覺得接下來大模型非常重要的趨勢,就是開源?!敝行沤ㄍ蹲C券武超則稱,非標(biāo)準(zhǔn)化的場景,非標(biāo)準(zhǔn)化的算力,這種架構(gòu)決定開源可能會(huì)是一個(gè)比較趨同的方向。

04、大廠態(tài)度發(fā)生變化

開源世界的迅速繁榮,也正導(dǎo)致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化。

一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線,Meta推出Llama 2開源模型后,呈現(xiàn)出的效果較好,這對(duì)目前市場上一些大模型來說是個(gè)絕殺。為此,他們已暫緩了對(duì)一些大模型的適配工作,觀望一下再說。

國內(nèi)外大模型大廠也已迅速在策略上做出改變,普遍朝著“左手閉源,右手開源”的方向走。

在國外,微軟除了投資OpenAI閉源大模型,也和Meta實(shí)現(xiàn)牽手,宣布在其Azure云和Windows內(nèi)上線開源的Llama 2。亞馬遜AWS、谷歌云也都在自研大模型基礎(chǔ)上,支持第三方和開源模型。

在國內(nèi),8月初,百度先宣布升級(jí)千帆大模型平臺(tái),接入Llama2全系列、清華ChatGLM2、RWKV等33個(gè)大模型,并對(duì)這些模型進(jìn)行性能增強(qiáng)、推理優(yōu)化等工作;之后,阿里開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,稱“開源、免費(fèi)、可商用”;而在8月16日,騰訊亦亮出新動(dòng)作,宣布騰訊云TI平臺(tái)已接入Llama 2、Falcon、Dolly等20多個(gè)主流模型,旨在打造行業(yè)大模型精選商店。

大廠們何以會(huì)有如此“整齊劃一”的動(dòng)作?

市場需求變化是一個(gè)因素。百度智能云AI與大數(shù)據(jù)平臺(tái)總經(jīng)理忻舟告訴數(shù)智前線,他們發(fā)現(xiàn)市場需求已逐漸進(jìn)入深水區(qū),僅文心一言一個(gè)模型,不能滿足客戶多樣化需求,而如果能把一個(gè)平臺(tái)做好,“會(huì)有更多的流量”。

業(yè)界觀察,7月下旬,百度在對(duì)外表述中,已將原來的“文心千帆大模型平臺(tái)”轉(zhuǎn)變?yōu)椤扒Х竽P推脚_(tái)”,在做“去文心化”。

另一個(gè)現(xiàn)實(shí)因素是,大廠們單個(gè)項(xiàng)目報(bào)價(jià)普遍在千萬元級(jí)別,閉源大模型暫時(shí)還沒能有足夠多的大項(xiàng)目落地。

此外,清華ChatGLM建立了有策略的、組合的商業(yè)模式,把小模型開源出去,吸引商機(jī)和生態(tài),它的閉源大模型也可以為企業(yè)提供定制化服務(wù)。大模型廠商提供一個(gè)開源的但規(guī)模較小的大模型供大家使用,也是一種營銷模式。

一位熟悉阿里云的資深人士也表示,他猜測,上述這些因素也是阿里開源兩款大模型的重要原因之一?!白吡硗庖粭l路試試看?!?/p>

而大模型變現(xiàn)的通路,并不只是模型本身。

數(shù)智前線獲悉,華為在大模型上的考量,算力是重頭之一。7月底到8月初,任正非就大模型有兩次講話,均與算力相關(guān)。

先是成立AI算力先遣隊(duì),由原煤礦軍團(tuán)團(tuán)長鄒志磊負(fù)責(zé)。任正非說,有4000個(gè)客戶想要用華為昇騰平臺(tái)去訓(xùn)練大模型。華為也將可能在10月成立15個(gè)小組去分別服務(wù)15個(gè)客戶。之后,針對(duì)華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,任正非也談及要“在新的淘金時(shí)代賣鏟子”。

無獨(dú)有偶,忻舟介紹,百度在大模型上的商業(yè)模式可分為兩個(gè)層面。從文心一言這個(gè)大模型的角度講,百度賺的是AI的錢。但千帆同時(shí)還是一個(gè)支持其他第三方模型的平臺(tái),本質(zhì)上“還是云的思路,賺云的錢”。

此外,開源對(duì)生態(tài)建設(shè)也是百利而無一害。畢竟大模型被認(rèn)為是智能時(shí)代的操作系統(tǒng),而操作系統(tǒng)比拼的是生態(tài),百度智能云AI平臺(tái)副總經(jīng)理李景秋認(rèn)為,好的開源模型會(huì)極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,進(jìn)而帶來整個(gè)上下游服務(wù)生態(tài)的完善。

今年7月,阿里云也對(duì)外喊出“將促進(jìn)中國大模型生態(tài)的繁榮作為首要目標(biāo)”的口號(hào)?!斑@就類似于原來開源軟件的模式,通過開源來吸引客戶,建立產(chǎn)品的社區(qū)?!币晃淮竽P皖I(lǐng)域資深人士表示。

該人士認(rèn)為,無論國內(nèi)國外、開源閉源,大模型的發(fā)布可能還會(huì)更多,具有通用基礎(chǔ)能力的大模型,可能會(huì)集中到少數(shù)幾個(gè)廠商,但具有行業(yè)細(xì)分的大模型,比較典型的像醫(yī)療、法律、教育,會(huì)有更多廠商去做。另外,基于大模型的能力做出來的應(yīng)用級(jí)產(chǎn)品,會(huì)逐漸繁榮,形成一個(gè)新的生態(tài)和軟件開發(fā)模式,“比如最近比較火的MetaGPT和ToolLLM”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

百度

6k
  • 李彥宏堅(jiān)稱不做視頻生成模型,中國版Sora到底值不值得做?
  • 百度智能云海東數(shù)據(jù)標(biāo)注基地正式啟動(dòng)

騰訊

6.8k
  • “騰訊2萬多名員工將搬遷”系謠言
  • 埃利奧特管理公司據(jù)悉將和西南航空公司達(dá)成和解

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型落地,痛并堅(jiān)持著

當(dāng)下國內(nèi)業(yè)界對(duì)大模型態(tài)度發(fā)生轉(zhuǎn)變,落地預(yù)期回歸理性,左手閉源,右手開源。兩手都要抓,兩手都要硬。

文|數(shù)智前線 趙艷秋 周享玥

編輯|牛慧

在經(jīng)歷數(shù)個(gè)月的探索后,國內(nèi)首批大模型的行業(yè)落地進(jìn)展浮出水面,而這些代表性企業(yè)的動(dòng)作引發(fā)業(yè)界關(guān)注。

大模型已給一些行業(yè)帶去質(zhì)變,但也并不像當(dāng)初憧憬的那樣豐富多彩,而開源大模型給市場界格局帶來變數(shù),產(chǎn)業(yè)界暗流涌動(dòng)。

01、浮出水面的行業(yè)實(shí)踐

8月15日,在北京舉辦的百度WAVE SUMMIT 2023峰會(huì)期間,國家電網(wǎng)智研院知識(shí)計(jì)算技術(shù)主管張強(qiáng)分享了大模型在國網(wǎng)電力設(shè)備運(yùn)檢上的落地探索。

“整個(gè)電網(wǎng)的設(shè)備規(guī)模超過了4萬億,而與設(shè)備相關(guān)的標(biāo)準(zhǔn)、產(chǎn)品資料、故障案例等,是國網(wǎng)公司重要的數(shù)據(jù)資產(chǎn)和生產(chǎn)要素?!睆垙?qiáng)說。目前大模型實(shí)踐以設(shè)備為核心切入點(diǎn)。會(huì)后,張強(qiáng)打開手機(jī)上的工作App為數(shù)智前線演示,相關(guān)業(yè)務(wù)模塊已接入大模型,基層班組可獲得設(shè)備運(yùn)檢中的相關(guān)判據(jù)和依據(jù)來源。

區(qū)別于互聯(lián)網(wǎng)行業(yè),工業(yè)的專業(yè)知識(shí)樣本稀缺,積累困難,大模型的訓(xùn)練過程,也是對(duì)這些數(shù)字資產(chǎn)的系統(tǒng)化梳理和重構(gòu)過程,這期間有很多挑戰(zhàn)?,F(xiàn)在,國網(wǎng)智研院的行業(yè)預(yù)訓(xùn)練語言模型參數(shù)超過70億,正在進(jìn)行150億參數(shù)的電力認(rèn)知大模型全量精調(diào)訓(xùn)練。

一位物聯(lián)網(wǎng)技術(shù)專家告訴數(shù)智前線,類似國網(wǎng),他們落地中進(jìn)度較好的也是面向內(nèi)部員工的文檔知識(shí)問答。此前,員工檢索企業(yè)內(nèi)部文獻(xiàn)文檔很費(fèi)勁。原先知識(shí)圖譜技術(shù)手段,成本高,需要標(biāo)注很多數(shù)據(jù),訓(xùn)練很多小模型,而回答問題的覆蓋度還較低。有了大模型,只要把文檔做簡單預(yù)處理,“丟給”大模型,大模型學(xué)習(xí)后就能直接回答問題,還能提供知識(shí)溯源出處,回答的覆蓋度也較高,“這是對(duì)原來知識(shí)管理賽道很大的顛覆”。

除了能源企業(yè),在7月華為開發(fā)者大會(huì)HDC期間,工商銀行人工智能和大數(shù)據(jù)實(shí)驗(yàn)室副總經(jīng)理黃炳也介紹了大模型的初步實(shí)踐,例如輔助客服人員,能將專業(yè)知識(shí)轉(zhuǎn)化為“大白話”的知識(shí)運(yùn)營助手,為投研團(tuán)隊(duì)提供晨報(bào)的生成服務(wù),以及工行辦公系統(tǒng)中的文案創(chuàng)作、網(wǎng)訊編寫、會(huì)議摘要等。有趣的是,網(wǎng)訊編寫經(jīng)過模型訓(xùn)練,會(huì)有“工行文風(fēng)”。

黃炳介紹,這些場景都是人機(jī)協(xié)作,對(duì)員工和管理層有感知。比如,投研團(tuán)隊(duì)用的晨報(bào)生成服務(wù),過去雇傭?qū)嵙?xí)生花費(fèi)1個(gè)小時(shí),現(xiàn)在只需5分鐘。

在能源、金融之外,上市公司中康科技首席技術(shù)官唐珂軻在WAVE SUMMIT期間告訴數(shù)智前線,基于通用大模型訓(xùn)練的行業(yè)模型,在三類醫(yī)藥相關(guān)場景中最先落地。

其中一類是與幾家連鎖藥店做的藥事服務(wù),可提升店員的專業(yè)度;一類是輔助醫(yī)生的臨床科研,比如文獻(xiàn)整理和自動(dòng)總結(jié)、醫(yī)療領(lǐng)域?qū)I(yè)的Meta分析?!耙郧白鲆黄狹eta分析至少3~6個(gè)月,現(xiàn)在只需花10分鐘?!碧歧孑V說,自己之前做過科研,能感知到大模型對(duì)臨床科研效率上質(zhì)的改變。第三類是患者出院后的健康管理,這部分此前基本是缺失的。他們目前在廣東、湖南等地,與不同醫(yī)院落地了針對(duì)不同腫瘤的模型,支撐乳腺癌、肝癌、肺癌等患者出院后的服務(wù),這是腫瘤患者非常需要的。

唐珂軻稱,醫(yī)療數(shù)據(jù)相對(duì)的封閉性,會(huì)給行業(yè)模型訓(xùn)練帶來挑戰(zhàn)。但他看好大模型對(duì)行業(yè)的前景改變。“去年在搭建患者回訪系統(tǒng)時(shí),技術(shù)實(shí)施復(fù)雜度“令人頭疼”,但今年在大模型基礎(chǔ)上投喂幾千條數(shù)據(jù),效果就不錯(cuò)”。

上海南洋萬邦智能物聯(lián)部經(jīng)理曾佑軒告訴數(shù)智前線,在落地實(shí)踐中,大模型在AI助手、知識(shí)管理兩大方向上落地較多。該公司是上海儀電下屬的數(shù)科公司。談到大模型成本,曾佑軒介紹,目前AI助手的費(fèi)用已做到每月每人10元。這并不像大家想象中那么高昂。

大模型已在為企業(yè)降本增效。一位云計(jì)算資深人士告訴數(shù)智前線,他了解原來某大型家具企業(yè),外包客服要請(qǐng)數(shù)百人,現(xiàn)在已縮減到小幾十人?!跋襁@種項(xiàng)目,企業(yè)幾十萬可以搞定,又能節(jié)約成本,是比較好的落地?!?/p>

02、“大家都冷靜理性了”

在大模型的落地實(shí)踐中,行業(yè)對(duì)大模型有了更深入的認(rèn)知,很多企業(yè)調(diào)整了預(yù)期,“大家冷靜理性了?!?/p>

“我們從今年初開始重點(diǎn)關(guān)注大模型,當(dāng)時(shí)的想法是要把大模型更好地用起來?!币晃荒茉创笃髽I(yè)人工智能專家近日告訴數(shù)智前線,“但在逐漸用的過程中,我們發(fā)現(xiàn)不是那么理想,也不會(huì)那么快。”

他們現(xiàn)在偏向于先支撐內(nèi)部人員,因?yàn)椤按竽P偷幕卮?,尤其是事?shí)類的還不是太好”,直接開放給客戶還有一定風(fēng)險(xiǎn)。而面向內(nèi)部,會(huì)經(jīng)過大家的過濾、判斷和把關(guān)。內(nèi)部人員再結(jié)合他們的理解,對(duì)外來服務(wù)。“我們會(huì)灰度地去過渡,逐步開放一些功能?!?/p>

無獨(dú)有偶,工行目前的應(yīng)用也先從內(nèi)部開始,優(yōu)先面向金融文本和金融圖像分析創(chuàng)作,且“場景肯定有錯(cuò)誤容忍度”。

實(shí)際上,大模型的實(shí)際落地與當(dāng)初的預(yù)期存在一定落差?!按竽P湍芙鉀Q的問題,比一開始想象的要少很多?!币晃恍袠I(yè)資深人士告訴數(shù)智前線。

造成這個(gè)落差的原因有多方面。從場景上說,ChatGPT剛出來時(shí),大家對(duì)大模型有很多憧憬,一位云計(jì)算人士舉例,曾有企業(yè)找他咨詢,AI能不能替代采購,因?yàn)椴少彮h(huán)節(jié)最易滋生腐敗,老板都想把這塊監(jiān)管或考慮用技術(shù)取代。但采購不是一個(gè)簡單決策,需要綜合考量。

“很多企業(yè)要么完全不知道怎么用,要么就是天馬行空,但因?yàn)樘岢龅膱鼍皬?fù)雜、決策鏈太長,實(shí)際做不到。”他說。而另一些人士認(rèn)為,大家可能把大模型與通用人工智能混為一談。

從技術(shù)角度看,在醫(yī)療、教育等一些專業(yè)度、準(zhǔn)確度要求高的客服場景,大語言模型的幻覺是個(gè)問題。當(dāng)他們把行業(yè)數(shù)據(jù)注入到基礎(chǔ)大模型時(shí),不管是微調(diào),還是其他手段,模型能吸納并能轉(zhuǎn)化成正確輸出的,大概有70%到80%。這就要求不得不用更多辦法,去處理那20%到30%的錯(cuò)誤率。

“但目前沒有特別低成本和快速的辦法?!鄙鲜鋈耸糠答?,很多東西需要去做強(qiáng)化學(xué)習(xí)和復(fù)雜的人工標(biāo)定,所花的成本可能是現(xiàn)在成本基礎(chǔ)再乘以10甚至更多,這讓很多企業(yè)難以接受。

針對(duì)上述兩個(gè)問題,聚焦領(lǐng)域大模型開發(fā)的中關(guān)村科金技術(shù)副總裁張杰告訴數(shù)智前線,在場景選擇上,他覺得接下來適合大模型進(jìn)一步落地的較好賽道,是專業(yè)性較高,且容錯(cuò)性較高的場景,如企業(yè)知識(shí)問答、營銷機(jī)器人、坐席助手。而通用性太高或容錯(cuò)性又比較低的場景,如自動(dòng)駕駛,不是特別好的商業(yè)賽道。

從技術(shù)層面,張杰認(rèn)為不是某一套大模型的應(yīng)用技術(shù)路線,就可以非常完美地解決問題,他介紹了三種由淺入深的應(yīng)用技術(shù)路線。

從落地實(shí)踐看,目前,前兩種接受度高。“這三種方法不是3選1,在具體場景下,肯定是一套組合拳?!彼a(bǔ)充道。

“大家其實(shí)看到iPhone在2006就出來了,但整個(gè)移動(dòng)互聯(lián)網(wǎng)時(shí)代的開啟是在2012年?!敝行沤ㄍ蹲C券研究所所長、武超則在不久前的行業(yè)會(huì)議上稱,“這個(gè)過程才剛剛開始”。

她認(rèn)為大模型有幾個(gè)階段的演進(jìn),從能聽會(huì)說、能看會(huì)認(rèn)開始,到能夠像人一樣去組合使用工具,從而讓每個(gè)人配一個(gè)“斯坦福畢業(yè)的助理”,再到通用人工智能中的會(huì)規(guī)劃、會(huì)決策。

行業(yè)在不斷深入探索。一位行業(yè)資深人士告訴數(shù)智前線,他們在做教育等行業(yè),客戶數(shù)量較大,在將大模型融入業(yè)務(wù)工作流的過程中,遇到很多問題,“還在去尋找有沒有更能解決問題的方式”。

03、企業(yè)紛紛涌向開源大模型

在大模型落地的過程中,越來越多的國內(nèi)企業(yè)開始采用開源大模型。

一位南方電網(wǎng)人士告訴數(shù)智前線,內(nèi)部現(xiàn)在進(jìn)行大模型嘗試時(shí),“都是基于Llama吧”。Meta公司在今年7月發(fā)布了開源可商用大模型Llama 2,包含了70億、130億和700億參數(shù)3個(gè)版本。另一位南方電網(wǎng)人士稱,內(nèi)部對(duì)不同開閉源模型正進(jìn)行測試賽馬。

8月,金蝶發(fā)布的財(cái)務(wù)大模型,也基于開源大模型訓(xùn)練而來。金蝶CTO趙燕錫告訴數(shù)智前線,就像手機(jī)操作系統(tǒng)有iOS、安卓一樣,開源模型要打造生成式AI的安卓系統(tǒng),國內(nèi)有像清華ChatGLM,國際上有MPT、Llama,未來是一個(gè)多模型合作的想法。

在金融領(lǐng)域落地中,有資深人士告訴數(shù)智前線,開源、閉源大模型都有,因?yàn)楦鹘鹑跈C(jī)構(gòu)體量不一,策略也不一樣。很多公司先在一個(gè)具體場景下用開源模型做出實(shí)際效果,再考慮復(fù)制推廣,也有幾個(gè)大行對(duì)平臺(tái)做一些戰(zhàn)略性投入,在閉源基礎(chǔ)大模型上,建了一個(gè)類似于中臺(tái)的平臺(tái),期望將來同時(shí)對(duì)接多個(gè)場景。

“之前我們自己訓(xùn)練了兩個(gè)不同參數(shù)的模型,最近我們也在用開源?!敝锌粕钪荂TO宋健告訴數(shù)智前線。他認(rèn)為,目前絕大部分文本寫作、上下文匹配,130億參數(shù)的模型已夠用,而三四百億參數(shù)的模型,在解決很多垂類問題上已經(jīng)足夠,無論國內(nèi)百川,還是國外的Llama,效果都不錯(cuò)。

一家物聯(lián)網(wǎng)公司技術(shù)高管告訴數(shù)智前線,目前開源大模型發(fā)展較快,開源社區(qū)也發(fā)布了很多模型,大部分基于Llama 2微調(diào)而來?!拔覀円矞y試過很多開源和閉源模型,由于我們的目標(biāo)市場需要多語言支持,會(huì)更多考慮Llama 2。如果是面向國內(nèi)市場,一些國內(nèi)的模型也很優(yōu)秀?!?/p>

“選擇開源和閉源,實(shí)際上各有優(yōu)缺點(diǎn)。使用開源模型的好處主要是較為自由,包括部署、微調(diào)、升級(jí)和免費(fèi)。閉源的好處是有質(zhì)量保證,免自己部署和應(yīng)用門檻較低?!鄙鲜鲑Y深人士介紹。

他選擇開源的一個(gè)重要原因是認(rèn)為,目前開源模型的繁榮和水平提高呈現(xiàn)一個(gè)明顯趨勢。他打了一個(gè)比喻,開源大模型的水平就好比海平面,閉源大模型相當(dāng)于一個(gè)個(gè)島嶼。目前這些島嶼上漲的速度,跟不上海平面上漲的速度,大部分島嶼將會(huì)被海水淹沒,可能世界上最后就剩下幾座上漲比較快的島嶼。

模型本身現(xiàn)在可選的很多,多位業(yè)內(nèi)人士也贊同,開源和閉源不是客戶會(huì)關(guān)心的問題,“極少客戶會(huì)去指定用哪一款模型”。因?yàn)榭蛻舨⒉恢苯邮褂没A(chǔ)大模型,最終客戶是沒有感知的。“客戶更關(guān)心的是精度、速度和價(jià)格。當(dāng)然最終保證無害性、合法性,這是應(yīng)用開發(fā)商必須解決的問題?!鄙鲜鑫锫?lián)網(wǎng)行業(yè)專家說。

張杰告訴數(shù)智前線,因?yàn)殚_源可商用大模型,每一款可能都有自己的優(yōu)缺點(diǎn),比如說有些適合做一些分類型的任務(wù),有些性能比較好,有些可能就生成式的任務(wù)表現(xiàn)比較好,還是要根據(jù)具體場景,一些ROI的需求,選擇不同的模型。

“總體來講,我們覺得接下來大模型非常重要的趨勢,就是開源?!敝行沤ㄍ蹲C券武超則稱,非標(biāo)準(zhǔn)化的場景,非標(biāo)準(zhǔn)化的算力,這種架構(gòu)決定開源可能會(huì)是一個(gè)比較趨同的方向。

04、大廠態(tài)度發(fā)生變化

開源世界的迅速繁榮,也正導(dǎo)致大模型生態(tài)鏈企業(yè)甚至底層芯片廠商的態(tài)度和策略發(fā)生一些微妙變化。

一家國內(nèi)主流AI芯片企業(yè)人士告訴數(shù)智前線,Meta推出Llama 2開源模型后,呈現(xiàn)出的效果較好,這對(duì)目前市場上一些大模型來說是個(gè)絕殺。為此,他們已暫緩了對(duì)一些大模型的適配工作,觀望一下再說。

國內(nèi)外大模型大廠也已迅速在策略上做出改變,普遍朝著“左手閉源,右手開源”的方向走。

在國外,微軟除了投資OpenAI閉源大模型,也和Meta實(shí)現(xiàn)牽手,宣布在其Azure云和Windows內(nèi)上線開源的Llama 2。亞馬遜AWS、谷歌云也都在自研大模型基礎(chǔ)上,支持第三方和開源模型。

在國內(nèi),8月初,百度先宣布升級(jí)千帆大模型平臺(tái),接入Llama2全系列、清華ChatGLM2、RWKV等33個(gè)大模型,并對(duì)這些模型進(jìn)行性能增強(qiáng)、推理優(yōu)化等工作;之后,阿里開源通義千問70億參數(shù)模型,包括通用模型Qwen-7B和對(duì)話模型Qwen-7B-Chat,稱“開源、免費(fèi)、可商用”;而在8月16日,騰訊亦亮出新動(dòng)作,宣布騰訊云TI平臺(tái)已接入Llama 2、Falcon、Dolly等20多個(gè)主流模型,旨在打造行業(yè)大模型精選商店。

大廠們何以會(huì)有如此“整齊劃一”的動(dòng)作?

市場需求變化是一個(gè)因素。百度智能云AI與大數(shù)據(jù)平臺(tái)總經(jīng)理忻舟告訴數(shù)智前線,他們發(fā)現(xiàn)市場需求已逐漸進(jìn)入深水區(qū),僅文心一言一個(gè)模型,不能滿足客戶多樣化需求,而如果能把一個(gè)平臺(tái)做好,“會(huì)有更多的流量”。

業(yè)界觀察,7月下旬,百度在對(duì)外表述中,已將原來的“文心千帆大模型平臺(tái)”轉(zhuǎn)變?yōu)椤扒Х竽P推脚_(tái)”,在做“去文心化”。

另一個(gè)現(xiàn)實(shí)因素是,大廠們單個(gè)項(xiàng)目報(bào)價(jià)普遍在千萬元級(jí)別,閉源大模型暫時(shí)還沒能有足夠多的大項(xiàng)目落地。

此外,清華ChatGLM建立了有策略的、組合的商業(yè)模式,把小模型開源出去,吸引商機(jī)和生態(tài),它的閉源大模型也可以為企業(yè)提供定制化服務(wù)。大模型廠商提供一個(gè)開源的但規(guī)模較小的大模型供大家使用,也是一種營銷模式。

一位熟悉阿里云的資深人士也表示,他猜測,上述這些因素也是阿里開源兩款大模型的重要原因之一?!白吡硗庖粭l路試試看?!?/p>

而大模型變現(xiàn)的通路,并不只是模型本身。

數(shù)智前線獲悉,華為在大模型上的考量,算力是重頭之一。7月底到8月初,任正非就大模型有兩次講話,均與算力相關(guān)。

先是成立AI算力先遣隊(duì),由原煤礦軍團(tuán)團(tuán)長鄒志磊負(fù)責(zé)。任正非說,有4000個(gè)客戶想要用華為昇騰平臺(tái)去訓(xùn)練大模型。華為也將可能在10月成立15個(gè)小組去分別服務(wù)15個(gè)客戶。之后,針對(duì)華為在《自然》雜志上發(fā)表的華為云盤古氣象大模型的論文,任正非也談及要“在新的淘金時(shí)代賣鏟子”。

無獨(dú)有偶,忻舟介紹,百度在大模型上的商業(yè)模式可分為兩個(gè)層面。從文心一言這個(gè)大模型的角度講,百度賺的是AI的錢。但千帆同時(shí)還是一個(gè)支持其他第三方模型的平臺(tái),本質(zhì)上“還是云的思路,賺云的錢”。

此外,開源對(duì)生態(tài)建設(shè)也是百利而無一害。畢竟大模型被認(rèn)為是智能時(shí)代的操作系統(tǒng),而操作系統(tǒng)比拼的是生態(tài),百度智能云AI平臺(tái)副總經(jīng)理李景秋認(rèn)為,好的開源模型會(huì)極大吸引市場上創(chuàng)新公司關(guān)注大模型并參與其中,進(jìn)而帶來整個(gè)上下游服務(wù)生態(tài)的完善。

今年7月,阿里云也對(duì)外喊出“將促進(jìn)中國大模型生態(tài)的繁榮作為首要目標(biāo)”的口號(hào)。“這就類似于原來開源軟件的模式,通過開源來吸引客戶,建立產(chǎn)品的社區(qū)?!币晃淮竽P皖I(lǐng)域資深人士表示。

該人士認(rèn)為,無論國內(nèi)國外、開源閉源,大模型的發(fā)布可能還會(huì)更多,具有通用基礎(chǔ)能力的大模型,可能會(huì)集中到少數(shù)幾個(gè)廠商,但具有行業(yè)細(xì)分的大模型,比較典型的像醫(yī)療、法律、教育,會(huì)有更多廠商去做。另外,基于大模型的能力做出來的應(yīng)用級(jí)產(chǎn)品,會(huì)逐漸繁榮,形成一個(gè)新的生態(tài)和軟件開發(fā)模式,“比如最近比較火的MetaGPT和ToolLLM”。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。