文|產(chǎn)業(yè)家 斗斗
編輯|皮爺
距離ChatGPT爆發(fā)的那一天,已經(jīng)過去8個月了。
8個月的時間,中國諸多大模型拔地而起,以飛快的速度,不斷向各個行業(yè)場景滲透。但就目前為止,并未出現(xiàn)真正被大模型顛覆的場景或行業(yè)。
統(tǒng)計數(shù)據(jù)顯示,在大模型落地應(yīng)用中,45%的企業(yè)處于觀望階段、39%的企業(yè)處于探索可研階段、16%的企業(yè)處于試點應(yīng)用階段,而全面應(yīng)用的企業(yè)為零。
一個值得被看見的問題是,如今在中國的土壤里,大模型的落地進(jìn)展究竟如何?
01 大模型落地,金融、能源先行
“請幫我查一下我今年8月份的用電量,以及哪天用電最多?”“幫我檢測一下這張圖片有什么缺陷”……在南方人工智能創(chuàng)新平臺上,通過語言交互,一項項數(shù)據(jù)清晰的被展現(xiàn)在眼前。
在這個平臺上,電力行業(yè)工作人員可以向電力大模型發(fā)布指令,讓其自動生成數(shù)據(jù)處理結(jié)果,準(zhǔn)確識別缺陷場景的圖像細(xì)節(jié),幫助工作人員檢索處理電力巡檢過程中的數(shù)據(jù)。
目前,在南方電網(wǎng)客戶服務(wù)領(lǐng)域,60%的高頻問題都可通過電力大模型解決,在識別客戶情緒波動方面,電力大模型的效果甚至優(yōu)于人工。
此外,在輸配電領(lǐng)域,電力大模型已具備每分鐘處理100張問題圖片的能力,還能同時識別20類缺陷,識別效率是傳統(tǒng)AI算法的10倍。
而在電力調(diào)度領(lǐng)域,電力大模型能夠協(xié)助調(diào)度部門針對電網(wǎng)異常情況快速自動化生成處置預(yù)案,及時響應(yīng)電力市場調(diào)節(jié)要求,使預(yù)案更加安全、高效,成本更低。
這是大模型在能源領(lǐng)域落地的一個縮影。
據(jù)了解,部分能源頭部廠商已經(jīng)開啟了與科技公司在大模型應(yīng)用方面的合作,尤其在電網(wǎng)與礦山領(lǐng)域,形成了一些初步試點示范,如電網(wǎng)調(diào)度、缺陷/故障查詢、煤礦作業(yè)監(jiān)測等場景。
除了能源領(lǐng)域,金融領(lǐng)域也是目前大模型最大落地場景之一。
一份來自愛分析的報告中,也將能源、銀行列為了大模型落地進(jìn)展最快的兩大行業(yè)。
在金融領(lǐng)域的落地之廣,從大模型的數(shù)量和企業(yè)動態(tài)也可見一斑。一組數(shù)據(jù)顯示,截止8月,國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量高達(dá)116個,其中金融行業(yè)大模型約18個。
此外,在半年報中,工商銀行、農(nóng)業(yè)銀行、中國銀行、交通銀行、招商銀行、中信銀行、興業(yè)銀行、華夏銀行、浙商銀行等9家銀行明確提出在探索大模型的應(yīng)用。
在大模型廠商側(cè),一些密集的行業(yè)模型發(fā)布也反映出金融場景落地的火熱程度。
例如5月下旬,度小滿發(fā)布了千億級中文大模型「軒轅」;6月份,騰訊云攜手神州信息開展金融大模型的合作,中國農(nóng)業(yè)銀行推出類ChatGPT的大模型應(yīng)用ChatABC,中國工商銀行發(fā)布了基于昇騰AI的金融行業(yè)通用模型。
7-8月,隨著《生成式人工智能服務(wù)管理暫行辦法》正式實施,包括騰訊、百度、科大訊飛、華為、字節(jié)跳動等多家公司,又相繼釋放了最新的大模型進(jìn)展;9月,螞蟻集團(tuán)也正式發(fā)布了金融大模型,并開源生成式AI編程平臺CodeFuse。
金融領(lǐng)域,無疑是大模型落地的最多場景之一。
無論是能源領(lǐng)域還是金融領(lǐng)域,之所以能夠?qū)崿F(xiàn)大模型的領(lǐng)先落地,都源于這兩個行業(yè)的一些共性。
首先,能源和銀行業(yè)都是高度數(shù)據(jù)化的行業(yè),具有較好的數(shù)據(jù)基礎(chǔ)和數(shù)字化環(huán)境,這為大模型的訓(xùn)練和應(yīng)用提供了有利條件。
其次,兩大行業(yè)均有大量的數(shù)據(jù)處理和決策需求,而大模型的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)可以幫助行業(yè)解決這些難題,提高決策效率和準(zhǔn)確度。
再有,能源和銀行業(yè)的業(yè)務(wù)模式相對比較成熟,具有較高的商業(yè)價值,因此這些行業(yè)對大模型技術(shù)的需求也比較大,從而推動了大模型的落地應(yīng)用。
可見,能源和銀行兩大行業(yè)在大模型落地進(jìn)展中相對較快,主要是由于其數(shù)據(jù)基礎(chǔ)好、技術(shù)需求大、商業(yè)價值高等多方面因素的綜合作用。
值得注意的是,即使在金融、能源這兩個落地場景中,大模型仍有一些目前難以跨越的難題。
02 達(dá)不到預(yù)期的場景價值
在金融行業(yè),營銷、風(fēng)控、運營三個方向是諸多銀行關(guān)注較多的大模型應(yīng)用方向。
其中,智能問答助手、智能客服、營銷圖片自動生成、貸后報告撰寫是當(dāng)下銀行等金融機(jī)構(gòu)積極布局的細(xì)分場景。但就目前而言,生成類場景如智能問答助手、智能客服、營銷圖片自動生成等場景價值與預(yù)期相差無幾,但在如沉睡客戶喚醒、數(shù)字營業(yè)廳這類決策、原生類應(yīng)用場景,大模型落地的預(yù)期和實際效果仍有差距。
例如在智能客服場景,過去智能陪練題庫少,缺少針對性。如今基于大模型生產(chǎn)個性化題庫,可以縮短培訓(xùn)周期上;在營銷圖片自動生成場景,過去設(shè)計師在素材庫中選取并設(shè)計,如今可以利用Midjourney自動生成,可以降低版權(quán)成本和人力成本。
而在沉睡客戶喚醒和數(shù)字營業(yè)廳場景價值預(yù)期中,前者利用大模型自動生成策略,可實現(xiàn)端到端的策略改善喚醒效果;后者大模型支持的數(shù)字人幫助客戶辦理業(yè)務(wù)、推薦產(chǎn)品完成交易,可實現(xiàn)獨立于APP之外的新渠道。
然而,就目前來看,這兩個場景的實際應(yīng)用價值都尚未可知。
能源行業(yè)的大模型落地應(yīng)用亦相似之處。
在能源行業(yè),設(shè)備運檢知識助手、智能客服等生成類應(yīng)用,場景價值與預(yù)期相差無幾。但在如檢修文檔、設(shè)備故障維修、電力負(fù)荷預(yù)測等場景,場景實際價值仍未可知。
具體來看,在設(shè)備運檢知識助手場景,過去是基于NLP技術(shù)構(gòu)建結(jié)構(gòu)化知識庫,在大模型的加持下,可利用大模型構(gòu)建運檢助手,改善效率;在智能客服場景,過去是基于Bert模型的智能客服,如今利用大模型改善智能客服的用戶體驗,可實現(xiàn)意圖理解更準(zhǔn)確、語言更擬人化,用戶體驗得到改善。
檢修文檔生成、設(shè)備故障維修、電力負(fù)荷預(yù)測場景中,大模型落地可帶來的價值分別是,快速自動生成文檔實現(xiàn)效率提升;大模型快速定位故障原因,提供檢修建議和方案;納入更多影響因素實時預(yù)測負(fù)荷,提高預(yù)測準(zhǔn)確率。
然而,就目前來看,這些場景中大模型帶來的價值都尚未可知,仍需時間不斷探索??梢园l(fā)現(xiàn)無論是金融行業(yè)還是能源行業(yè),生成類場景落地速度快,應(yīng)用較多,決策類場景落地速度較慢且難度較大,應(yīng)用較少。
03 “生成場景>決策場景”:難轉(zhuǎn)化的生產(chǎn)力
就目前而言,大模型的落地仍處于試點應(yīng)用階段,并非全面上線。
正如上文所言,金融行業(yè)的智能問答、智能客服、數(shù)字營業(yè)廳、貸后報告生成、沉睡客戶喚醒、金融產(chǎn)品推薦等AI大模型應(yīng)用已經(jīng)逐漸落地;能源行業(yè)的智能客服、設(shè)備運檢知識助手、檢修文檔生成、電力系統(tǒng)仿真平臺、電力負(fù)荷預(yù)測等已經(jīng)試點應(yīng)用。
然而,消費品零售、證劵、媒體還處于探索階段,此外制造業(yè)、藥企還處于觀望階段。
由此可見,大模型落地雖廣度上較為樂觀,但深度上卻較為艱難。
大模型落地的深度取決于其能力、規(guī)模、計算資源、數(shù)據(jù)質(zhì)量、領(lǐng)域知識等。然而,對于當(dāng)下的國內(nèi)大模型而言,處于發(fā)展初期,很多設(shè)施和能力還在逐步完善。
受限于模型能力、應(yīng)用效果等因素,當(dāng)前落地應(yīng)用以生成場景為主。
與決策大模型不同,生成式大模型主要應(yīng)用于文本生成、對話系統(tǒng)、語言翻譯等領(lǐng)域,通過分析大量文本數(shù)據(jù),學(xué)習(xí)文本的生成規(guī)律和內(nèi)在語義關(guān)系,從而能夠生成高質(zhì)量的文本輸出。生成式大模型的代表模型包括OpenAI的GPT系列和百度文心一言等。
而決策大模型主要應(yīng)用于推薦系統(tǒng)、強(qiáng)化學(xué)習(xí)等領(lǐng)域,需要處理的數(shù)據(jù)通常包含連續(xù)的數(shù)值變量,而且需要做出決策或預(yù)測未來的行為。決策大模型的代表模型包括DeepMind的AlphaZero系列和OpenAI的Dota2 AI等。
相比決策大模型,生成式大模型首先在在文本生成和對話系統(tǒng)中,數(shù)據(jù)可以通過大量的文本語料庫進(jìn)行收集和整理,而在推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)中,數(shù)據(jù)通常需要人工設(shè)計和構(gòu)造,相對較為復(fù)雜。
其次文本生成和對話系統(tǒng)等領(lǐng)域的研究已經(jīng)比較成熟,有許多現(xiàn)成的算法和框架可以使用,而推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等領(lǐng)域則需要更多的探索和研究。
再有文本生成和對話系統(tǒng)等領(lǐng)域的應(yīng)用場景非常廣泛,如搜索引擎、聊天機(jī)器人、自動寫作等,而推薦系統(tǒng)和強(qiáng)化學(xué)習(xí)等領(lǐng)域則主要應(yīng)用于電商、廣告、游戲等領(lǐng)域。
一個事實是,雖然生成類場景應(yīng)用較廣,但預(yù)測類決策場景是未來高價值場景。無論是大模型供應(yīng)商,還是企業(yè),想要基于大模型能力實現(xiàn)業(yè)務(wù)價值的提升,后者才是發(fā)力的方向。
04 行業(yè)場景中,再看AI大模型
大模型落地首先需要選擇合適的領(lǐng)域和場景。該領(lǐng)域場景有著較強(qiáng)的數(shù)字化能力和數(shù)字化基礎(chǔ)。
例如,在智能客服領(lǐng)域,可以考慮將大模型應(yīng)用于FAQ問答系統(tǒng)和聊天機(jī)器人等場景;在廣告推薦領(lǐng)域,可以將其應(yīng)用于電商平臺的個性化推薦等場景;在輿情監(jiān)測領(lǐng)域,可以將其應(yīng)用于新聞媒體的內(nèi)容分類和情感分析等場景。
其次要具備較高的模型能力、應(yīng)用效果等。而從當(dāng)前企業(yè)用戶落地大模型的主要路徑來看,集團(tuán)企業(yè)重點是大模型能力建設(shè),一般企業(yè)/部門重點是應(yīng)用場景探索。大模型能力建設(shè)分成三個層面:基礎(chǔ)設(shè)施建設(shè)、大模型訓(xùn)練和大模型應(yīng)用,當(dāng)前以基礎(chǔ)設(shè)施建設(shè)和大模型訓(xùn)練為主,大模型應(yīng)用較少。
值得注意的是,目前大模型應(yīng)用方向主要分為兩種,一是小模型為主,大模型提升小模型的開發(fā)效率;二是大模型與小模型級聯(lián),小模型連接應(yīng)用,大模型增強(qiáng)小模型能力。
而這種落地路徑使得模型能力受限。
想要推動大模型落地深度,大模型供應(yīng)商、企業(yè)需要在能力、合作模式上不斷探索。
一些深化大模型落地的路徑逐漸清晰。
未來,隨著大模型技術(shù)的不斷發(fā)展和普及,模型級聯(lián)的應(yīng)用將會越來越廣泛。
例如,可以將多個大模型進(jìn)行組合和級聯(lián),實現(xiàn)更復(fù)雜、更精準(zhǔn)的語音識別、圖像識別、自然語言處理等應(yīng)用場景。同時,也可以將大模型和小模型進(jìn)行級聯(lián),充分發(fā)揮各自的優(yōu)勢,提高模型的性能和泛化能力。
基于此,擴(kuò)展大模型落地的應(yīng)用深度,加速各領(lǐng)域決策類場景應(yīng)用落地。
其次,不同行業(yè)有著不同的特定需求,未來大模型需要朝著更加定制化的方向發(fā)展。通過對行業(yè)特定語料庫的訓(xùn)練,大模型可以更好地適應(yīng)不同行業(yè)的實際應(yīng)用場景。
其次,為了更好地滿足實際應(yīng)用中的效率和資源需求,大模型需要朝著更加輕量級化的方向發(fā)展。通過模型壓縮和剪枝等技術(shù),可以在保證模型性能的同時,降低模型的大小和計算資源消耗。
此外,隨著數(shù)據(jù)隱私保護(hù)問題的日益突出,大模型需要更加注重數(shù)據(jù)的安全性和隱私保護(hù)。
模型的定制化、輕量化、數(shù)據(jù)安全化成為其落地的重要因素。
中國AI大模型的落地應(yīng)用在智能客服、廣告推薦、輿情監(jiān)測等領(lǐng)域取得了一系列的成果。然而,在落地過程中也面臨著諸多困局。未來,隨著行業(yè)定制化、模型輕量級化和數(shù)據(jù)安全化等技術(shù)的發(fā)展,AI大模型的落地應(yīng)用將迎來更加廣闊的發(fā)展空間。