正在閱讀:

金融業(yè)需要什么樣的大模型?

掃一掃下載界面新聞APP

金融業(yè)需要什么樣的大模型?

通用大模型走向行業(yè)大模型的適配之戰(zhàn)。

文|數(shù)科社 林木

電影《奧本海默》里有句臺詞:(原子彈)不是一種新武器,而是一個新世界。這句話用來形容過去一年大模型的“爆炸”發(fā)展再恰當(dāng)不過。

自ChatGPT發(fā)布以來,大模型成為整個人工智能的新底座,激起了新一波技術(shù)革命浪潮。在不到一年的時間里,通用大模型的爆發(fā)開始席卷各行各業(yè),金融業(yè)作為數(shù)字化需求強(qiáng)烈的數(shù)據(jù)密集型行業(yè),成為大模型率先落地發(fā)力的最優(yōu)場景之一。

這個9月,金融大模型翻涌的海浪上又多了兩個重量級新玩家。

9月8日,螞蟻集團(tuán)在上海外灘大會發(fā)布了工業(yè)級金融大模型(AntFinGLM),同時推出了兩個配合模型層的產(chǎn)業(yè)應(yīng)用“支小寶”和“支小助”。12天后,同在上海,華為首發(fā)了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。

隨著金融業(yè)新世界的大門開啟,金融、科技巨頭們不斷涌入,一場從通用大模型走向行業(yè)大模型的適配之戰(zhàn)也隨之打響。

金融業(yè)到底需要什么樣的大模型?通用大模型從通識階段走向?qū)WR階段,又將面臨著哪些挑戰(zhàn)?

01 一個認(rèn)知能力的引擎

近年來,擁抱數(shù)字化和新技術(shù)一直是金融行業(yè)反復(fù)強(qiáng)調(diào)和推動的重要命題。

某種角度來看,金融是一個特殊的信息處理行業(yè),因而隨之信息技術(shù)的快速更迭,金融領(lǐng)域所涉及到的功能、要素、產(chǎn)品和市場也會發(fā)生內(nèi)在潛移默化的改變。

回顧過去十年的行業(yè)發(fā)展軌跡,互聯(lián)網(wǎng)金融的出現(xiàn),讓辨別式AI在智能營銷、智能風(fēng)控、智能投研、智能客服等金融領(lǐng)域落地生花?;跈C(jī)器學(xué)習(xí)驅(qū)動的建模能力不斷賦能金融產(chǎn)業(yè)鏈的變革與創(chuàng)新,同時也為人工智能的滲透融入打下根基。

金融業(yè)對大模型并不陌生,生成式AI的橫空出世,意味著行業(yè)新一輪AI革命浪潮已經(jīng)到來。

“大模型已經(jīng)不單單是一個知識的容器,它更成為一個認(rèn)知能力的引擎。”9月8日,復(fù)旦大學(xué)教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在外灘大會上,分享了對于通用大模型在適配和優(yōu)化層面的思考。

肖仰華表示,今天的大模型已經(jīng)非常擅長解決以前人工智能會碰壁的語言理解等常識類問題,甚至還具備了一定的自識反思能力和泛化組合能力,“我們不僅僅把大模型當(dāng)做一個某類數(shù)據(jù)處理的基礎(chǔ)模型,已經(jīng)把它當(dāng)作未來適應(yīng)復(fù)雜環(huán)境的自治智能體的一個大佬。”

在他看來,這些能力恰恰是行業(yè)的認(rèn)知所需要的,今天一個通用語料訓(xùn)練出來的大模型,已經(jīng)成為行業(yè)垂語認(rèn)知的一個重要基座。如金融領(lǐng)域的智能解決方案,過往思路是收集整個行業(yè)的數(shù)據(jù)來構(gòu)建,整個關(guān)注點(diǎn)仍在于行業(yè)數(shù)據(jù)和知識,但大模型卻是顛覆了這一認(rèn)知。

肖仰華以醫(yī)生診斷疾病舉例,一個醫(yī)生想勝任他的工作,首先要認(rèn)知什么是健康,“我們發(fā)現(xiàn)其實(shí)行業(yè)的很多問題恰恰是建立在通用的認(rèn)知能力基礎(chǔ)上。”因此他認(rèn)為大模型亦是如此,通用認(rèn)知的理解非常重要,沒有通識能力,是不可能發(fā)展出專業(yè)認(rèn)知能力的。

當(dāng)下已由感知智能轉(zhuǎn)換到認(rèn)知智能的大模型顯然已具備了這一條件。相比以識別能力為主的傳統(tǒng)AI模型,生成式AI的認(rèn)知智能體現(xiàn)在理解、分析和決策三個維度上。

比如,它可以通過前文來預(yù)測下一個詞語,對文本中不同的詞語賦予不同的權(quán)重值,能夠在生成文本時綜合考慮到文本中的上下文關(guān)系,生成更連貫、合理的文本,賦予了其內(nèi)容生產(chǎn)能力。這就注定了其會在智能交互環(huán)節(jié)大放異彩。

此外,生成式AI還可以從已有數(shù)據(jù)中學(xué)習(xí)樣本的統(tǒng)計(jì)特征,并在此基礎(chǔ)上生成新的數(shù)據(jù),這種增強(qiáng)學(xué)習(xí)的過程,對于金融領(lǐng)域的智能投顧、風(fēng)險控制等都無異于一種新的驅(qū)動力。

數(shù)據(jù)訓(xùn)練是大模型提升性能不可或缺的重要一環(huán),OpenAI 團(tuán)隊(duì)所提出的大模型遵循的“伸縮法則”指出,當(dāng)參數(shù)規(guī)模增加、數(shù)據(jù)集規(guī)模增加并延長模型訓(xùn)練時間,大模型的性能就會提升,并且如不受其他兩個因素制約時,大模型性能與每個單獨(dú)的因素都呈現(xiàn)冪律關(guān)系。

作為數(shù)據(jù)密集型行業(yè),金融業(yè)沉淀了如金融交易數(shù)據(jù)、客戶信息、市場分析、風(fēng)控數(shù)據(jù)等海量數(shù)據(jù),又催生出大量高效處理的技術(shù)需求。因此,大模型落地金融業(yè),無疑是一場雙向奔赴。

02 還有“最后一公里”要走

盡管大模型的問世帶給諸多行業(yè)巨大的想象空間,但當(dāng)下對于金融業(yè)而言,通用大模型拿來就可用嗎?答案顯示是否定的。

在肖仰華看來,金融領(lǐng)域的本質(zhì)是一類復(fù)雜決策,遠(yuǎn)遠(yuǎn)比開放閑聊的任務(wù)要困難得多,“你會發(fā)現(xiàn)通用模型里面的專業(yè)知識是遠(yuǎn)遠(yuǎn)不夠的,通用大模型好比是一個夯實(shí)的知識底座,寬廣有余,但縱深不足?!?/p>

除了專業(yè)力上的欠缺,肖仰華還提到一個非常值得關(guān)注的問題,即大模型“幻覺”——指大模型在生產(chǎn)內(nèi)容的過程中,可能會由于訓(xùn)練語料及模型的原因,產(chǎn)生事實(shí)性的錯誤。

“行業(yè)中經(jīng)常是希望大模型按照給出的規(guī)范、制度、文檔回答問題,而不是從通用領(lǐng)域習(xí)得的知識回答問題,從技術(shù)上是叫Closed QA,而不是Open QA?!彼J(rèn)為,正是因?yàn)榇竽P蜕瞄L發(fā)揮創(chuàng)造,就很有可能跳出給定的內(nèi)容去胡編亂造,缺乏領(lǐng)域的忠實(shí)度。

當(dāng)下來看,這種“幻覺”無疑是通用大模型落地部分行業(yè)的障礙之一,尤其像數(shù)據(jù)敏感度較高的金融領(lǐng)域。

為了解決這一問題,OpenAI采取的做法是通過加強(qiáng)遷移學(xué)習(xí)和對抗訓(xùn)練,以提高回答的準(zhǔn)確性和靠程度,GPT-4的內(nèi)容準(zhǔn)確性比GPT-3.5已增高了40%。而行業(yè)中的常見方法是通過對模型進(jìn)行領(lǐng)域知識的微調(diào),利用更加精確的數(shù)據(jù)來糾正模型的偏差,也就是構(gòu)建垂直領(lǐng)域模型。

肖仰華給出的應(yīng)對思路在于注重大模型和相關(guān)技術(shù)的協(xié)同。他表示,在大模型協(xié)助下,行業(yè)中很多任務(wù)被分成提示、生成、評估三個子任務(wù),大模型主要在生成階段發(fā)力,而在提示和評估階段,仍有很多傳統(tǒng)系統(tǒng)發(fā)揮價值的余地。

譬如知識圖譜技術(shù),圖譜中的知識往往擅長表達(dá)的是專業(yè)知識、私密知識,和可理解、可控的符號知識,它和大模型所表達(dá)的恰成一種緊密的互補(bǔ)關(guān)系。利用知識圖譜做事后評測、驗(yàn)證以及增強(qiáng)提示,可以進(jìn)一步改善大模型的“幻覺”問題。

這種應(yīng)對思路在當(dāng)前一些重量級金融大模型身上已然被驗(yàn)證,如螞蟻的金融科技團(tuán)隊(duì)過去幾年在構(gòu)建金融知識圖譜上做了大量投入。

以支小寶團(tuán)隊(duì)為例,首先基于一些研報、新聞、大V資訊以及高質(zhì)量權(quán)威合作數(shù)據(jù)源和數(shù)據(jù)庫,通過合作的專家,對于領(lǐng)域?qū)I(yè)知識進(jìn)行了提煉和萃取,形成了一個標(biāo)準(zhǔn)化基礎(chǔ)知識層。然后算法工程師再在此基礎(chǔ)上做關(guān)聯(lián)和整合,嘗試建構(gòu)金融現(xiàn)象之間的因果邏輯,最終匹配金融專業(yè)要求的知識圖譜得以形成。

肖仰華表示,要把通用大模型的適配和優(yōu)化當(dāng)成一個系統(tǒng)工程,從數(shù)據(jù)層面、知識層面、架構(gòu)層面、評估評測層面、生態(tài)體系等各個方面去尋找思路解決問題,“我們?nèi)匀挥新L的路要走,才能走完這最后的一公里?!?/p>

03 風(fēng)起云涌的適配之戰(zhàn)

眼下,大模型從通識階段走向?qū)WR階段才剛剛邁出一小步,這個落地過程必然少不了金融機(jī)構(gòu)與金融科技巨頭的涌入、實(shí)踐和推動。

目前來看,大模型技術(shù)發(fā)展先行一步的海外市場,從金融垂類大模型的構(gòu)建,到將如信息管理、智能推薦、 細(xì)分領(lǐng)域問答等各個金融場景的應(yīng)用,已有多個成功落地賦能行業(yè)的案例。

作為首個金融垂類大模型,BloombergGPT在3月的發(fā)布,為金融大模型的適配之戰(zhàn)打響了第一槍。國際金融服務(wù)巨頭Morgan Stanley(摩根士丹利)和 OpenAI 合作推出了一款基于 GPT-4 技術(shù)的聊天機(jī)器人,并利用該機(jī)器人管理其面向客戶的龐大知識庫。

在智能投顧領(lǐng)域, OpenAI 向 ChatGPT Plus 用戶開放的用于投資的第三方插Portfolio Pilot,能幫助用戶更加清晰的了解自己的投資組合,并獲得投資建議。Broadridge 子公司 LTX 推出的 BondGPT,能幫助客戶回答各種與債券相關(guān)的問題,還能根據(jù)特定數(shù)據(jù)篩選輸出可視化圖表。

回過頭再來看開啟“千模大戰(zhàn)”的國內(nèi)市場,在金融大模型的落地腳步同樣響應(yīng)迅速。半年時間,一眾傳統(tǒng)金融機(jī)構(gòu)、金融科技巨頭和互聯(lián)網(wǎng)大廠紛紛躬身入局。相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,目前國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個,其中金融行業(yè)大模型約18個。

從模型訓(xùn)練的參數(shù)量來看,國內(nèi)不乏一些“千億級”玩家:度小滿開源的軒轅大模型,在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來;恒生電子的Light-GPT利用了超過4000億個Token的金融領(lǐng)域數(shù)據(jù);螞蟻金融大模型囊括的金融語料更是超過了5000億。

互聯(lián)網(wǎng)大廠與金融科技巨頭多深耕人工智能領(lǐng)域已久,在技術(shù)落地應(yīng)用上無疑占據(jù)著先發(fā)優(yōu)勢,如自帶“安全基因”的螞蟻和360,在對抗黑灰產(chǎn)和可信AI研究領(lǐng)域有著多年經(jīng)驗(yàn)和投入。

此外,也有像華為、馬上消費(fèi)、星環(huán)科技這種“另辟蹊徑”布局金融領(lǐng)域大模型的玩家。華為依托于盤古大模型,以金融級PaaS解決方案的方式切入金融場景;馬上消費(fèi)的天鏡大模型則憑借著“三縱三橫”技術(shù)布局扎根金融行業(yè)全鏈路;數(shù)據(jù)庫廠商星環(huán)科技在自研金融大模型“無涯Infinity”的同時,還提供了一站式的企業(yè)自建大語言模型工具鏈,嘗試兩條腿并行。

9月19日,國內(nèi)首個金融行業(yè)大模型標(biāo)準(zhǔn)在南京正式發(fā)布。該標(biāo)準(zhǔn)由中國信通院牽頭,聯(lián)合騰訊云、奇富科技、科大訊飛等四十多家企業(yè)共同編制,不僅涵蓋了金融大模型的關(guān)鍵能力要求,還詳細(xì)規(guī)定了其在數(shù)據(jù)合規(guī)性、可追溯性、私有化部署、風(fēng)險控制等方面的要求。

不難看出,在政策加持和企業(yè)助推之下,金融大模型的適配之路越發(fā)明朗,正從一小步變成一大步。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

金融業(yè)需要什么樣的大模型?

通用大模型走向行業(yè)大模型的適配之戰(zhàn)。

文|數(shù)科社 林木

電影《奧本海默》里有句臺詞:(原子彈)不是一種新武器,而是一個新世界。這句話用來形容過去一年大模型的“爆炸”發(fā)展再恰當(dāng)不過。

自ChatGPT發(fā)布以來,大模型成為整個人工智能的新底座,激起了新一波技術(shù)革命浪潮。在不到一年的時間里,通用大模型的爆發(fā)開始席卷各行各業(yè),金融業(yè)作為數(shù)字化需求強(qiáng)烈的數(shù)據(jù)密集型行業(yè),成為大模型率先落地發(fā)力的最優(yōu)場景之一。

這個9月,金融大模型翻涌的海浪上又多了兩個重量級新玩家。

9月8日,螞蟻集團(tuán)在上海外灘大會發(fā)布了工業(yè)級金融大模型(AntFinGLM),同時推出了兩個配合模型層的產(chǎn)業(yè)應(yīng)用“支小寶”和“支小助”。12天后,同在上海,華為首發(fā)了包括AI for Data、AI for Business、AI for IT三大類10個場景的金融大模型方案。

隨著金融業(yè)新世界的大門開啟,金融、科技巨頭們不斷涌入,一場從通用大模型走向行業(yè)大模型的適配之戰(zhàn)也隨之打響。

金融業(yè)到底需要什么樣的大模型?通用大模型從通識階段走向?qū)WR階段,又將面臨著哪些挑戰(zhàn)?

01 一個認(rèn)知能力的引擎

近年來,擁抱數(shù)字化和新技術(shù)一直是金融行業(yè)反復(fù)強(qiáng)調(diào)和推動的重要命題。

某種角度來看,金融是一個特殊的信息處理行業(yè),因而隨之信息技術(shù)的快速更迭,金融領(lǐng)域所涉及到的功能、要素、產(chǎn)品和市場也會發(fā)生內(nèi)在潛移默化的改變。

回顧過去十年的行業(yè)發(fā)展軌跡,互聯(lián)網(wǎng)金融的出現(xiàn),讓辨別式AI在智能營銷、智能風(fēng)控、智能投研、智能客服等金融領(lǐng)域落地生花。基于機(jī)器學(xué)習(xí)驅(qū)動的建模能力不斷賦能金融產(chǎn)業(yè)鏈的變革與創(chuàng)新,同時也為人工智能的滲透融入打下根基。

金融業(yè)對大模型并不陌生,生成式AI的橫空出世,意味著行業(yè)新一輪AI革命浪潮已經(jīng)到來。

“大模型已經(jīng)不單單是一個知識的容器,它更成為一個認(rèn)知能力的引擎?!?月8日,復(fù)旦大學(xué)教授、博導(dǎo)、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華在外灘大會上,分享了對于通用大模型在適配和優(yōu)化層面的思考。

肖仰華表示,今天的大模型已經(jīng)非常擅長解決以前人工智能會碰壁的語言理解等常識類問題,甚至還具備了一定的自識反思能力和泛化組合能力,“我們不僅僅把大模型當(dāng)做一個某類數(shù)據(jù)處理的基礎(chǔ)模型,已經(jīng)把它當(dāng)作未來適應(yīng)復(fù)雜環(huán)境的自治智能體的一個大佬?!?/p>

在他看來,這些能力恰恰是行業(yè)的認(rèn)知所需要的,今天一個通用語料訓(xùn)練出來的大模型,已經(jīng)成為行業(yè)垂語認(rèn)知的一個重要基座。如金融領(lǐng)域的智能解決方案,過往思路是收集整個行業(yè)的數(shù)據(jù)來構(gòu)建,整個關(guān)注點(diǎn)仍在于行業(yè)數(shù)據(jù)和知識,但大模型卻是顛覆了這一認(rèn)知。

肖仰華以醫(yī)生診斷疾病舉例,一個醫(yī)生想勝任他的工作,首先要認(rèn)知什么是健康,“我們發(fā)現(xiàn)其實(shí)行業(yè)的很多問題恰恰是建立在通用的認(rèn)知能力基礎(chǔ)上。”因此他認(rèn)為大模型亦是如此,通用認(rèn)知的理解非常重要,沒有通識能力,是不可能發(fā)展出專業(yè)認(rèn)知能力的。

當(dāng)下已由感知智能轉(zhuǎn)換到認(rèn)知智能的大模型顯然已具備了這一條件。相比以識別能力為主的傳統(tǒng)AI模型,生成式AI的認(rèn)知智能體現(xiàn)在理解、分析和決策三個維度上。

比如,它可以通過前文來預(yù)測下一個詞語,對文本中不同的詞語賦予不同的權(quán)重值,能夠在生成文本時綜合考慮到文本中的上下文關(guān)系,生成更連貫、合理的文本,賦予了其內(nèi)容生產(chǎn)能力。這就注定了其會在智能交互環(huán)節(jié)大放異彩。

此外,生成式AI還可以從已有數(shù)據(jù)中學(xué)習(xí)樣本的統(tǒng)計(jì)特征,并在此基礎(chǔ)上生成新的數(shù)據(jù),這種增強(qiáng)學(xué)習(xí)的過程,對于金融領(lǐng)域的智能投顧、風(fēng)險控制等都無異于一種新的驅(qū)動力。

數(shù)據(jù)訓(xùn)練是大模型提升性能不可或缺的重要一環(huán),OpenAI 團(tuán)隊(duì)所提出的大模型遵循的“伸縮法則”指出,當(dāng)參數(shù)規(guī)模增加、數(shù)據(jù)集規(guī)模增加并延長模型訓(xùn)練時間,大模型的性能就會提升,并且如不受其他兩個因素制約時,大模型性能與每個單獨(dú)的因素都呈現(xiàn)冪律關(guān)系。

作為數(shù)據(jù)密集型行業(yè),金融業(yè)沉淀了如金融交易數(shù)據(jù)、客戶信息、市場分析、風(fēng)控數(shù)據(jù)等海量數(shù)據(jù),又催生出大量高效處理的技術(shù)需求。因此,大模型落地金融業(yè),無疑是一場雙向奔赴。

02 還有“最后一公里”要走

盡管大模型的問世帶給諸多行業(yè)巨大的想象空間,但當(dāng)下對于金融業(yè)而言,通用大模型拿來就可用嗎?答案顯示是否定的。

在肖仰華看來,金融領(lǐng)域的本質(zhì)是一類復(fù)雜決策,遠(yuǎn)遠(yuǎn)比開放閑聊的任務(wù)要困難得多,“你會發(fā)現(xiàn)通用模型里面的專業(yè)知識是遠(yuǎn)遠(yuǎn)不夠的,通用大模型好比是一個夯實(shí)的知識底座,寬廣有余,但縱深不足。”

除了專業(yè)力上的欠缺,肖仰華還提到一個非常值得關(guān)注的問題,即大模型“幻覺”——指大模型在生產(chǎn)內(nèi)容的過程中,可能會由于訓(xùn)練語料及模型的原因,產(chǎn)生事實(shí)性的錯誤。

“行業(yè)中經(jīng)常是希望大模型按照給出的規(guī)范、制度、文檔回答問題,而不是從通用領(lǐng)域習(xí)得的知識回答問題,從技術(shù)上是叫Closed QA,而不是Open QA?!彼J(rèn)為,正是因?yàn)榇竽P蜕瞄L發(fā)揮創(chuàng)造,就很有可能跳出給定的內(nèi)容去胡編亂造,缺乏領(lǐng)域的忠實(shí)度。

當(dāng)下來看,這種“幻覺”無疑是通用大模型落地部分行業(yè)的障礙之一,尤其像數(shù)據(jù)敏感度較高的金融領(lǐng)域。

為了解決這一問題,OpenAI采取的做法是通過加強(qiáng)遷移學(xué)習(xí)和對抗訓(xùn)練,以提高回答的準(zhǔn)確性和靠程度,GPT-4的內(nèi)容準(zhǔn)確性比GPT-3.5已增高了40%。而行業(yè)中的常見方法是通過對模型進(jìn)行領(lǐng)域知識的微調(diào),利用更加精確的數(shù)據(jù)來糾正模型的偏差,也就是構(gòu)建垂直領(lǐng)域模型。

肖仰華給出的應(yīng)對思路在于注重大模型和相關(guān)技術(shù)的協(xié)同。他表示,在大模型協(xié)助下,行業(yè)中很多任務(wù)被分成提示、生成、評估三個子任務(wù),大模型主要在生成階段發(fā)力,而在提示和評估階段,仍有很多傳統(tǒng)系統(tǒng)發(fā)揮價值的余地。

譬如知識圖譜技術(shù),圖譜中的知識往往擅長表達(dá)的是專業(yè)知識、私密知識,和可理解、可控的符號知識,它和大模型所表達(dá)的恰成一種緊密的互補(bǔ)關(guān)系。利用知識圖譜做事后評測、驗(yàn)證以及增強(qiáng)提示,可以進(jìn)一步改善大模型的“幻覺”問題。

這種應(yīng)對思路在當(dāng)前一些重量級金融大模型身上已然被驗(yàn)證,如螞蟻的金融科技團(tuán)隊(duì)過去幾年在構(gòu)建金融知識圖譜上做了大量投入。

以支小寶團(tuán)隊(duì)為例,首先基于一些研報、新聞、大V資訊以及高質(zhì)量權(quán)威合作數(shù)據(jù)源和數(shù)據(jù)庫,通過合作的專家,對于領(lǐng)域?qū)I(yè)知識進(jìn)行了提煉和萃取,形成了一個標(biāo)準(zhǔn)化基礎(chǔ)知識層。然后算法工程師再在此基礎(chǔ)上做關(guān)聯(lián)和整合,嘗試建構(gòu)金融現(xiàn)象之間的因果邏輯,最終匹配金融專業(yè)要求的知識圖譜得以形成。

肖仰華表示,要把通用大模型的適配和優(yōu)化當(dāng)成一個系統(tǒng)工程,從數(shù)據(jù)層面、知識層面、架構(gòu)層面、評估評測層面、生態(tài)體系等各個方面去尋找思路解決問題,“我們?nèi)匀挥新L的路要走,才能走完這最后的一公里?!?/p>

03 風(fēng)起云涌的適配之戰(zhàn)

眼下,大模型從通識階段走向?qū)WR階段才剛剛邁出一小步,這個落地過程必然少不了金融機(jī)構(gòu)與金融科技巨頭的涌入、實(shí)踐和推動。

目前來看,大模型技術(shù)發(fā)展先行一步的海外市場,從金融垂類大模型的構(gòu)建,到將如信息管理、智能推薦、 細(xì)分領(lǐng)域問答等各個金融場景的應(yīng)用,已有多個成功落地賦能行業(yè)的案例。

作為首個金融垂類大模型,BloombergGPT在3月的發(fā)布,為金融大模型的適配之戰(zhàn)打響了第一槍。國際金融服務(wù)巨頭Morgan Stanley(摩根士丹利)和 OpenAI 合作推出了一款基于 GPT-4 技術(shù)的聊天機(jī)器人,并利用該機(jī)器人管理其面向客戶的龐大知識庫。

在智能投顧領(lǐng)域, OpenAI 向 ChatGPT Plus 用戶開放的用于投資的第三方插Portfolio Pilot,能幫助用戶更加清晰的了解自己的投資組合,并獲得投資建議。Broadridge 子公司 LTX 推出的 BondGPT,能幫助客戶回答各種與債券相關(guān)的問題,還能根據(jù)特定數(shù)據(jù)篩選輸出可視化圖表。

回過頭再來看開啟“千模大戰(zhàn)”的國內(nèi)市場,在金融大模型的落地腳步同樣響應(yīng)迅速。半年時間,一眾傳統(tǒng)金融機(jī)構(gòu)、金融科技巨頭和互聯(lián)網(wǎng)大廠紛紛躬身入局。相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,目前國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個,其中金融行業(yè)大模型約18個。

從模型訓(xùn)練的參數(shù)量來看,國內(nèi)不乏一些“千億級”玩家:度小滿開源的軒轅大模型,在1760億參數(shù)的Bloom大模型基礎(chǔ)上訓(xùn)練而來;恒生電子的Light-GPT利用了超過4000億個Token的金融領(lǐng)域數(shù)據(jù);螞蟻金融大模型囊括的金融語料更是超過了5000億。

互聯(lián)網(wǎng)大廠與金融科技巨頭多深耕人工智能領(lǐng)域已久,在技術(shù)落地應(yīng)用上無疑占據(jù)著先發(fā)優(yōu)勢,如自帶“安全基因”的螞蟻和360,在對抗黑灰產(chǎn)和可信AI研究領(lǐng)域有著多年經(jīng)驗(yàn)和投入。

此外,也有像華為、馬上消費(fèi)、星環(huán)科技這種“另辟蹊徑”布局金融領(lǐng)域大模型的玩家。華為依托于盤古大模型,以金融級PaaS解決方案的方式切入金融場景;馬上消費(fèi)的天鏡大模型則憑借著“三縱三橫”技術(shù)布局扎根金融行業(yè)全鏈路;數(shù)據(jù)庫廠商星環(huán)科技在自研金融大模型“無涯Infinity”的同時,還提供了一站式的企業(yè)自建大語言模型工具鏈,嘗試兩條腿并行。

9月19日,國內(nèi)首個金融行業(yè)大模型標(biāo)準(zhǔn)在南京正式發(fā)布。該標(biāo)準(zhǔn)由中國信通院牽頭,聯(lián)合騰訊云、奇富科技、科大訊飛等四十多家企業(yè)共同編制,不僅涵蓋了金融大模型的關(guān)鍵能力要求,還詳細(xì)規(guī)定了其在數(shù)據(jù)合規(guī)性、可追溯性、私有化部署、風(fēng)險控制等方面的要求。

不難看出,在政策加持和企業(yè)助推之下,金融大模型的適配之路越發(fā)明朗,正從一小步變成一大步。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。