正在閱讀:

金融大模型應用面臨三大挑戰(zhàn),聯(lián)邦學習是否是破局關(guān)鍵?

掃一掃下載界面新聞APP

金融大模型應用面臨三大挑戰(zhàn),聯(lián)邦學習是否是破局關(guān)鍵?

聯(lián)邦學習解決大模型應用落地的技術(shù)難題提供了創(chuàng)新路徑

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 劉晨光

近年來,以大模型為代表的AI技術(shù)進入發(fā)展快車道,成為當下最受大眾矚目的熱點話題。

伴隨大模型技術(shù)的飛速發(fā)展,全球人工智能技術(shù)發(fā)展和應用迭代速度都得到了極大提升,大模型技術(shù)也被認為是通用人工智能技術(shù)的核心引擎。

工信部發(fā)布的數(shù)據(jù)顯示,截至2023年6月,我國人工智能核心產(chǎn)業(yè)規(guī)模已經(jīng)達到5000億,人工智能企業(yè)數(shù)量超過4400家。

7月2日,“大模型時代AI前沿與金融應用”為主題的微眾媒體學院會議上,業(yè)內(nèi)專家普遍認為,以金融為代表的大模型技術(shù)在發(fā)展應用中顯現(xiàn)三大挑戰(zhàn):一是從算力角度,大模型的訓練過程中需要龐大的硬件算力資源支撐,大模型參數(shù)規(guī)模呈持續(xù)擴張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內(nèi)容可能存在安全風險,同時廣泛存在隱形偏見的可能性;三從數(shù)據(jù)角度,近年來各項法律法規(guī)對私域數(shù)據(jù)的使用有數(shù)據(jù)可用不可見的要求,在醫(yī)療、金融等行業(yè)都存在海量自治的高質(zhì)量數(shù)據(jù),但受限于隱私無法共享利用。

事實上,在大模型的實踐應用中,金融行業(yè)由于具備數(shù)字化程度高、商業(yè)化應用場景潛在價值高等優(yōu)勢,成為了AI大模型落地應用的最佳場景之一。

微眾銀行首席人工智能官楊強指出,大模型的應用落地涉及數(shù)據(jù)管理、算法優(yōu)化、系統(tǒng)設計和成本控制等多方面的綜合挑戰(zhàn),需要持續(xù)的技術(shù)創(chuàng)新和策略調(diào)整,以推動AI技術(shù)更加成熟、高效地服務于社會各個領域?!癆I Agent(人工智能業(yè)務助理)是大模型面向應用端發(fā)展的下一階段,其基于大模型的通用能力,并結(jié)合相關(guān)領域知識適應不同場景需求?!?/span>

此外,在楊強看來,隨著大模型的發(fā)展,如果面臨數(shù)據(jù)缺乏的問題,會衍生出一個概念即聯(lián)邦大模型。這個聯(lián)邦的概念實際上是一個分布式概念。現(xiàn)在的大模型基本上都是一個中心化訓練出來的結(jié)果,會利用大量算力、數(shù)據(jù)和電力來做訓練。

楊強認為,當大模型的數(shù)據(jù)載量大到一定程度,社會就沒辦法承擔相關(guān)成本最好是分解成一些分布式的算力中心,這些小的算力中心可以來訓練一個小的大模型。“他們之間的連接幫助形成一個全局的大模型。這個全局大模型,第一個是具有分布式的能力,第二個是可以在保護隱私的前提下,利用好每一個地點的數(shù)據(jù)?!睏顝姺治稣f。

楊強認為,未來每一個人的手機都是一個算力中心。陌生人之間也可以合作,聯(lián)成一個網(wǎng)絡,共同訓練在某個領域的大模型。這些模型都是在本地訓練、本地使用,通過聯(lián)網(wǎng)的方式,這個分布式網(wǎng)絡叫聯(lián)邦網(wǎng)絡,既能保護隱私,又能夠做到分布式訓練。

楊強指出,通過縱向聯(lián)邦學習,可以幫助企業(yè)之間解決數(shù)據(jù)合作的問題使用各自的特有數(shù)據(jù),共同建立更加強大的模型。

“比方說一方是金融機構(gòu),一方是非金融機構(gòu)。非金融機構(gòu)豐富的數(shù)據(jù),由于企業(yè)用戶數(shù)據(jù)隱私安全的要求無法直接互通數(shù)據(jù)。這種情況下兩邊可以合作,形成一個全局模型,來幫助金融機構(gòu)建立更好的風控模型或者營銷模型?!?/span>

楊強坦言,如何最好地保護隱私,如何能夠把算法效率給提升到最高,并且讓這個模型最準,這三個目標是互相牽制的。因此需要通過研究不同的聯(lián)邦學習范式來解決這三個目標的協(xié)調(diào)問題。

“聯(lián)邦學習就像是讓模型去作為溝通的方式,而不是利用數(shù)據(jù)作為溝通的方式,這樣原始數(shù)據(jù)可以不出本域也可以把模型給做出來?!睏顝娬f。

微眾銀行人工智能首席科學家范力欣認為,聯(lián)邦學習作為一種先進的分布式機器學習范式,允許參與方在不直接共享原始數(shù)據(jù)的情況下協(xié)作訓練模型,為解決大模型應用落地的技術(shù)難題提供了創(chuàng)新路徑。

“聯(lián)邦大模型技術(shù)路線通過其獨特的設計,不僅解決了數(shù)據(jù)時效性、模型幻覺、專業(yè)知識融合及算力資源消耗等挑戰(zhàn),而且在保護數(shù)據(jù)隱私和促進AI技術(shù)公平性方面邁出了重要一步,為大模型在以金融為代表的各領域的廣泛應用開辟了新的可能?!狈读π辣硎尽?/span>

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

金融大模型應用面臨三大挑戰(zhàn),聯(lián)邦學習是否是破局關(guān)鍵?

聯(lián)邦學習解決大模型應用落地的技術(shù)難題提供了創(chuàng)新路徑

圖片來源:圖蟲創(chuàng)意

界面新聞記者 | 劉晨光

近年來,以大模型為代表的AI技術(shù)進入發(fā)展快車道,成為當下最受大眾矚目的熱點話題。

伴隨大模型技術(shù)的飛速發(fā)展,全球人工智能技術(shù)發(fā)展和應用迭代速度都得到了極大提升,大模型技術(shù)也被認為是通用人工智能技術(shù)的核心引擎。

工信部發(fā)布的數(shù)據(jù)顯示,截至2023年6月,我國人工智能核心產(chǎn)業(yè)規(guī)模已經(jīng)達到5000億,人工智能企業(yè)數(shù)量超過4400家。

7月2日,“大模型時代AI前沿與金融應用”為主題的微眾媒體學院會議上業(yè)內(nèi)專家普遍認為,以金融為代表的大模型技術(shù)在發(fā)展應用中顯現(xiàn)三大挑戰(zhàn):一是從算力角度,大模型的訓練過程中需要龐大的硬件算力資源支撐,大模型參數(shù)規(guī)模呈持續(xù)擴張趨勢,對算力提出了更高要求;二是從算法角度,大模型生成內(nèi)容可能存在安全風險,同時廣泛存在隱形偏見的可能性;三從數(shù)據(jù)角度,近年來各項法律法規(guī)對私域數(shù)據(jù)的使用有數(shù)據(jù)可用不可見的要求,在醫(yī)療、金融等行業(yè)都存在海量自治的高質(zhì)量數(shù)據(jù),但受限于隱私無法共享利用。

事實上,在大模型的實踐應用中,金融行業(yè)由于具備數(shù)字化程度高、商業(yè)化應用場景潛在價值高等優(yōu)勢,成為了AI大模型落地應用的最佳場景之一。

微眾銀行首席人工智能官楊強指出,大模型的應用落地涉及數(shù)據(jù)管理、算法優(yōu)化、系統(tǒng)設計和成本控制等多方面的綜合挑戰(zhàn),需要持續(xù)的技術(shù)創(chuàng)新和策略調(diào)整,以推動AI技術(shù)更加成熟、高效地服務于社會各個領域?!癆I Agent(人工智能業(yè)務助理)是大模型面向應用端發(fā)展的下一階段,其基于大模型的通用能力,并結(jié)合相關(guān)領域知識適應不同場景需求?!?/span>

此外,在楊強看來,隨著大模型的發(fā)展,如果面臨數(shù)據(jù)缺乏的問題,會衍生出一個概念即聯(lián)邦大模型這個聯(lián)邦的概念實際上是一個分布式概念?,F(xiàn)在的大模型基本上都是一個中心化訓練出來的結(jié)果,會利用大量算力、數(shù)據(jù)和電力來做訓練。

楊強認為,當大模型的數(shù)據(jù)載量大到一定程度,社會就沒辦法承擔相關(guān)成本,最好是分解成一些分布式的算力中心,這些小的算力中心可以來訓練一個小的大模型。“他們之間的連接幫助形成一個全局的大模型。這個全局大模型,第一個是具有分布式的能力,第二個是可以在保護隱私的前提下,利用好每一個地點的數(shù)據(jù)?!睏顝姺治稣f。

楊強認為,未來每一個人的手機都是一個算力中心。陌生人之間也可以合作,聯(lián)成一個網(wǎng)絡,共同訓練在某個領域的大模型。這些模型都是在本地訓練、本地使用,通過聯(lián)網(wǎng)的方式,這個分布式網(wǎng)絡叫聯(lián)邦網(wǎng)絡,既能保護隱私,又能夠做到分布式訓練。

楊強指出,通過縱向聯(lián)邦學習,可以幫助企業(yè)之間解決數(shù)據(jù)合作的問題使用各自的特有數(shù)據(jù),共同建立更加強大的模型。

“比方說一方是金融機構(gòu),一方是非金融機構(gòu)。非金融機構(gòu)豐富的數(shù)據(jù),由于企業(yè)用戶數(shù)據(jù)隱私安全的要求無法直接互通數(shù)據(jù)。這種情況下兩邊可以合作,形成一個全局模型,來幫助金融機構(gòu)建立更好的風控模型或者營銷模型?!?/span>

楊強坦言,如何最好地保護隱私,如何能夠把算法效率給提升到最高,并且讓這個模型最準,這三個目標是互相牽制的。因此需要通過研究不同的聯(lián)邦學習范式來解決這三個目標的協(xié)調(diào)問題。

“聯(lián)邦學習就像是讓模型去作為溝通的方式,而不是利用數(shù)據(jù)作為溝通的方式,這樣原始數(shù)據(jù)可以不出本域也可以把模型給做出來?!睏顝娬f。

微眾銀行人工智能首席科學家范力欣認為,聯(lián)邦學習作為一種先進的分布式機器學習范式,允許參與方在不直接共享原始數(shù)據(jù)的情況下協(xié)作訓練模型,為解決大模型應用落地的技術(shù)難題提供了創(chuàng)新路徑。

“聯(lián)邦大模型技術(shù)路線通過其獨特的設計,不僅解決了數(shù)據(jù)時效性、模型幻覺、專業(yè)知識融合及算力資源消耗等挑戰(zhàn),而且在保護數(shù)據(jù)隱私和促進AI技術(shù)公平性方面邁出了重要一步,為大模型在以金融為代表的各領域的廣泛應用開辟了新的可能?!狈读π辣硎尽?/span>

未經(jīng)正式授權(quán)嚴禁轉(zhuǎn)載本文,侵權(quán)必究。