正在閱讀:

你還不知道什么是AI大模型?

掃一掃下載界面新聞APP

你還不知道什么是AI大模型?

大模型作為人工智能技術的重要組成部分,可以在各個領域發(fā)揮巨大的作用。

文|上海汽車報

當前,人工智能(AI)正在成為新一輪科技進步和產(chǎn)業(yè)變革的關鍵要素。工業(yè)和信息化部副部長徐曉蘭在日前召開的“2023世界AI大會”上表示,我國AI產(chǎn)業(yè)體系逐步完善,核心產(chǎn)業(yè)規(guī)模已達5000億元,企業(yè)數(shù)量超過4300家,智能芯片、開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。

隨著ChatGPT這一現(xiàn)象級產(chǎn)品橫空出世,“AI大模型”一詞進入更多人的視野,同時拉開了大模型產(chǎn)業(yè)和生成式AI產(chǎn)業(yè)蓬勃發(fā)展的序幕。

除了海外的OpenAI、微軟、谷歌、Meta,國內(nèi)市場也出現(xiàn)了百花齊放的現(xiàn)象。3月,百度率先發(fā)布了新一代大語言模型“文心一言”,成為中國第一家正式推出對標ChatGPT產(chǎn)品的企業(yè)。此后,阿里、華為、騰訊、字節(jié)跳動等巨頭廠商開始陸續(xù)發(fā)布自己的大模型產(chǎn)品。

什么是大模型?

AI模型可以分為淺層模型和深度學習模型兩大類。大模型屬于深度學習模型,是一個龐大、復雜的神經(jīng)網(wǎng)絡,需要通過存儲更多參數(shù)來增加模型的深度和寬度,從而提高模型的表現(xiàn)能力。參數(shù)量一般從百億起步,對大量數(shù)據(jù)進行訓練并產(chǎn)生高質(zhì)量的預測結果。最著名的AI大模型莫過于OpenAI的GPT-3模型,參數(shù)規(guī)模達1750億,谷歌的PaLM-E模型的參數(shù)規(guī)模更是達到了5620億。

一般來說,大模型具有更好的通用性、精度和效率,可以通過預訓練或其他方式在大型數(shù)據(jù)集上進行學習,再通過微調(diào),最終高效地完成自然語言處理、圖像識別、語音識別等復雜任務。

用百度CEO李彥宏的話來說,就是過去的AI是人類想讓機器學會什么技能,就教它什么技能。教過的技能,它有可能會,沒教過的就不會。大模型出現(xiàn)后,以前沒教過的技能,它可能也會,這種現(xiàn)象被稱為“智能涌現(xiàn)”。同時,大模型讓AI發(fā)展方向從辨別式走向了生成式。搜索引擎就是典型的辨別式,而用AI進行文學創(chuàng)作、寫報告、繪制海報等就被稱為生成式。

大模型重新定義了哪些內(nèi)容?

現(xiàn)在,行業(yè)內(nèi)有一種說法,那就是大模型時代來臨了,每一個產(chǎn)品都值得重做一遍。

大模型帶來了哪些改變?首先,大模型再度改變了人機交互的方式。過去幾十年里,人機交互方式發(fā)生了幾次變化。從一開始用鍵盤輸入文字命令到后來的圖形用戶界面,也就是現(xiàn)在人們常用的在電腦中點開對應的菜單和選項進行指令的輸入,這種方式比第一種方式要友好得多,大部分人很快就能上手,但它不是最直接的輸入方式。后來,人們可以通過自然語音與機器進行一些簡單的輸入和交互。如今,當你用自然語言與機器進行交互時,它能夠處理更加復雜的工作。

比如,你想查詢“今年上半年,公司有哪些產(chǎn)品的毛利率超過了新冠疫情爆發(fā)前的水平?”這件事,過去需要人工花費半天到一天時間才能獲得結果。如今,在大模型的加持下,計算機有可能在幾秒鐘以內(nèi)就能給你一個表格。

此外,大模型的出現(xiàn)讓IT技術棧發(fā)生了根本性變化。過去,無論是PC還是移動時代,IT技術棧都是三層,即芯片層、操作系統(tǒng)層、應用層。

大模型時代,IT技術棧變成了四層:底層仍然是芯片層。芯片層之上是框架層,就是深度學習框架,比如ChatGPT的框架層Transformer、Meta的PyTorch,以及谷歌的TensorFlow都是深度學習框架??蚣軐又鲜悄P蛯?,ChatGPT、文心一言都屬于模型層。最上面的一層才是應用層。

現(xiàn)在,大模型已經(jīng)讓開發(fā)者有能力推出并將催生出更多AI原生應用。比如,DoNotPay是一個用AI幫助人們打官司、寫法律文書的應用,AI能幫你把不該付的錢要回來。Jasper是一個通過AI幫助企業(yè)和個人寫營銷推廣文案的應用。

從大模型到應用層

“大模型本身是實現(xiàn)產(chǎn)業(yè)價值的工具,真正實現(xiàn)自己的價值一定是在產(chǎn)業(yè)的應用中?!本〇|集團CEO許冉曾表示,大模型的價值等于算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,前三個指標固然重要,但技術在產(chǎn)業(yè)場景落地應用,創(chuàng)造實際價值才是關鍵。

目前,除了前文提到的幾個例子以外,還有幾個行業(yè)的大模型應用受到了比較多的關注:一是在醫(yī)療領域可以開發(fā)針對疾病及其癥狀的大模型,幫助醫(yī)生更好地診斷和治療疾??;二是在金融領域可以開發(fā)針對股票和市場行情的大模型,幫助投資者更好地做出決策。

再者是汽車領域,自動駕駛是AI應用的熱門場景。根據(jù)艾媒咨詢提供的數(shù)據(jù),到2025年,我國自動駕駛汽車行業(yè)規(guī)模預計將從2015年的30.5億元增長至267.6億元。開源證券指出,大模型在自動駕駛中應用趨勢明確。

大模型的自學習算法能力在汽車駕駛過程中發(fā)揮的關鍵作用,主要體現(xiàn)在感知和決策層面。就感知層面而言,以往自動駕駛感知使用的都是各個小模型“堆疊”的方式,識別的原理就是自己先看,然后到知識庫里進行比對,如果以前沒有學習過,那就無法準確識別出來。這種方法對于感知能力的提升是有限的,因為路況的變化是日新月異的。此前,特斯拉自動駕駛汽車高速撞上側翻的白色貨車,就有可能是將側翻的車廂誤判為天空或者強反光地面。而有了AI大模型后,可以在有限的標注數(shù)據(jù)前提下,找到相似障礙物之間的相關性。

AI大模型上車后,還有一個很重要的提升點,那就是智能座艙的進一步智能化。以往,車載語音助手只是單純地執(zhí)行用戶的指令,屬于命令式交互。而在大模型的加持下,未來車載語音助手有望轉變成能和用戶閑聊的伙伴。此前,東風日產(chǎn)、紅旗、長城,以及吉利銀河等近10家車企或品牌宣布接入百度的文心一言;阿里巴巴也宣布,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試。

大模型“井噴”,政策推動發(fā)展

自3月以來,國內(nèi)大模型呈現(xiàn)“井噴”狀態(tài)。從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機構到科創(chuàng)企業(yè),大家對大模型趨之若鶩,在短時間內(nèi)紛紛推出自有的大模型產(chǎn)品。

據(jù)科技部新一代AI發(fā)展研究中心于5月底發(fā)布的《中國AI大模型地圖研究報告》顯示,我國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型,即將迎來“百模大戰(zhàn)”。

北京、上海和深圳等地接連出臺政策舉措,積極布局AI產(chǎn)業(yè)。日前,《上海市推動AI大模型創(chuàng)新發(fā)展的若干措施》公布,并發(fā)布了“?!倍汲h。據(jù)介紹,上海破解大模型發(fā)展瓶頸的三項計劃是:一是大模型創(chuàng)新扶持計劃,重點支持上海市創(chuàng)新主體研發(fā)具有國際競爭力的大模型;二是智能算力加速計劃,強化大模型智能算力建設力度,建立綠色通道;三是示范應用推進計劃,加強大模型在特定領域的深度應用和標桿場景打造。

在ChatGPT引發(fā)的大模型浪潮中,巨頭廠商、國內(nèi)科技企業(yè)的入局,加之政策的推動,使國內(nèi)大模型領域遍地開花。大模型作為人工智能技術的重要組成部分,可以在各個領域發(fā)揮巨大的作用。但AI大模型也存在一些問題和挑戰(zhàn)。由于AI大模型的復雜性,可解釋性(表示模型能夠使用人類可認知的說法進行解釋和呈現(xiàn))有可能相對較低,會給人類帶來一定的困惑和不確定性。此外,由于AI大模型的使用涉及隱私和安全等問題,需要加強相關的法律法規(guī)和管理措施。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

你還不知道什么是AI大模型?

大模型作為人工智能技術的重要組成部分,可以在各個領域發(fā)揮巨大的作用。

文|上海汽車報

當前,人工智能(AI)正在成為新一輪科技進步和產(chǎn)業(yè)變革的關鍵要素。工業(yè)和信息化部副部長徐曉蘭在日前召開的“2023世界AI大會”上表示,我國AI產(chǎn)業(yè)體系逐步完善,核心產(chǎn)業(yè)規(guī)模已達5000億元,企業(yè)數(shù)量超過4300家,智能芯片、開發(fā)框架、通用大模型等創(chuàng)新成果不斷涌現(xiàn)。

隨著ChatGPT這一現(xiàn)象級產(chǎn)品橫空出世,“AI大模型”一詞進入更多人的視野,同時拉開了大模型產(chǎn)業(yè)和生成式AI產(chǎn)業(yè)蓬勃發(fā)展的序幕。

除了海外的OpenAI、微軟、谷歌、Meta,國內(nèi)市場也出現(xiàn)了百花齊放的現(xiàn)象。3月,百度率先發(fā)布了新一代大語言模型“文心一言”,成為中國第一家正式推出對標ChatGPT產(chǎn)品的企業(yè)。此后,阿里、華為、騰訊、字節(jié)跳動等巨頭廠商開始陸續(xù)發(fā)布自己的大模型產(chǎn)品。

什么是大模型?

AI模型可以分為淺層模型和深度學習模型兩大類。大模型屬于深度學習模型,是一個龐大、復雜的神經(jīng)網(wǎng)絡,需要通過存儲更多參數(shù)來增加模型的深度和寬度,從而提高模型的表現(xiàn)能力。參數(shù)量一般從百億起步,對大量數(shù)據(jù)進行訓練并產(chǎn)生高質(zhì)量的預測結果。最著名的AI大模型莫過于OpenAI的GPT-3模型,參數(shù)規(guī)模達1750億,谷歌的PaLM-E模型的參數(shù)規(guī)模更是達到了5620億。

一般來說,大模型具有更好的通用性、精度和效率,可以通過預訓練或其他方式在大型數(shù)據(jù)集上進行學習,再通過微調(diào),最終高效地完成自然語言處理、圖像識別、語音識別等復雜任務。

用百度CEO李彥宏的話來說,就是過去的AI是人類想讓機器學會什么技能,就教它什么技能。教過的技能,它有可能會,沒教過的就不會。大模型出現(xiàn)后,以前沒教過的技能,它可能也會,這種現(xiàn)象被稱為“智能涌現(xiàn)”。同時,大模型讓AI發(fā)展方向從辨別式走向了生成式。搜索引擎就是典型的辨別式,而用AI進行文學創(chuàng)作、寫報告、繪制海報等就被稱為生成式。

大模型重新定義了哪些內(nèi)容?

現(xiàn)在,行業(yè)內(nèi)有一種說法,那就是大模型時代來臨了,每一個產(chǎn)品都值得重做一遍。

大模型帶來了哪些改變?首先,大模型再度改變了人機交互的方式。過去幾十年里,人機交互方式發(fā)生了幾次變化。從一開始用鍵盤輸入文字命令到后來的圖形用戶界面,也就是現(xiàn)在人們常用的在電腦中點開對應的菜單和選項進行指令的輸入,這種方式比第一種方式要友好得多,大部分人很快就能上手,但它不是最直接的輸入方式。后來,人們可以通過自然語音與機器進行一些簡單的輸入和交互。如今,當你用自然語言與機器進行交互時,它能夠處理更加復雜的工作。

比如,你想查詢“今年上半年,公司有哪些產(chǎn)品的毛利率超過了新冠疫情爆發(fā)前的水平?”這件事,過去需要人工花費半天到一天時間才能獲得結果。如今,在大模型的加持下,計算機有可能在幾秒鐘以內(nèi)就能給你一個表格。

此外,大模型的出現(xiàn)讓IT技術棧發(fā)生了根本性變化。過去,無論是PC還是移動時代,IT技術棧都是三層,即芯片層、操作系統(tǒng)層、應用層。

大模型時代,IT技術棧變成了四層:底層仍然是芯片層。芯片層之上是框架層,就是深度學習框架,比如ChatGPT的框架層Transformer、Meta的PyTorch,以及谷歌的TensorFlow都是深度學習框架??蚣軐又鲜悄P蛯?,ChatGPT、文心一言都屬于模型層。最上面的一層才是應用層。

現(xiàn)在,大模型已經(jīng)讓開發(fā)者有能力推出并將催生出更多AI原生應用。比如,DoNotPay是一個用AI幫助人們打官司、寫法律文書的應用,AI能幫你把不該付的錢要回來。Jasper是一個通過AI幫助企業(yè)和個人寫營銷推廣文案的應用。

從大模型到應用層

“大模型本身是實現(xiàn)產(chǎn)業(yè)價值的工具,真正實現(xiàn)自己的價值一定是在產(chǎn)業(yè)的應用中?!本〇|集團CEO許冉曾表示,大模型的價值等于算法×算力×數(shù)據(jù)×產(chǎn)業(yè)厚度的平方,前三個指標固然重要,但技術在產(chǎn)業(yè)場景落地應用,創(chuàng)造實際價值才是關鍵。

目前,除了前文提到的幾個例子以外,還有幾個行業(yè)的大模型應用受到了比較多的關注:一是在醫(yī)療領域可以開發(fā)針對疾病及其癥狀的大模型,幫助醫(yī)生更好地診斷和治療疾??;二是在金融領域可以開發(fā)針對股票和市場行情的大模型,幫助投資者更好地做出決策。

再者是汽車領域,自動駕駛是AI應用的熱門場景。根據(jù)艾媒咨詢提供的數(shù)據(jù),到2025年,我國自動駕駛汽車行業(yè)規(guī)模預計將從2015年的30.5億元增長至267.6億元。開源證券指出,大模型在自動駕駛中應用趨勢明確。

大模型的自學習算法能力在汽車駕駛過程中發(fā)揮的關鍵作用,主要體現(xiàn)在感知和決策層面。就感知層面而言,以往自動駕駛感知使用的都是各個小模型“堆疊”的方式,識別的原理就是自己先看,然后到知識庫里進行比對,如果以前沒有學習過,那就無法準確識別出來。這種方法對于感知能力的提升是有限的,因為路況的變化是日新月異的。此前,特斯拉自動駕駛汽車高速撞上側翻的白色貨車,就有可能是將側翻的車廂誤判為天空或者強反光地面。而有了AI大模型后,可以在有限的標注數(shù)據(jù)前提下,找到相似障礙物之間的相關性。

AI大模型上車后,還有一個很重要的提升點,那就是智能座艙的進一步智能化。以往,車載語音助手只是單純地執(zhí)行用戶的指令,屬于命令式交互。而在大模型的加持下,未來車載語音助手有望轉變成能和用戶閑聊的伙伴。此前,東風日產(chǎn)、紅旗、長城,以及吉利銀河等近10家車企或品牌宣布接入百度的文心一言;阿里巴巴也宣布,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試。

大模型“井噴”,政策推動發(fā)展

自3月以來,國內(nèi)大模型呈現(xiàn)“井噴”狀態(tài)。從互聯(lián)網(wǎng)巨頭到IT企業(yè),從科研機構到科創(chuàng)企業(yè),大家對大模型趨之若鶩,在短時間內(nèi)紛紛推出自有的大模型產(chǎn)品。

據(jù)科技部新一代AI發(fā)展研究中心于5月底發(fā)布的《中國AI大模型地圖研究報告》顯示,我國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型,即將迎來“百模大戰(zhàn)”。

北京、上海和深圳等地接連出臺政策舉措,積極布局AI產(chǎn)業(yè)。日前,《上海市推動AI大模型創(chuàng)新發(fā)展的若干措施》公布,并發(fā)布了“?!倍汲h。據(jù)介紹,上海破解大模型發(fā)展瓶頸的三項計劃是:一是大模型創(chuàng)新扶持計劃,重點支持上海市創(chuàng)新主體研發(fā)具有國際競爭力的大模型;二是智能算力加速計劃,強化大模型智能算力建設力度,建立綠色通道;三是示范應用推進計劃,加強大模型在特定領域的深度應用和標桿場景打造。

在ChatGPT引發(fā)的大模型浪潮中,巨頭廠商、國內(nèi)科技企業(yè)的入局,加之政策的推動,使國內(nèi)大模型領域遍地開花。大模型作為人工智能技術的重要組成部分,可以在各個領域發(fā)揮巨大的作用。但AI大模型也存在一些問題和挑戰(zhàn)。由于AI大模型的復雜性,可解釋性(表示模型能夠使用人類可認知的說法進行解釋和呈現(xiàn))有可能相對較低,會給人類帶來一定的困惑和不確定性。此外,由于AI大模型的使用涉及隱私和安全等問題,需要加強相關的法律法規(guī)和管理措施。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。