正在閱讀:

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

掃一掃下載界面新聞APP

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

多巨頭混戰(zhàn)大模型,智能汽車成為新戰(zhàn)場。

文|智駕網(wǎng) 黃華丹

ChatGPT走紅后,大模型的熱度持續(xù)不減。

尤其在國內(nèi),更是出現(xiàn)諸神混戰(zhàn)的場面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進軍大模型,發(fā)布中國版ChatGPT。

有機構統(tǒng)計,今年以來,宣布進入大模型創(chuàng)業(yè)的公司,從互聯(lián)網(wǎng)巨頭、科技公司,到科研院所和創(chuàng)業(yè)明星大佬,林林總總超過30余家。

而國外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購1萬張GPU,創(chuàng)立X.AI,準備開發(fā)TruthGPT。

行業(yè)熱火,但,開發(fā)大模型的成本如何?商業(yè)模式又如何?對于一腔熱情的入局者們,成本與前景,也是不得不面對的問題。

如果無法實現(xiàn)商業(yè)落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。

有觀點認為,通用型大模型參數(shù)量大,訓練成本和使用成本高啟,并不是一般創(chuàng)業(yè)者所能承受的。而垂直領域的大模型相對成本較低,或許會成為更容易實現(xiàn)商業(yè)落地的領域。

而正在向智能化發(fā)展的汽車,就是一個很好的場景。

4月18日,上海車展首日,阿里巴巴新能源汽車發(fā)布會上,阿里集團副總裁、斑馬智行CEO張春暉在發(fā)言時表示,大模型開啟AI時代,會重塑千行百業(yè),而新汽車是大模型最大的交互應用場景,智能汽車操作系統(tǒng)也會被重塑。

同時,張春暉宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關技術將率先在智己汽車上落地。

4月11日,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇公布阿里人工智能大語言模型“通義千問”,并宣布,未來阿里所有的產(chǎn)品都將接入“通義千問”。

阿里發(fā)布通義千問并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢。

此前,百度發(fā)布文心一言后,便有多家車企宣布將接入文心一言。

據(jù)不完全統(tǒng)計,目前已經(jīng)宣布將接入文心一言的車企包括長安、集度、吉利、嵐圖、紅旗、長城、東風日產(chǎn)、愛馳、零跑、海馬等。長安逸達成為首搭文心一言的車型。

據(jù)路透社報道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。

而毫末智行也在本月發(fā)布了首個基于大模型的自動駕駛算法DriveGPT。

大模型熱潮已來,行業(yè)會走向何方?而對汽車業(yè)來說,大模型能力的發(fā)展又將為汽車帶來怎樣的變化?

01 僅中國就可能超過50家

根據(jù)公開信息,目前已經(jīng)入局大模型的互聯(lián)網(wǎng)巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節(jié)跳動、360等,而以美團聯(lián)合創(chuàng)始人王慧文、王興,搜狗創(chuàng)始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團隊的,熱鬧非凡。

據(jù)民生證券不完全統(tǒng)計,目前國內(nèi)已發(fā)布超過30個大模型,而據(jù)出門問問創(chuàng)始人、CEO李志飛預計,中國未來1-2年會看到50家以上公司做大模型。

不久前馬斯克還在批判濫用GPT背后的大模型會引發(fā)人類社會發(fā)展危機,轉身便也躬身入場。

但馬斯克等人呼吁暫停時擔憂的AI監(jiān)管問題,確實也尚未在全球形成一致的共識。

不過,從目前來看,入局者首先要擔心的,恐怕并不是安全問題,而是是否能夠找到商業(yè)落地方向,并以可靠的技術實現(xiàn)落地。

李彥宏認為,中國創(chuàng)業(yè)公司中基本不會出現(xiàn)下一個OpenAI。OpenAI誕生是因為美國大廠不看好這個方向,但現(xiàn)在中國的大廠都看好AI大模型,都在做這個方向。創(chuàng)業(yè)公司重新再做一個ChatGPT沒有多大意義。李彥宏認為基于大語言模型開發(fā)應用機會很大,沒有必要再重新發(fā)明一遍輪子。

大量創(chuàng)業(yè)者同時涌入,一定意義上其實是對資源的浪費。

而且,不得不提的是,開發(fā)和訓練大模型的成本很高,并不是一般創(chuàng)業(yè)團隊能夠承擔的。

據(jù)浙江大學人工智能研究所所長吳飛介紹,ChatGPT的訓練門檻是1萬張英偉達A100 GPU,約人民幣10億元,模型訓練算力開銷是每秒運算一千萬億次,需運行3640天。

而國盛證券計算機分析師劉高暢和楊然也在《ChatGPT需要多少算力》報告中估算,GPT-3訓練一次的成本約為140萬美元,對于一些更大的大語言模型,訓練成本介于200萬美元至1200萬美元之間。

除了算力,訓練大模型還需要服務器、數(shù)據(jù)甚至電費等多方面的支持。

有機構估算,假如平均每天約有1300萬用戶訪問ChatGPT,就需要3萬多片英偉達A100 GPU,初期投入成本約為8億美元,每日還需約5萬美元的電費。

就OpenAI的投入來看,數(shù)據(jù)顯示,微軟已向其投資累計130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發(fā)支持。

而根據(jù)PitchBook的數(shù)據(jù),OpenAI今年營收將達到2億美元,比2022年增長150%,2024 年將達到10億美元。

這是一門昂貴的生意。

在商業(yè)化可能上,OpenAI的GPT可以說走在前列。B端和C端均實現(xiàn)了收費。但對大部分后來者而言,要實現(xiàn)如OpenAI的C端規(guī)?;静豢赡?。在B端尋求落地才是更可行的方案。

而智能汽車,就是目前一個可行的B端場景。

02 在汽車領域應用相對容易實現(xiàn)

一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領域的應用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大,因此是更容易實現(xiàn)應用的領域。

目前來看,大模型在車上的應用場景主要是在智能交互和智能駕駛上。

張春暉在阿里巴巴新能源發(fā)布會上表示,雖然語音交互已經(jīng)發(fā)展了多年,但目前車載語音助手整體水平還停留在可能叫不醒、響應慢、總出錯、聽不懂、不好用的階段。

而大模型可以通過深度學習等技術,訓練出更加準確的語義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖。并讓車載語音實現(xiàn)更深層次的個性化和自然擬人的交互。

例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語義識別,理解用戶的環(huán)境和情緒狀態(tài),并以此推薦相應的音樂、電影、電子書等內(nèi)容。

而基于AI大模型對語音及圖像的理解能力,座艙內(nèi)的交互方式能夠變得更加多元。語音之外,用戶還能夠以手勢、眼神等方式,創(chuàng)造出更加自然、便捷的交互方式。

此外,大模型還可以訓練出預測用戶行為的模型,預測用戶是否會變道或剎車等,提前做出相應的駕駛協(xié)助。

上海車展期間,商湯也展示了其最新的座艙應用。其全新推出的大模型體系“日日新Sensenova”擁有語言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗。

據(jù)商湯科技介紹,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內(nèi)容,同時,它還支持郵件模式,可自動提煉郵件關鍵信息,幫助用戶節(jié)省閱讀時間?!懊氘婼enseMirage”文生圖創(chuàng)作平臺則借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。

Elektrobit中國區(qū)總經(jīng)理鄒露君則認為,人機交互應該是受影響最大的領域,大模型對人機交互會產(chǎn)生顛覆性的影響。

就座艙內(nèi)的交互而言,對大模型上車的期待絕不會只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。

而在智能駕駛方面,地平線CTO黃暢在接受采訪時曾表示,GPT在自動駕駛場景中最先應用的很可能是環(huán)境模型的預測和交互式規(guī)控、交互式規(guī)劃。

黃暢認為,這個場景不需要特別大規(guī)模的參數(shù)模型,因為它不是一個完整的端到端,尤其因為它更關注于預測和規(guī)劃,不用花太多精力在感知這個層面上,因此很可能在百TOPS級別的算力平臺上就能應用,在三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個端到端的閉環(huán)做出來,黃暢認為需要一個更大規(guī)模的參數(shù)模型,大概需要五到十年的時間。

毫末智行發(fā)布的DriveGPT雪湖·海若則是使用GPT模型和技術邏輯的自動駕駛算法模型。作為適用于自動駕駛訓練的大模型,DriveGPT雪湖·海若的能力是:

在預訓練階段引入量產(chǎn)智能駕駛數(shù)據(jù),訓練出一個初始模型。然后引入量產(chǎn)數(shù)據(jù)中的用戶接管片段,訓練反饋模型。通過強化學習,使用反饋模型不斷優(yōu)化迭代初始模型。

其基本邏輯是:

1、按概率生成多個場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發(fā)生的一種實際情況。

2、在所有場景序列都產(chǎn)生的情況下,把場景中最關注的自車行為軌跡給量化出來,也就是生成場景的同時,便會產(chǎn)生自車未來的軌跡信息。

3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場景序列、軌跡的同時,輸出整個決策邏輯鏈。

也就是說,利用DriveGPT雪湖·海若,在一個統(tǒng)一的生成式框架下,將規(guī)劃、決策與推理等多個任務全部完成。

有業(yè)內(nèi)人士認為,通用型大模型的發(fā)展,將會使其成為一種如基礎設施般的存在。而對智能汽車來說,大模型能力對車輛智能化的推動也將上升一個量級。

不過,當然,前提是如今倉促進場的各方能有足夠的投入將技術打磨成熟。

此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個月,引發(fā)一波爭議。王小川則認為有三年的差距。

文心一言與通義千問已開啟內(nèi)測,而大部分項目仍處在公布階段。顯然,國內(nèi)大模型行業(yè)要走的路,還有很遠。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型混戰(zhàn)上海車展,智能汽車能否撐起這門昂貴的生意?

多巨頭混戰(zhàn)大模型,智能汽車成為新戰(zhàn)場。

文|智駕網(wǎng) 黃華丹

ChatGPT走紅后,大模型的熱度持續(xù)不減。

尤其在國內(nèi),更是出現(xiàn)諸神混戰(zhàn)的場面。從3月到4月,包括百度、阿里巴巴、騰訊、知乎等多家巨頭官宣進軍大模型,發(fā)布中國版ChatGPT。

有機構統(tǒng)計,今年以來,宣布進入大模型創(chuàng)業(yè)的公司,從互聯(lián)網(wǎng)巨頭、科技公司,到科研院所和創(chuàng)業(yè)明星大佬,林林總總超過30余家。

而國外,除了微軟、谷歌等巨頭,不久前馬斯克也被曝出緊急搶購1萬張GPU,創(chuàng)立X.AI,準備開發(fā)TruthGPT。

行業(yè)熱火,但,開發(fā)大模型的成本如何?商業(yè)模式又如何?對于一腔熱情的入局者們,成本與前景,也是不得不面對的問題。

如果無法實現(xiàn)商業(yè)落地,如今熱鬧的大模型,也很可能步元宇宙的后塵。

有觀點認為,通用型大模型參數(shù)量大,訓練成本和使用成本高啟,并不是一般創(chuàng)業(yè)者所能承受的。而垂直領域的大模型相對成本較低,或許會成為更容易實現(xiàn)商業(yè)落地的領域。

而正在向智能化發(fā)展的汽車,就是一個很好的場景。

4月18日,上海車展首日,阿里巴巴新能源汽車發(fā)布會上,阿里集團副總裁、斑馬智行CEO張春暉在發(fā)言時表示,大模型開啟AI時代,會重塑千行百業(yè),而新汽車是大模型最大的交互應用場景,智能汽車操作系統(tǒng)也會被重塑。

同時,張春暉宣布AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進行測試,斑馬智行第三代汽車AI能力體系Banma Co-Pilot首次亮相,相關技術將率先在智己汽車上落地。

4月11日,阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇公布阿里人工智能大語言模型“通義千問”,并宣布,未來阿里所有的產(chǎn)品都將接入“通義千問”。

阿里發(fā)布通義千問并不算早,斑馬宣布大模型上車也不是首例。但這依然代表了一種趨勢。

此前,百度發(fā)布文心一言后,便有多家車企宣布將接入文心一言。

據(jù)不完全統(tǒng)計,目前已經(jīng)宣布將接入文心一言的車企包括長安、集度、吉利、嵐圖、紅旗、長城、東風日產(chǎn)、愛馳、零跑、海馬等。長安逸達成為首搭文心一言的車型。

據(jù)路透社報道,此前通用汽車一位高管也曾表示正在探索ChatGPT的用途,作為其與微軟公司更廣泛合作的一部分。

而毫末智行也在本月發(fā)布了首個基于大模型的自動駕駛算法DriveGPT。

大模型熱潮已來,行業(yè)會走向何方?而對汽車業(yè)來說,大模型能力的發(fā)展又將為汽車帶來怎樣的變化?

01 僅中國就可能超過50家

根據(jù)公開信息,目前已經(jīng)入局大模型的互聯(lián)網(wǎng)巨頭包括百度、騰訊、京東、阿里巴巴、華為、字節(jié)跳動、360等,而以美團聯(lián)合創(chuàng)始人王慧文、王興,搜狗創(chuàng)始人王小川等為代表的大佬們也熱情高漲,“帶資入組”的,融資組建團隊的,熱鬧非凡。

據(jù)民生證券不完全統(tǒng)計,目前國內(nèi)已發(fā)布超過30個大模型,而據(jù)出門問問創(chuàng)始人、CEO李志飛預計,中國未來1-2年會看到50家以上公司做大模型。

不久前馬斯克還在批判濫用GPT背后的大模型會引發(fā)人類社會發(fā)展危機,轉身便也躬身入場。

但馬斯克等人呼吁暫停時擔憂的AI監(jiān)管問題,確實也尚未在全球形成一致的共識。

不過,從目前來看,入局者首先要擔心的,恐怕并不是安全問題,而是是否能夠找到商業(yè)落地方向,并以可靠的技術實現(xiàn)落地。

李彥宏認為,中國創(chuàng)業(yè)公司中基本不會出現(xiàn)下一個OpenAI。OpenAI誕生是因為美國大廠不看好這個方向,但現(xiàn)在中國的大廠都看好AI大模型,都在做這個方向。創(chuàng)業(yè)公司重新再做一個ChatGPT沒有多大意義。李彥宏認為基于大語言模型開發(fā)應用機會很大,沒有必要再重新發(fā)明一遍輪子。

大量創(chuàng)業(yè)者同時涌入,一定意義上其實是對資源的浪費。

而且,不得不提的是,開發(fā)和訓練大模型的成本很高,并不是一般創(chuàng)業(yè)團隊能夠承擔的。

據(jù)浙江大學人工智能研究所所長吳飛介紹,ChatGPT的訓練門檻是1萬張英偉達A100 GPU,約人民幣10億元,模型訓練算力開銷是每秒運算一千萬億次,需運行3640天。

而國盛證券計算機分析師劉高暢和楊然也在《ChatGPT需要多少算力》報告中估算,GPT-3訓練一次的成本約為140萬美元,對于一些更大的大語言模型,訓練成本介于200萬美元至1200萬美元之間。

除了算力,訓練大模型還需要服務器、數(shù)據(jù)甚至電費等多方面的支持。

有機構估算,假如平均每天約有1300萬用戶訪問ChatGPT,就需要3萬多片英偉達A100 GPU,初期投入成本約為8億美元,每日還需約5萬美元的電費。

就OpenAI的投入來看,數(shù)據(jù)顯示,微軟已向其投資累計130億美元,使其估值近300億美元,此外,微軟還向OpenAI提供算力和研發(fā)支持。

而根據(jù)PitchBook的數(shù)據(jù),OpenAI今年營收將達到2億美元,比2022年增長150%,2024 年將達到10億美元。

這是一門昂貴的生意。

在商業(yè)化可能上,OpenAI的GPT可以說走在前列。B端和C端均實現(xiàn)了收費。但對大部分后來者而言,要實現(xiàn)如OpenAI的C端規(guī)模基本不可能。在B端尋求落地才是更可行的方案。

而智能汽車,就是目前一個可行的B端場景。

02 在汽車領域應用相對容易實現(xiàn)

一方面,汽車有著明確的交互需求,而且相較于通用型大模型,垂直領域的應用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大,因此是更容易實現(xiàn)應用的領域。

目前來看,大模型在車上的應用場景主要是在智能交互和智能駕駛上。

張春暉在阿里巴巴新能源發(fā)布會上表示,雖然語音交互已經(jīng)發(fā)展了多年,但目前車載語音助手整體水平還停留在可能叫不醒、響應慢、總出錯、聽不懂、不好用的階段。

而大模型可以通過深度學習等技術,訓練出更加準確的語義和意圖理解模型,幫助車載系統(tǒng)更好地理解用戶的指令和意圖。并讓車載語音實現(xiàn)更深層次的個性化和自然擬人的交互。

例如,在大模型賦能下,車載助手將具備真正的智能化水平,更好地了解用戶的喜好,根據(jù)語義識別,理解用戶的環(huán)境和情緒狀態(tài),并以此推薦相應的音樂、電影、電子書等內(nèi)容。

而基于AI大模型對語音及圖像的理解能力,座艙內(nèi)的交互方式能夠變得更加多元。語音之外,用戶還能夠以手勢、眼神等方式,創(chuàng)造出更加自然、便捷的交互方式。

此外,大模型還可以訓練出預測用戶行為的模型,預測用戶是否會變道或剎車等,提前做出相應的駕駛協(xié)助。

上海車展期間,商湯也展示了其最新的座艙應用。其全新推出的大模型體系“日日新Sensenova”擁有語言大模型以及數(shù)字人等多種生成式AI能力,可為車艙提供更智能和人性化的多模態(tài)人車交互體驗。

據(jù)商湯科技介紹,商湯語言大模型“商量SenseChat”會與嘉賓交流互動,并推薦個性化體驗內(nèi)容,同時,它還支持郵件模式,可自動提煉郵件關鍵信息,幫助用戶節(jié)省閱讀時間。“秒畫SenseMirage”文生圖創(chuàng)作平臺則借助商湯AIGC模型能力自動為嘉賓生成各種風格的照片。

Elektrobit中國區(qū)總經(jīng)理鄒露君則認為,人機交互應該是受影響最大的領域,大模型對人機交互會產(chǎn)生顛覆性的影響。

就座艙內(nèi)的交互而言,對大模型上車的期待絕不會只停留在可以為用戶提供更順暢的交流,以及提供生成圖片的能力。

而在智能駕駛方面,地平線CTO黃暢在接受采訪時曾表示,GPT在自動駕駛場景中最先應用的很可能是環(huán)境模型的預測和交互式規(guī)控、交互式規(guī)劃。

黃暢認為,這個場景不需要特別大規(guī)模的參數(shù)模型,因為它不是一個完整的端到端,尤其因為它更關注于預測和規(guī)劃,不用花太多精力在感知這個層面上,因此很可能在百TOPS級別的算力平臺上就能應用,在三到五年內(nèi)就可以初步上線。

而在完整的端到端緩解,從感知到定位地圖到規(guī)控,整個端到端的閉環(huán)做出來,黃暢認為需要一個更大規(guī)模的參數(shù)模型,大概需要五到十年的時間。

毫末智行發(fā)布的DriveGPT雪湖·海若則是使用GPT模型和技術邏輯的自動駕駛算法模型。作為適用于自動駕駛訓練的大模型,DriveGPT雪湖·海若的能力是:

在預訓練階段引入量產(chǎn)智能駕駛數(shù)據(jù),訓練出一個初始模型。然后引入量產(chǎn)數(shù)據(jù)中的用戶接管片段,訓練反饋模型。通過強化學習,使用反饋模型不斷優(yōu)化迭代初始模型。

其基本邏輯是:

1、按概率生成多個場景序列,每個場景都是一個全局的場景,每個場景序列都是未來有可能發(fā)生的一種實際情況。

2、在所有場景序列都產(chǎn)生的情況下,把場景中最關注的自車行為軌跡給量化出來,也就是生成場景的同時,便會產(chǎn)生自車未來的軌跡信息。

3、有了這段軌跡之后,DriveGPT雪湖·海若還能在生成場景序列、軌跡的同時,輸出整個決策邏輯鏈。

也就是說,利用DriveGPT雪湖·海若,在一個統(tǒng)一的生成式框架下,將規(guī)劃、決策與推理等多個任務全部完成。

有業(yè)內(nèi)人士認為,通用型大模型的發(fā)展,將會使其成為一種如基礎設施般的存在。而對智能汽車來說,大模型能力對車輛智能化的推動也將上升一個量級。

不過,當然,前提是如今倉促進場的各方能有足夠的投入將技術打磨成熟。

此前李彥宏曾表示文心一言與ChatGPT之間只差兩三個月,引發(fā)一波爭議。王小川則認為有三年的差距。

文心一言與通義千問已開啟內(nèi)測,而大部分項目仍處在公布階段。顯然,國內(nèi)大模型行業(yè)要走的路,還有很遠。

本文為轉載內(nèi)容,授權事宜請聯(lián)系原著作權人。