文|偲睿洞察 經(jīng)緯
編輯|孫越
“冬天到了,春天還會(huì)遠(yuǎn)嗎?”
深陷資本寒冬的自動(dòng)駕駛業(yè)內(nèi)近期可謂是“冰火兩重天”,重量級(jí)的利好與利空頻出。
2022年,由于自動(dòng)駕駛“長尾問題”難以解決導(dǎo)致應(yīng)用場(chǎng)景受限、進(jìn)而導(dǎo)致商業(yè)落地困難。投資人失去興趣,融資大幅縮水。據(jù)公開資料統(tǒng)計(jì),披露的融資額度由2021年的1591.9億元銳減至205億元,直接縮減至原先的13%,行業(yè)進(jìn)入寒冬。
投資資金一旦停滯不前,人員必然頻繁流動(dòng):據(jù)鈦媒體App統(tǒng)計(jì),僅2023年上半年,自動(dòng)駕駛相關(guān)的高層人員離職事件就高達(dá)16起,其中不乏曾被資本捧在手心里的企業(yè)。
在愈發(fā)寒冷的2023,如日中天的大模型,憑借解決“長尾問題”以及引發(fā)科技奇點(diǎn)的可能,如“冬天里的一把火”,照亮了行業(yè)的方向。
此外,大模型的熱度也越來越高,在汽車領(lǐng)域,已經(jīng)入場(chǎng)的企業(yè)紛紛引入大模型,專職大模型的企業(yè)也在場(chǎng)外摩拳擦掌:
7月21日,整合了盤古大模型的華為云正式發(fā)布自動(dòng)駕駛開發(fā)平臺(tái);緊接著,商湯便宣布其“商湯日日新SenseNova”大模型體系已經(jīng)形成產(chǎn)業(yè)應(yīng)用實(shí)踐,包括商湯絕影最新打造的智能座艙產(chǎn)品和車路云協(xié)同交通體系等。
現(xiàn)實(shí)是,大模型來了之后,自動(dòng)駕駛行業(yè)僅僅是完成從寒冬到暖冬的轉(zhuǎn)變。
感知決策型大模型本身的成本問題、硬件要求,以及數(shù)算中心網(wǎng)絡(luò)通訊問題都會(huì)影響其性能的發(fā)揮。
換言之,加載大模型后成本直線上升,即使有大模型的加持,自動(dòng)駕駛依然經(jīng)濟(jì)性有限。
本文試圖探究,在大模型降臨之后,自動(dòng)駕駛為何還是迎來不了自己的春天?
PART-01 “三九”未過,自動(dòng)駕駛寒冬依舊
沒有大模型之前,自動(dòng)駕駛行業(yè)可謂是一念天堂,一念地獄。
(自動(dòng)駕駛等級(jí)劃分,圖源:千際投行)
自動(dòng)駕駛技術(shù)按自動(dòng)化程度可以分為L0至L5共六個(gè)等級(jí)。其中L0至L2級(jí)可以統(tǒng)稱為“輔助駕駛”。
L3級(jí)別因?yàn)椴辉傩枰{駛員隨時(shí)“手腳待命”,汽車本身擁有了環(huán)境感知與自主決策的能力,成為了自動(dòng)駕駛的第一道分水嶺。
L4級(jí)別自動(dòng)駕駛則可以做到真正的“無人駕駛”,不再強(qiáng)制需要人的介入。L5級(jí)別則完全不需要人的介入,也沒有地域限制,甚至不會(huì)有方向盤等現(xiàn)今常見的汽車操控部件。
百事利為先,自動(dòng)駕駛最本質(zhì)的盈利邏輯就是省掉操作員的人工成本。
自動(dòng)駕駛技術(shù)除了搭載在汽車上作為車商的技術(shù)附加直接銷售外,主流的商業(yè)落地途徑主要有這幾條:物流、環(huán)衛(wèi)、礦山/港口等工業(yè)場(chǎng)景,以及無人出租車(Robotaxi)。
其中應(yīng)用場(chǎng)景最廣,最具商業(yè)價(jià)值的是Robotaxi。知名華爾街基金經(jīng)理木頭姐Cathie Wood在今年4月接受CNBC采訪時(shí)宣稱:至2030年,Robotaxi可創(chuàng)造8至10萬億美元的收入。
Robotaxi的商業(yè)前景引得各方紛紛布局。首先是一波政策“加持”,包括但不限于2022年4月1日發(fā)布的《北京市智能網(wǎng)聯(lián)汽車政策先行區(qū)乘用車無人化道路測(cè)試與示范應(yīng)用管理實(shí)施細(xì)則》,開啟了國內(nèi)乘用車無人化運(yùn)營試點(diǎn)。
有了北京的先例,其他地區(qū)地方政府也在紛紛跟進(jìn)。
2022年6月,深圳發(fā)布《深圳經(jīng)濟(jì)特區(qū)智能網(wǎng)聯(lián)汽車管理?xiàng)l例》;8月,上海發(fā)布的《上海市加快智能網(wǎng)聯(lián)汽車創(chuàng)新發(fā)展實(shí)施方案》提到,到2025年,初步建成國內(nèi)領(lǐng)先的智能網(wǎng)聯(lián)車創(chuàng)新發(fā)展體系,具備高度自動(dòng)駕駛功能(L4 級(jí)及以上)在限定區(qū)域限定場(chǎng)景實(shí)現(xiàn)商業(yè)化應(yīng)用。
政府卯足力氣提供政策支持,企業(yè)故事不斷,資本再不進(jìn)場(chǎng),就晚了。2020年與2021年,自動(dòng)駕駛行業(yè)風(fēng)頭正盛,各方勢(shì)力紛紛進(jìn)場(chǎng),一時(shí)間企業(yè)拿融資拿到手軟。
2020年,自動(dòng)駕駛產(chǎn)業(yè)鏈廠商,紛紛迎來春天的第一場(chǎng)雨:小馬智行就曾獲得由豐田汽車與蔚來資本等資方投資的4.62億美元融資。同年5月和12月,滴滴和文遠(yuǎn)知行也相繼宣布完成5億美元融資和2億美元投資······
2021年,毫末智行、圖森未來、斑馬智行、地平線等廠商更受資本寵愛。而誰又能想到短短的一年,凜冬的冰雪,就降落到了自動(dòng)駕駛的春花之上。投資方態(tài)度180°大轉(zhuǎn)彎的癥結(jié)在于,真正意義上的“無人”即L4,很難實(shí)現(xiàn)。
接近千億的資本涌入賽道大大加速了各家企業(yè)的技術(shù)研發(fā)測(cè)試進(jìn)程。2021年Waymo路測(cè)里程達(dá)到410萬英里。同年,北京示范區(qū)自動(dòng)駕駛測(cè)試安全行駛近里程達(dá)400萬公里。
但是自動(dòng)駕駛行業(yè)的問題在也測(cè)試中逐漸顯露:無法真正的無人。
(Robotaxi上的安全員,圖源:小馬智行官方微信公眾號(hào))
即使是走在全國前列的北京亦莊示范區(qū),在L3、L4的正常運(yùn)行背后,被設(shè)置了重重關(guān)卡。
在2022年乃至2023年上半年的多次的試點(diǎn)中,基本要求每輛上路運(yùn)營的Robotaxi內(nèi)必須設(shè)有安全員,以確保自動(dòng)駕駛系統(tǒng)平穩(wěn)運(yùn)行,以及遇到突發(fā)狀況時(shí)應(yīng)急干預(yù)。
而這種為L3級(jí)別自動(dòng)駕駛設(shè)置的安全員門檻極高。其工作性質(zhì)決定了安全員不僅要駕駛技術(shù)一流,可以應(yīng)付各種緊急情況,而且要對(duì)自動(dòng)駕駛系統(tǒng)有一定了解。因此培養(yǎng)安全員的周期較普通出租車司機(jī)更長,成本更高,不具備經(jīng)濟(jì)性。
雖然在2023年7月7日,北京市高級(jí)別自動(dòng)駕駛示范區(qū)工作辦公室正式宣布,亦莊開始“車內(nèi)無人”商業(yè)化試點(diǎn),Robotaxi終于可實(shí)現(xiàn)車輛完全自主駕駛,達(dá)到了L4級(jí)自動(dòng)駕駛的標(biāo)準(zhǔn),但是運(yùn)營中心仍需配備后臺(tái)工程師隨時(shí)監(jiān)控。
Robotaxi能在亦莊運(yùn)行,因?yàn)樵诨A(chǔ)設(shè)施上亦莊下足了功夫。亦莊在建設(shè)早期就把高精度的數(shù)據(jù)地圖列為重點(diǎn)建設(shè)項(xiàng)目之一,高度數(shù)字化的基礎(chǔ)設(shè)施成為了后來Robotaxi的運(yùn)營保障。但擁有類似亦莊水平的,高精度,高度數(shù)字化地圖的地區(qū)寥寥無幾?!懊搱D”,即不依賴高精度地圖運(yùn)行的L4自動(dòng)駕駛商業(yè),落地遙遙無期。也就是說,如今的L4,既需要“后臺(tái)有人”,又要在亦莊這一“避魔圈”內(nèi)運(yùn)行。
眼見此番不“自由”的自動(dòng)駕駛,資本紛紛進(jìn)入了“賢者時(shí)間”,開始撤資。一時(shí)間眾多自動(dòng)駕駛企業(yè)或資金鏈斷裂,倒閉關(guān)停,或節(jié)衣縮食,難以為繼。
據(jù)偲睿洞察不完全統(tǒng)計(jì),至2022年底,在納斯達(dá)克上市的十余家家自動(dòng)駕駛初創(chuàng)公司,在上市后的平均跌幅超過 80%。
更好落地的無人駕駛卡車(Robotruck)賽道上也同樣“尸橫遍野”。
相比于Robotaxi多涉及的城市場(chǎng)景,Robotruck,尤其是干線運(yùn)輸多涉及高速場(chǎng)景,道路、路徑狀況較為單一,落地難度上要遠(yuǎn)小于Robotaxi。但即便如此,落地依然困難。
美國Robotruck公司Embark股價(jià)由巔峰時(shí)期的209美元跌至如今的3美元左右。曾官宣在亞利桑那州完成全球首次開放道路全無人駕駛重卡測(cè)試,有著“自動(dòng)駕駛第一股”之稱的圖森未來股價(jià)也由最高時(shí)期的接近80美元跌至現(xiàn)今的2美元上下。
歸根結(jié)底,落地難是因?yàn)殡y以解決自動(dòng)駕駛大敵“長尾問題”:少部分場(chǎng)景一直未能攻克。
PART-02 “長尾”難“醫(yī)”,大模型真乃良藥
前谷歌無人車項(xiàng)目CEO約翰·克拉夫西奇曾表示,谷歌無人車技術(shù)已經(jīng)接近于“走進(jìn)大眾生活”。但是至今Waymo商業(yè)化運(yùn)營仍困難重重。不僅是Waymo,市場(chǎng)上諸多商家自動(dòng)駕駛項(xiàng)目都處在“成百步者半九十”的狀態(tài),其原因就是“長尾問題”。
所謂“長尾問題”,其主要表現(xiàn)形式是,自動(dòng)駕駛測(cè)試過程中的場(chǎng)景模擬始終無法覆蓋現(xiàn)實(shí)情況。
低頻率、種類極多、且對(duì)行車安全造成嚴(yán)重影響的“Corner Case”是橫亙?cè)谧詣?dòng)駕駛技術(shù)門前的一道坎。現(xiàn)階段各車企的解決方法是“數(shù)量取勝”,即通過大量測(cè)試,盡可能多的模擬各種情況,以觀察并矯正自家駕駛系統(tǒng)的行為。
但實(shí)驗(yàn)室模擬總有這樣或那樣的問題。卡耐基梅隆大學(xué)機(jī)器人學(xué)習(xí)實(shí)驗(yàn)室主任、被譽(yù)為“自動(dòng)駕駛之父”的Sebastian Thrun曾多次發(fā)聲:實(shí)驗(yàn)室實(shí)驗(yàn)和真實(shí)應(yīng)用場(chǎng)景認(rèn)知差異巨大。實(shí)驗(yàn)室環(huán)境只能盡量模擬真實(shí)環(huán)境,卻不能完全模擬真實(shí)場(chǎng)景。因此得出的數(shù)據(jù)和模型的精準(zhǔn)度和可信度,在現(xiàn)實(shí)環(huán)境中可能毫無價(jià)值,即使是滿足了100%準(zhǔn)確率的實(shí)驗(yàn),在現(xiàn)實(shí)生活中也不一定可行。
即便是實(shí)車在真實(shí)道路上的訓(xùn)練和標(biāo)定,大多數(shù)的數(shù)據(jù)的定位都是單調(diào)重復(fù),對(duì)策略優(yōu)化意義不大。在某個(gè)城市進(jìn)行了自動(dòng)駕駛的成功試驗(yàn),也并不意味著經(jīng)驗(yàn)可以在另一個(gè)城市成功復(fù)制。目前模擬測(cè)試還是公路測(cè)試,都是“窮舉”打法,很難不陷入越努力越心酸的困局。
大模型,給這個(gè)已在寒冬中匍匐一年的自動(dòng)駕駛,遞了一把火。
正如阿里前CEO張勇在今年4月11日阿里云峰會(huì)上說:“在AI時(shí)代,所有產(chǎn)品都值得用大模型重做一次”。大模型的出現(xiàn)給了自動(dòng)駕駛企業(yè)解決“長尾問題”希望:
當(dāng)模型參數(shù)量達(dá)到了一定程度,超過某個(gè)臨界值之后,“涌現(xiàn)”現(xiàn)象就會(huì)出現(xiàn):模型的性能會(huì)大大超越預(yù)期。雖然為什么出現(xiàn)這種現(xiàn)象現(xiàn)階段尚無公論,但這種“量變”到“質(zhì)變”的過程,為攻克號(hào)稱“最后1%”的“長尾問題”帶來了曙光。
(自動(dòng)駕駛系統(tǒng)的組成部分,圖源:安信證券)
自動(dòng)駕駛系統(tǒng)主要可以拆解為三個(gè)層次:感知層、決策層、控制層。現(xiàn)階段比較清晰的大模型應(yīng)用的方向是感知層。
大模型如何應(yīng)用在感知層面?目前的主流思路是提升數(shù)據(jù)閉環(huán)。所謂數(shù)據(jù)閉環(huán),即不斷將高價(jià)值數(shù)據(jù)從自動(dòng)駕駛系統(tǒng)獲取的原始數(shù)據(jù)中提取出來后,輸送給算法做訓(xùn)練。整個(gè)過程包括對(duì)來自傳感器數(shù)據(jù)進(jìn)行特征標(biāo)注、對(duì)“長尾數(shù)據(jù)”特征的挖掘、提取特征后“舉一反三”萃取其他數(shù)據(jù)、利用這些“長尾數(shù)據(jù)”進(jìn)一步訓(xùn)練算法。大模型的出現(xiàn)可以大大提升數(shù)據(jù)閉環(huán),加速算法完善進(jìn)度,以更好地解決各種“Corner Case”。
擁有處理海量數(shù)據(jù)的能力,大模型便可以在測(cè)試自動(dòng)駕駛系統(tǒng)上限、重建自動(dòng)駕駛場(chǎng)景上發(fā)光發(fā)熱,甚至可能搭載在車輛上進(jìn)行合并檢測(cè)小模型、檢測(cè)道路物體、進(jìn)行車道拓?fù)漕A(yù)測(cè)等。
由于大模型卓越的性能,在理想汽車大模型MindGPT發(fā)布之后,理想汽車董事長李想就表示,先前一年要做大概1000萬幀的自動(dòng)駕駛圖像的人工標(biāo)定,外包公司價(jià)格大概6元到8元錢一張,一年成本接近一億元。
而當(dāng)使用大模型之后,降本將立竿見影:通過訓(xùn)練的方式進(jìn)行自動(dòng)化標(biāo)定,過去需要用一年做的事情基本上3個(gè)小時(shí)就能完成,效率是人的1000倍?!比绱恕吧衿?自然引得各方爭(zhēng)搶。
7月21日,華為云公有云業(yè)務(wù)部總裁高江海在“華為云智能駕駛創(chuàng)新峰會(huì)&烏蘭察布汽車專區(qū)發(fā)布會(huì)”上宣布,華為云自動(dòng)駕駛開發(fā)平臺(tái)正式發(fā)布。
據(jù)悉,平臺(tái)將基于盤古大模型和ModelArts AI開發(fā)生產(chǎn)線,提供數(shù)據(jù)生成、自動(dòng)標(biāo)注、模型訓(xùn)練、數(shù)據(jù)閉環(huán)等一系列能力,幫助車企和商用車企業(yè)加速自動(dòng)駕駛算法的開發(fā)驗(yàn)證和優(yōu)化迭代?,F(xiàn)如今已在礦用卡車、港口ART、專線物流重卡等商用車場(chǎng)景中應(yīng)用。
7月25日,光輪智能透露近期完成了“天使+”輪融資。光輪智能CEO,前蔚來汽車高管謝晨表示,光輪智能將在仿真的基礎(chǔ)上融合生成式 AI,以一小部分真實(shí)數(shù)據(jù)為藍(lán)本,通過生成式 AI 技術(shù)來放大數(shù)據(jù)量級(jí),并基于自研的 " 端到端真實(shí)性評(píng)測(cè)算法 " 保證數(shù)據(jù)質(zhì)量和效能,生成高信息增量的、用于算法訓(xùn)練的數(shù)據(jù)。從技術(shù)角度來看,大模型確實(shí)是“神器”。然而,大模型真的是自動(dòng)駕駛的“萬靈藥”嗎?
PART-03 和璧隋珠,新技術(shù)難入尋常家
大模型,不言自明,其最大的特點(diǎn)就是“大”。龐大的數(shù)據(jù)體量以及算力要求為其應(yīng)用帶來了不小的挑戰(zhàn)。
如果將大模型“塞進(jìn)車?yán)铩?,首?dāng)其沖的便是硬件成本問題。大模型的規(guī)模和復(fù)雜度也在不斷提高,對(duì)硬件設(shè)備的要求也越來越高。
大模型需要大量的計(jì)算資源來訓(xùn)練和運(yùn)行。傳統(tǒng)的CPU、GPU等硬件設(shè)備已經(jīng)無法滿足這種需求。專業(yè)為大模型計(jì)算設(shè)計(jì)定制的加速器芯片,如NVIDIA的A100、TPU等將成為硬需求,現(xiàn)實(shí)是,現(xiàn)如今僅有一些大廠有A100的存貨。
雪上加霜的是,大模型還需要大容量的存儲(chǔ)設(shè)備來存儲(chǔ)訓(xùn)練數(shù)據(jù)和模型參數(shù)。由于大模型的數(shù)據(jù)量非常龐大,動(dòng)輒百億級(jí)別數(shù)據(jù)需要使用高速的SSD硬盤或者NVMe固態(tài)硬盤來提高數(shù)據(jù)的讀寫速度······
硬件的問題將不可避免帶來成本的上升。雖然大模型的推廣可以減少如激光雷達(dá)等感受器的數(shù)量來降低成本,但是由于感受器需要留足安全冗余,大模型本身規(guī)模就已經(jīng)龐大且指數(shù)級(jí)別的上升指日可待,故,硬件成本將在很長一段時(shí)間內(nèi)成為難以回避的問題。
那么,我們換一個(gè)思路,如果把大模型從車?yán)锇岢鰜砬闆r可行嗎?
將大模型所需數(shù)據(jù)集中儲(chǔ)存,無疑會(huì)攤薄使用者成本。運(yùn)營商擁有更大的財(cái)力,可以采購更先進(jìn)的存儲(chǔ)、傳輸設(shè)備。但自動(dòng)駕駛大模型與普通用于AIGC的大模型之間最大的區(qū)別就是,對(duì)鏈接穩(wěn)定性以及數(shù)據(jù)傳輸速度的要求極為嚴(yán)苛。
作為大型移動(dòng)設(shè)備,車量鏈接數(shù)據(jù)中心唯一的途徑就是無線網(wǎng)絡(luò)。汽車行駛中,由于秒級(jí)別的延遲造成無可挽回事故的案例,比比皆是。
對(duì)硬件性能、成本、以及對(duì)數(shù)據(jù)傳輸?shù)姆€(wěn)定性與速度的嚴(yán)苛要求下,“大模型上車”的時(shí)間點(diǎn)極為遙遠(yuǎn)。
那么,如果把大模型作為解決“長尾問題”的后臺(tái)軟件開發(fā)工具是否可行?
現(xiàn)實(shí)是,大模型的訓(xùn)練成本居高不下,國盛證券基于參數(shù)數(shù)量和token數(shù)量估算,GPT-3訓(xùn)練一次的成本約為140萬美元;
(GPT-3訓(xùn)練成本估算,圖源:國盛證券研究所)
對(duì)于一些更大的LLM模型采用同樣的計(jì)算公式,訓(xùn)練成本介于200萬美元至1200萬美元之間。
(GPT-3以及其他更大LLM模型訓(xùn)練成本估算,圖源:國盛證券研究所)
據(jù)業(yè)內(nèi)估算,現(xiàn)階段已經(jīng)在使用的Transformer大模型量變引起質(zhì)變需要1億公里的里程數(shù)據(jù)。Transformer相比上一代CNN模型需要更大量的數(shù)據(jù)來訓(xùn)練模型。
成本問題,束縛了大模型大展拳腳的空間。
正如錢鐘書在《圍城》中寫道,“好比冬季每天的氣候罷,你沒法把今天的溫度加在昨天的上面,好等明天積成個(gè)暖和的春日?!?/p>
在成本、硬件等一系列關(guān)鍵性問題得不到解決的情況下,昨日的自動(dòng)駕駛加上今日的大模型,很難換來一個(gè)溫暖的春天。
即使某些企業(yè)短時(shí)間內(nèi)突破了技術(shù)瓶頸,在數(shù)據(jù)安全、法律法規(guī)等行政性問題尚未妥善解決的情況下,L3及以上自動(dòng)駕駛也很難“面朝大海,春暖花開”。