文|車東西 昊晗
編輯|曉寒
自動駕駛數據“上云”已成大勢所趨,那下一步是什么?
眼下,自動駕駛行業(yè)已經進入商業(yè)落地的下半場,路面上搭載各級別自動駕駛系統(tǒng)的車輛也是越來越多。
對于車企們來說,落地交付不僅是對其多年潛心研發(fā)的一個認可,更要面臨量產所帶來的龐大數據量的挑戰(zhàn),而當下僅憑新建機房顯然并不劃算,數據存儲“上云”也就成為不二之選。
但隨著自動駕駛行業(yè)越來越“卷”,車企對云的需求已不滿足于僅數據存儲本身,像是感知模型訓練、仿真測試、研發(fā)工具鏈等對智能汽車云的需求也是越來越旺。
所以在這個時間節(jié)點,自動駕駛數據“上云”已經可以算是最低要求,自動駕駛研發(fā)“入云”才是關鍵。
那么,車企們眼前對云最大的需求是什么?云服務又如何助力自動駕駛開發(fā)?智能車云未來該向何處發(fā)展?
近日,安永(中國)企業(yè)咨詢有限公司(以下簡稱“安永”)與華為智能汽車解決方案BU合作撰寫并發(fā)布了《從“上云”到“入云”,云服務賦能汽車產業(yè)智能網聯(lián)升級——智能汽車云服務白皮書》(以下簡稱《白皮書》)。
該《白皮書》也是第一本云服務應用在汽車行業(yè)智能汽車時代,核心業(yè)務核心應用上的白皮書。書中對目前自動駕駛開發(fā)、車聯(lián)網等智能車云服務應用場景進行了詳細解讀。
對此,車東西從這本《白皮書》中找到了上述問題的答案。
01 自動駕駛要落地,數據“上云”只是第一步
如果把自動駕駛行業(yè)發(fā)展分成上下半場,那么上半場就是從零到一的開發(fā)驗證階段,而下半場就是從一到多的商業(yè)落地階段。
在上半場競爭中,車企們比拼的是誰家自動駕駛系統(tǒng)算法更高效,誰的接管率更低。而在下半場中,比拼的是誰交付規(guī)模最大、實際使用里程最多。
畢竟,實踐是檢驗真理的唯一標準,自動駕駛也是同理。當下,各級別自動駕駛車輛越來越多,可行駛測試范圍越來越廣,應用場景也越來越豐富。
對于車企來說,“車多路廣”固然是好事,但隨之產生的海量數據就成為一件新“頭疼事”。
通常來說,在自動駕駛研發(fā)階段,如果按照10輛測試車,每年累計采集天數300天估算,單車每天可以產生10TB左右的數據量,每年產生的數據總量達到30PB左右。
而在商業(yè)落地階段,雖然車輛不會像測試車那樣沒日沒夜地跑,但車輛總數卻呈指數級上漲。如果按照10萬輛車,每年累計采集天數300天估算,那么未來車企所面臨的數據總量將會達到ZB級。
這里簡單介紹一下PB級和ZB級間的換算關系,1ZB=1024EB,1EB=1024PB,而用我們熟悉的TB單位來換算,1ZB約等于10億TB。車企們所面臨的數據壓力可想而知。
商用階段數據量將達ZB量級(圖片取自白皮書正文)
現(xiàn)階段,無論是從建設、運維成本還是信息安全來說,通過新建或擴容機房的方式顯然已經跟不上數據增長的速度。
“傳統(tǒng)的數據中心已經不能適應自動駕駛商用化的要求,“上云”是自動駕駛從開發(fā)到商用的必由之路?!蹦掣呖萍脊局悄苘囋品债a品部總經理說道。
由此可見,在自動駕駛商業(yè)落地下半場中,數據“上云”也就成為車企們的一大剛需,也成為決定其能否實現(xiàn)快速迭代的重要因素。
但是,海量數據不僅帶來了存儲難題,如何高效利用和處理又是另一大難題。
所以,數據“上云”只是第一步,而智能汽車云之于自動駕駛的意義也絕不是僅僅停留在滿足數據存儲本身。
02 感知模型怎么練,數據標注“入云”是關鍵
上文提到,自動駕駛行業(yè)正處于商業(yè)落地的下半場,各家表面上拼的是落地,是規(guī)模,是里程,但背后其實拼的是快速迭代能力、解決Corner Case能力。
也就是說,自動駕駛車輛的落地商用離不開持續(xù)而高效的算法迭代。
對自動駕駛算法迭代而言,感知模型訓練和仿真測試又是重中之重,前者直接關乎自動駕駛系統(tǒng)的安全性,而后者決定了自動駕駛系統(tǒng)能否實現(xiàn)快速迭代。
但根據部分車企的研發(fā)人員反饋,感知模型訓練和仿真測試卻也是整個自動駕駛研發(fā)過程中的兩大痛點。
自動駕駛相關高頻痛點場景(圖片取自白皮書正文)
首先是感知模型訓練。眾所周知,自動駕駛系統(tǒng)在感知層面與人類駕駛員類似,都是通過各種傳感器對外部環(huán)境進行感知,前者靠攝像頭、激光雷達、毫米波雷達,人類駕駛員靠的是眼睛、耳朵甚至是鼻子。
并且,對于自動駕駛系統(tǒng)和人類駕駛員來說,都是看到相對容易,辨別是什么更難。
自動駕駛感知方案
所以,感知模型訓練就成為自動駕駛研發(fā)過程中最基礎的一部分也是最重要的一部分。
畢竟只有看清了,認出是什么了,才能進行規(guī)劃和決策。
具體來說,感知模型訓練按照流程可以劃分為五大環(huán)節(jié),分別為數據存儲、數據預處理、難例挖掘、數據標注以及模型訓練。
自動駕駛研發(fā)關鍵控制點(圖片取自白皮書正文)
而在這五大環(huán)節(jié)中,數據標注又是最耗時耗力的一環(huán),讓一眾車企直呼“頭疼”。
數據標注是指通過人工以及智能化工具,對傳感器所捕捉的圖像、視頻、路牌文本等各類別信息進行目標檢測和識別。簡單來說,數據標注就是把圖像(點云、相機)中的信息逐一標出來,是一個簡單但對精度、效率要求極高的工作。
數據標注
所以,當人類在處理這項工作時,就難免會出現(xiàn)數據篩選耗時、人工標注返工率高、數據格式不統(tǒng)一等問題,也就使得整體標注效率比較低。而國外某自動駕駛車企也曾為了提升數據標注效率,因此減少人工標注的比例。
既然人工效率低,那么用AI進行數據標注呢?
通過AI對數據進行標注,雖然解決了人工的效率問題,但是數據積累的深度、廣度都會直接限制及影響AI的學習能力,且基礎算法模型的算力亦難以承擔日益增長的數據量。
所以,像自動駕駛感知模型這種訓練數據體量大、算法精度要求高、訓練效率要求快的工作,就更適合采用汽車云服務進行數據處理。
相較于人工與本地AI訓練的數據處理能力,汽車云服務憑借超強算力、高效精準的智能化策略優(yōu)勢,可以有效緩解自動駕駛數據處理過程中出現(xiàn)的各類難題與挑戰(zhàn)。
《白皮書》提到高等級自動駕駛在港口、礦山等封閉場景中商用落地的節(jié)奏早于乘用車,而且汽車云服務也會在這些行業(yè)應用場景中發(fā)揮“云上大腦”的巨大價值。以礦區(qū)無人駕駛為例,汽車云服務對感知模型的訓練起到了至關重要的作用。
無人駕駛卡車在礦區(qū)內經常會遇到非結構化路面、隨機落石、異形車輛等情況,并且礦區(qū)還存在飛塵、揚土等惡劣環(huán)境。這對于自動駕駛系統(tǒng)研發(fā)來說,非??简灁祿俗⒌臏蚀_度和模型訓練的效率,而汽車云服務通過高效的數據處理、難例挖掘、自動標注、模型訓練等能力,可以快速幫助無人駕駛卡車適應礦區(qū)復雜的作業(yè)環(huán)境,降低接管率,提升無人化作業(yè)效率。
從數據上來說,本地AI訓練數據處理的效率較人工提升3~4倍,而依托云端的更高算力和更多的經驗積累,汽車云服務數據處理的綜合處理效率提升10倍以上,數據處理成本較人工降低50%。
自動駕駛研發(fā)數據處理發(fā)展歷程(圖片取自白皮書正文)
綜上來看,在自動駕駛研發(fā)數據處理方面,汽車云服務的優(yōu)勢正在逐漸凸顯。不僅可以有效識別高價值數據,優(yōu)化存儲空間,加速難例挖掘,還可以深度學習實現(xiàn)自動標注能力提升,優(yōu)化標注算法效率與精度,降低數據處理成本。
03 要想快速迭代,仿真測試需要云來幫
在解決了數據處理難題后,對于在自動駕駛持續(xù)投入的車企們來說,要想實現(xiàn)快速迭代,海量測試必不可少。
行業(yè)普遍觀點認為,自動駕駛系統(tǒng)至少需要100億英里(約合161億公里)的試駕數據,以確保車輛上路的行駛安全,但顯然僅憑測試車“沒日沒夜”地跑難以完成。
所以,仿真測試也就成為自動駕駛研發(fā)的重要環(huán)節(jié),也是必經之路。
據統(tǒng)計,在仿真測試中,車企主要面臨四大挑戰(zhàn),分別為場景庫覆蓋度不足,行業(yè)間格式互不兼容;仿真測試所涉里程數大,場景類別多且耗時長;仿真測試與實車路測偏差大,置信度低;仿真評價體系不完善,反饋效果差。
自動駕駛仿真測試體系(圖片取自白皮書正文)
并且,仿真測試對技術團隊能力要求較高,要兼具多種交叉學科的專業(yè)技能,對業(yè)務融合程度的要求也更高一個層級,遠超自動駕駛研發(fā)的其他業(yè)務環(huán)節(jié)。
上述這些挑戰(zhàn)和問題,也就促發(fā)了仿真測試“入云”的迫切需求。那仿真汽車云又能解決什么問題呢?又是怎么解決問題的呢?
首先,仿真汽車云服務通過構建開放場景庫,幫助仿真場景庫更為標準與全面。其次,憑借云端大規(guī)模并行仿真的強大算力及高并發(fā)處理能力,將單線模式轉變成并發(fā)模式,支持多場景下同時完成多個仿真任務,大大提升了仿真效率。
自動駕駛云仿真
而至于仿真測試與實車路測偏差大的問題,仿真汽車云服務可以集成計算機軟件、車輛動力工程、交通等多領域專業(yè)能力,從微觀到宏觀提高仿真測試逼真度。
最后,在仿真測試評價方面,汽車云服務基于汽車行業(yè)經驗并結合場景庫,能為仿真測試過程提供多維且全面的評價指標體系,支持不同車企、不同發(fā)展階段評價指標的定制化服務,加速仿真測試的算法迭代與場景庫優(yōu)化。
所以總結來看,對于整個自動駕駛云服務來說,高質量的仿真測試體系就像皇冠上的明珠,極具代表性地體現(xiàn)出自動駕駛研發(fā)“入云”的價值。而在數據處理和仿真測試這兩大自動駕駛研發(fā)的關鍵控制點中,智能汽車云的作用已不可小覷。
對于涉足自動駕駛的車企來說,如今智能汽車云的重要性已經與傳感器、計算平臺、整車制造旗鼓相當,并已經成為在商業(yè)落地下半場中降本增效的秘密武器。
04 研發(fā)效率怎么提,工具鏈貫通是重點
當感知模型訓練和仿真測試的效率得到改善后,那么是否就意味著整個自動駕駛研發(fā)流程的效率可以整體提升呢?
答案是否定的。
舉例來說,某車企就曾在自動駕駛研發(fā)過程中,由于在不同階段使用的各項工具零散,數據處理格式不一,導致開發(fā)模型迭代需要2個月,效率低下且成本高。
這也就意味著,僅單一研發(fā)流程的效率提升,而沒有一個完整的自動駕駛研發(fā)工具鏈,并不能讓整體研發(fā)效率得到有效提升。
最后的結果很有可能是1+1。