文|劉曠
ChatGPT走紅后,大模型的熱度持續(xù)不減,并日漸形成了“千模大戰(zhàn)”的局面。前兩個月,百度、阿里、騰訊加入;進入5月份,先有網(wǎng)易有道,發(fā)布了基于“子曰”大模型開發(fā)的AI口語老師劇透視頻,介紹其基于教育場景的類ChatGPT產(chǎn)品;后有科大訊飛,發(fā)布認知大模型“訊飛星火”……總之,各種大大小小的發(fā)布會,都在向外界證明自己到底有多大的想象空間。
在大模型進展如火如荼之下,其產(chǎn)業(yè)化也被越來越多地提及,從前炒作的“AI+”也再次站上風口。在此背景下,關于AI大模型在汽車領域的應用,也開始熱度飆升。
智能汽車的“ChatGPT時刻”來了
目前來看,大模型重構各行各業(yè)雖然已經(jīng)成為業(yè)界共識,但ChatGPT“上車”遠比預想中的來得更快。作為繼家庭和辦公場所之外的“第三空間”,汽車正在變成一個新型智能終端。ChatGPT到來了之后,車機關系也受到了更多的影響。
一是ChatGPT對汽車自動駕駛的影響。業(yè)內(nèi)人士分析表示,大模型具備對海量數(shù)據(jù)的處理能力以及多維度分析能力,可以提供更精準、更全面的數(shù)據(jù)分析和預測能力,持續(xù)優(yōu)化模型,提高智能駕駛的準確性和可靠性。尤其是隨著ChatGPT的出現(xiàn),人們發(fā)現(xiàn)當模型的參數(shù)量,達到了一定程度之后,呈現(xiàn)出的效果不是“性能變好”,而是“出奇的好”。
具體到應用層面,大模型對自動駕駛的影響是:在云端,車企可以發(fā)揮模型參數(shù)量的大容量優(yōu)勢,通過大模型完成絕大多數(shù)的數(shù)據(jù)標注和數(shù)據(jù)挖掘工作,節(jié)省數(shù)據(jù)標注成本,還能夠借助仿真場景構建賦能。在車端,它可以將分管不同子任務的小模型合并為一個大模型,節(jié)省車端推理計算時間,增加汽車安全性。最重要的是,被認為是自動駕駛算法終局的端到端感知決策一體化算法瓶頸,或許在汽車接入大模型之后可以得到有效解決,自動駕駛算法升級指日可待。
二是對汽車智能座艙的影響。車載ChatGPT語音助手,可以處理完整的對話,比如追問,并能保持對前后文的理解,形成較為良好的語音交互體驗。比如,微軟與梅賽德斯—奔馳探索ChatGPT的插件生態(tài)系統(tǒng),為第三方服務集成開辟可能性。駕駛員未來有望通過車載系統(tǒng)完成預訂餐廳、預訂電影票等任務,進一步提升便利性和生產(chǎn)力,極大地豐富智能汽車與人之間的交互體驗。
另外,在改變智能駕駛和智能座艙交互能力的情況下,其也對汽車的研發(fā)方式和商業(yè)模式產(chǎn)生全新的影響。研發(fā)方式方面,由于機器的高效標注能力,使得需要一年時間的數(shù)據(jù)標注任務,現(xiàn)在只需要短短數(shù)小時,研發(fā)周期大幅縮短,而且多模態(tài)(視覺、語音、手勢等)的豐富數(shù)據(jù),更可以進一步提升總體的研發(fā)效能,降低研發(fā)成本。就商業(yè)模式而言,車載AI語音交互在它具備情感智能之后,它就會從“雇傭關系”演變成“陪伴關系”,對人的喜好和習慣會更加了解,這將會衍生出全新的商業(yè)價值。
產(chǎn)業(yè)探索流派紛呈
或許正是意識到了這一點,現(xiàn)在正有越來越多的車企選擇接入AI大模型。除了國外的奔馳宣布ChatGPT之外,國內(nèi)理想汽車也發(fā)布了自研大模型MindGPT,百度的文心一言也被接入到了長安、吉利、嵐圖、紅旗、零跑等眾多車企之中,就連“讓夢想窒息”的法拉利未來,也在新車中納入了大模型,不難預見未來大模型在智能汽車中普及,將會是大概率事件。從整個參與的車企來看,其發(fā)展大模型的方向和側重點并不相同。
從功能上來看其主要可以分為以下兩類:一類是用于人工智能交流對話領域,多數(shù)應用在智能座艙上。比如,百度的文心一言,目前已經(jīng)有東風日產(chǎn)、紅旗、長城等近十家車企宣布接入;上海車展期間,商湯科技亮相了日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結合;此前阿里巴巴也宣布AliOS智能汽車操作系統(tǒng),已接入通義千問大模型進行測試等。
另一類是聚焦智能駕駛的大模型應用。比如毫末智行發(fā)布了自動駕駛生成式大模型DriveGPT,幫助解決認知決策問題,最終實現(xiàn)端到端的自動駕駛。理想汽車自研大模型MindGPT,擺脫對高清地圖的依賴,讓汽車做到更接近人類司機的駕駛表現(xiàn)。蔚來、小鵬、長城、奇瑞四家車企,也已經(jīng)注冊申請了多個與GPT相關的商標。
從參與主體來看,也主要可以分為兩類:一是車企親自下場做的,如理想汽車、百度將自家大模型應用于自家汽車產(chǎn)品等;另一類是外部廠商提供大模型給車企,比如華為盤古大模型、百度文心一言等用于給其他車企使用。
相較通用大模型來說,垂直領域的大模型訓練和使用成本更低,或許會成為更容易實現(xiàn)商業(yè)化落地的領域。業(yè)內(nèi)人士分析稱,汽車有著明確的交互需求,且相較于通用大模型,垂直領域的應用場景相對較小,對參數(shù)的量級要求也沒有通用型AI那么大。因此,無論是傳統(tǒng)車廠還是新勢力,抑或是大模型科技廠商,普遍認為智能汽車最有可能成為率先實現(xiàn)大模型落地的B端場景。
大模型規(guī)模上車時機尚未成熟
目前來看,盡管ChatGPT的首發(fā)“上車”,已經(jīng)拉開了智能汽車領域大模型較量的序幕。但現(xiàn)階段距離大模型的真正規(guī)模上車,也還有一段距離。
首先,車企做大模型,多模態(tài)數(shù)據(jù)的收集、處理、訓練本身是一個難題。自動駕駛所需傳感器數(shù)據(jù)包括激光雷達、毫米波雷達、超聲波雷達,以及高清攝像頭、GPS等。這些數(shù)據(jù)來自不同的坐標系,帶有不同的觸發(fā)時間戳,且要考慮到硬件損壞等問題;同時,需要大量的場景數(shù)據(jù),比如交通標志線、交通流、行為模型等。這讓汽車大模型的研發(fā)、訓練門檻變得很高。
業(yè)內(nèi)人士認為,模型數(shù)據(jù)調(diào)動管理需要利用智能網(wǎng)聯(lián)汽車以及計算技術平臺、云控技術平臺等諸多平臺,只有做到海量數(shù)據(jù)匯聚才可以做交叉,尤其是垂直領域,這和車內(nèi)的其他系統(tǒng)并不相同,假如基礎的平臺能力不能打通,其很難向更深層次發(fā)展。另外,盡管生成式AI在信息獲取上獲得了突破,但在決策、執(zhí)行控制層面,其離真正在汽車上落地還有較大的距離。
另外,端到端的AI大模型訓練,需要在智能汽車中構建全新的基于AI大模型的全新算法,這也需要一個過程,業(yè)內(nèi)人士認為至少需要3—5年甚至更長的時間,來完成這一過程。
其次,受限于車載設備的硬件條件,汽車內(nèi)大模型所需要的硬件配置可能會受到限制,難以有效發(fā)揮好作用。具體來說,大模型需要高規(guī)格的硬件配置,包括高性能計算能力、大容量內(nèi)存和低時延等特點,但車載設備的硬件條件相對有限,無法提供足夠的算力資源支撐大模型運行。比如,在自然語言處理領域的GPT-3模型,就需要數(shù)萬億TOPS的計算能力。這要求芯片的算力至少要在萬級TOPS以上,才能夠勝任大模型的計算任務。但是在車載部署場景下,芯片的算力往往只有數(shù)百TOPS,遠遠達不到大型模型的要求。
在此背景下,升級汽車內(nèi)的算力基礎設施已成必然趨勢,目前來看智算中心或許會成為未來智能汽車的“標配”。比如,特斯拉發(fā)布了獨立的云端智算中心——Dojo,總計使用了1.4萬個英偉達的GPU來訓練AI模型。在國內(nèi),小鵬汽車與阿里云合建了智算中心“扶搖”,專門用于自動駕駛模型訓練,算力可達到600PFLOPS;毫末智行與火山引擎聯(lián)合打造了國內(nèi)自動駕駛行業(yè)最大的智算中心“雪湖.綠洲”,每秒浮點運算可達到67億億次。不過,目前這些建設還處于探索應用階段,大模型應用大規(guī)模上車的時機,還沒有完全成熟。
底層技術才是未來角逐焦點
目前來看,AI大模型對汽車最本質(zhì)的改變,可能在于它將進一步驅(qū)動汽車,從制造屬性向科技+消費電子屬性轉變。在這種背景下,車廠本身的底層科技能力,將會成為未來的決勝關鍵。
一方面,AI大模型會重新定義“人機交互”和“服務生態(tài)”,加速汽車應用服務生態(tài)消費電子化,這將改變底層的產(chǎn)品定義。當前車載語音系統(tǒng)底層是未完全成熟的任務型對話系統(tǒng),尚無法真正實現(xiàn)個性化、情感化、自由化的交互能力,而大模型可以通過深度學習+語音生成,迎來開放場景+自然交互的全新人機交互體驗。同時,在研發(fā)設計上,隨著大模型的OS化,傳統(tǒng)的APP上車、點觸功能、HMI交付的必要性和重要性值得思考,這意味著汽車“產(chǎn)品”的重新定義。
正如前華為自動駕駛產(chǎn)品部部長蘇箐所言:“傳統(tǒng)車廠看法首先我的基座是車,現(xiàn)在有些計算機的單點,那么我是把車作為一個基礎,試圖把計算機嵌進去,這是傳統(tǒng)車廠的看法。我們的看法不一樣,基礎是計算機,車是計算機控制的外設,一個大計算機了事,把車掛上去。這是本質(zhì)看法不一樣?!笔聦嵣希诖竽P蜕宪囍?,汽車的計算中心、智能化、消費電子屬性將變得更加明顯,其產(chǎn)品定義將遵循消費電子的底層邏輯迭代演變(如APP化、生態(tài)服務等)。
另一方面,AI大模型將會改變汽車的現(xiàn)有算法,考慮到大模型應用所需要的硬件成本以及外部環(huán)境來看,未來國內(nèi)企業(yè)大模型的技術實力,將更加取決于包括AI操作系統(tǒng)等在內(nèi)的底層技術。具體來說,原來汽車的自動駕駛算法較為依賴人工,而接入大模型之后,就需要依靠大模型驅(qū)動形成新的智能算法,而要構筑這樣的算法,除了要做好產(chǎn)品,還要做好平臺。
比如,圍繞芯片、云端等在內(nèi)的計算平臺,需要做到低成本、可標配;有了好的產(chǎn)品,才能夠有足夠多的銷量,有足夠多的銷量,才能增加“端到端”(云端到車端)的閉環(huán)數(shù)據(jù);作為基礎支撐的AI大算力芯片,也需要重新考慮車企自身的情況來做,回到底層來說就是誰的訓練成本低,誰的轉化速度快,誰就將跑到最前面。
拿英偉達的訓練芯片來說,一枚芯片被炒到了10萬塊錢,關鍵是這種高成本芯片訓練方案,對于車企并非最優(yōu)解決辦法。而且受外部制裁影響,這種“外供依賴”隨時有可能被掐掉,脆弱性很大。因而從長遠來看,車企想要在這一領域走到行業(yè)前列去,要么加大對底層芯片的自研力度以減少采購成本,如百度自研AI芯片,要么在AI算法、操作系統(tǒng)上去尋求破局,以找到最佳的應用路徑。