文|數(shù)智前線 趙艷秋
編輯|?;?/p>
OpenAI推出Sora后,立刻在影視界、廣告界和游戲業(yè)炸開了鍋,但因為它作為“模擬器”,在模擬世界上的局限性,很多人并沒想到會與智能制造沾上邊。
但一些智能制造的專家,已對Sora進(jìn)行了觀察研究,看到了底層邏輯的相通之處,也想到了一些結(jié)合點。“如果業(yè)界真的朝智能制造方向去做的話,黑燈工廠、自動駕駛、數(shù)字孿生中的一系列難題,是有希望解決的?!睅孜恢悄苤圃鞂<艺f。
一個有意思的現(xiàn)象是,自從2022年底ChatGPT大模型推出后,技術(shù)派、大模型廠商、創(chuàng)業(yè)者出來說得多,但制造企業(yè)和行業(yè)人士鮮有發(fā)聲?!坝幸稽c過度消費(fèi)了,每周都有爆炸式的技術(shù)推出,但它們的落地在哪里?產(chǎn)生了什么商業(yè)價值?”一位制造人士說。一些制造企業(yè)感到焦慮,背后的原因是從技術(shù)到應(yīng)用,中間仍有一些間隙需要彌合。
不過,經(jīng)過過去半年的摸索和嘗試,2024年,伴隨政府發(fā)展新質(zhì)生產(chǎn)力,以及一些央國企在大模型應(yīng)用上的動作加快,在智能制造業(yè),尤其是在那些變化快、競爭激烈的行業(yè),應(yīng)用大模型創(chuàng)新的進(jìn)程正在提速。
01 Sora能用于制造業(yè)嗎?
Sora推出后,OPPO AI中心產(chǎn)品總監(jiān)張峻,對生成式AI的迭代速度感到驚訝,“幾乎每天早上起來,都會看到一個有意思的新demo”。未來,用戶怎么調(diào)用這些生成式AI,可能將給手機(jī)帶來架構(gòu)、交互等全方位的改變。OPPO內(nèi)部也在探索。
在終端的變化上,業(yè)界已有一些明確的方向。比如,在短期之內(nèi),可能就會發(fā)生兩個較大的變化。一是去App化。大模型本身具備生態(tài)插件及融合能力,它自己會去調(diào)用服務(wù)接口,不需要打開App。第二是搜索入口的變化。大模型本身外部檢索能力非常強(qiáng),多模態(tài)能力也非常強(qiáng),它就是一個好的搜索入口。
一家車企人工智能資深人士在Sora推出后,也進(jìn)行了觀察思考。對于車廠,他認(rèn)為Sora有一定應(yīng)用場景和價值。在自動駕駛的訓(xùn)練中,他們已用大模型做數(shù)據(jù)生成,但大都是靜態(tài)數(shù)據(jù)。“交通流這些動態(tài)數(shù)據(jù),Sora目前還達(dá)不到要求,但至少是看到一些希望?!?/p>
在合成數(shù)據(jù)方面,車企原來要基于虛擬環(huán)境(元宇宙)去做,而虛擬環(huán)境需要拍攝一些視頻,用Nerf做3D重建,但成本不小,很多地方還不能拍攝?!捌鋵嵵悄荞{駛只關(guān)心場景,不關(guān)心跟地標(biāo)相關(guān)的東西,因此合成數(shù)據(jù)場景對Sora這類技術(shù)的需求應(yīng)該也很大。”
在浪潮信息,硬件研發(fā)部副總經(jīng)理王武軍和團(tuán)隊之前已介入AIGC的訓(xùn)練中。王武軍從Sora生成的視頻看,“那個東京街頭,地面上雨水的反光,已逐漸接近于可接受的現(xiàn)實”。
Sora的底層邏輯是通過大量數(shù)據(jù)訓(xùn)練而來,現(xiàn)在制造業(yè)有很多地方是人去推算的。如果數(shù)據(jù)量極強(qiáng)的話,運(yùn)用Sora的模式,有希望對產(chǎn)品設(shè)計、仿真、柔性安裝和運(yùn)維帶來改變。
“我現(xiàn)在沒辦法說明它未來是一個什么形態(tài),但它將是顛覆性的。”王武軍打了一個比方,業(yè)界的一個難題是“柔性安裝”。比如,服務(wù)器機(jī)箱中有幾十條線,這些線怎么“繞”、怎么指揮機(jī)械臂去安裝。
可行的做法是,針對每條線纜,需要工程師做一個3D模型。根據(jù)配置不同,一根線纜要插在不同的位置,需要數(shù)十種3D模型,而組裝過程中,又需要臨時調(diào)整,從而導(dǎo)致柔性物體自動化安裝事倍功半,不太現(xiàn)實。如果能通過數(shù)據(jù)訓(xùn)練,自動生成“繞線”方式,再直接將數(shù)據(jù)提取出來,告訴機(jī)械臂怎么去組裝,這個問題就解決了。
做仿真的工業(yè)軟件人士也注意到了Sora?!澳憧碨ora視頻中那位女主角走路的姿態(tài),如果結(jié)合了仿真工具,會更加自然,現(xiàn)在太空靈了?!盋AE人士李巖說。仿真軟件可以模擬復(fù)雜的機(jī)器、產(chǎn)品,他看到了Sora和仿真的結(jié)合之處。
“現(xiàn)在仿真迭代的過程很長,如果前期通過Sora的方式,讓仿真不從最差的初始條件去計算,整體計算時間會大大縮短?!彼f,“后期也可以對仿真結(jié)果去做優(yōu)化?!?/p>
由于Sora自稱是要做“世界模擬器”,業(yè)界也在對比Sora和數(shù)字孿生的一些差異。數(shù)字孿生是真實世界數(shù)據(jù)化后的投影。而Sora是基于模擬樣本,構(gòu)建虛擬和真實交錯的數(shù)字世界。
由于大模型有不同的數(shù)據(jù)源,通過Sora來模擬世界,帶有一定的想象力和發(fā)散性。比如,在Sora生成的一個視頻,一只小螞蟻穿越洞穴,這在現(xiàn)實中無法拍攝到。但也有網(wǎng)友指出它的漏洞:螞蟻是一個二維生物,走起路來不像人,它們會漫無目的、來來回回,這個Sora生成的視頻,與潛在物理規(guī)律有一些偏差。
“現(xiàn)階段可以理解Sora是數(shù)字化孿生的一種手段和補(bǔ)充,而不是替代。Sora可用于真實世界在虛擬世界的美化展示,以及替代人工建模與設(shè)計的生成,幫助數(shù)字孿生加速?!?聯(lián)想中國區(qū)大客戶業(yè)務(wù)群及制造行業(yè)總經(jīng)理宋濤說。Sora可以用于設(shè)計階段的效果構(gòu)建,或產(chǎn)品的生產(chǎn)構(gòu)建效果,但沒法替代數(shù)字孿生的數(shù)據(jù)視圖等功能。
宋濤認(rèn)為,未來兩者可能會整合,也可能形成一個新技術(shù)合集或新突破,如混合宇宙等,但目前看到他們技術(shù)線路的差異,需要有一定的技術(shù)突破才能實現(xiàn)。
”如果明白現(xiàn)有技術(shù)的局限性,在揚(yáng)長避短的前提下,它們在某些場景下仍然具有價值?!癐EEE數(shù)字化轉(zhuǎn)型聯(lián)合會戰(zhàn)略與架構(gòu)主席汪齊齊說。
Sora的發(fā)散性,讓它有新的空間?!跋裎覀円恍└叨似嚳蛻簦枨笤絹碓絺€性化??梢愿鶕?jù)客戶的描述,馬上生成一個視頻推給他,然后再完善設(shè)計?!盓RP軟件廠商Infor大中華區(qū)商業(yè)咨詢高級總監(jiān)鹿崇說。類似的還有外觀設(shè)計、車衣、涂鴉等,這是進(jìn)入研發(fā)之前的一個環(huán)節(jié)。
關(guān)于成本,業(yè)界有種猜測,Sora生成1分鐘視頻,大約要8塊A800計算3小時,成本接近90美元。“To B這么一條,以往按照每秒幾千收費(fèi),Sora的價格還是便宜的?!睌?shù)碼產(chǎn)品資深人士、Angry Miao創(chuàng)始人李楠向數(shù)智前線估算。這讓業(yè)界看到了它在上述應(yīng)用中的巨大潛力。
目前關(guān)于Sora這類技術(shù)和制造的結(jié)合,一位人士稱,“Demo和產(chǎn)品還沒到落地狀態(tài),但大家有方向,有思路”。
02 制造業(yè)已用了哪些AIGC技術(shù)?
除了Sora之外,在ChatGPT發(fā)布之后,大模型已在制造業(yè)有什么落地進(jìn)展嗎?
聯(lián)想宋濤從智算資源分布的角度告訴數(shù)智前線,目前國內(nèi)對大模型的需求,70%的生意在互聯(lián)網(wǎng),10%在科研單位,落在制造業(yè),主要的機(jī)會是汽車自動駕駛。
幾位車企資深人士告訴數(shù)智前線,過去幾年,汽車行業(yè)越來越卷。車企的錢在往微笑曲線的兩端投,一個是研發(fā)端,一個是營銷服務(wù)端。在制造端,過去半年,沒有看到典型場景。而大模型落地的主要場景,集中在智能駕駛、營銷服務(wù)和智能座艙。
比如,智能駕駛中的數(shù)據(jù)合成以及數(shù)據(jù)標(biāo)注;在售后服務(wù)上,當(dāng)遇到一些不常見的故障,大模型可以找到與描述最接近的情況,迅速給出排序,輔助售后服務(wù)人員,幫助車主一一排查,這樣的售后服務(wù)接受度較高。
今年大家競爭的一個焦點是智能座艙。預(yù)計上半年,一些車企就會陸續(xù)官宣接入大模型。不過,業(yè)界在智能座艙中還未找到爆炸式場景,今年要進(jìn)一步挖掘場景。
2024年車企在大模型上的預(yù)算普遍在千萬級以上,用于自動駕駛、智能座艙或是大模型私有云部署等。這比2023年有顯著提升。
除了汽車行業(yè),其他智能制造業(yè)在研產(chǎn)供銷服,都有一些進(jìn)展。
浪潮信息王武軍他們基于“源”大模型,已就研發(fā)的三個方向進(jìn)行訓(xùn)練。一個方向是為工程師訓(xùn)練出一個助手“賈維斯”。另一個是智能教練系統(tǒng),有點像“科大訊飛學(xué)習(xí)機(jī)”,帶著工程師學(xué)習(xí)和反復(fù)訓(xùn)練。還有一個方向是軟件設(shè)計,將通過代碼自動生成,實現(xiàn)服務(wù)器的相關(guān)軟硬結(jié)合環(huán)節(jié)。目前,這幾個方向內(nèi)部已開始測試,處于持續(xù)優(yōu)化過程中。
在制造環(huán)節(jié),騰訊云智能制造專家邴金友印象深刻的是,一家代工企業(yè)要處理多個客戶的產(chǎn)品圖紙。結(jié)合大模型技術(shù),他們迅速將圖紙結(jié)構(gòu)化,直接輸入到SMT產(chǎn)線,驅(qū)動它的貼片機(jī)生產(chǎn),降本增效明顯。
在智能客服領(lǐng)域,大模型已可以替代人。宋濤介紹,聯(lián)想在電話呼叫中心中,建立了基于AI智能的Q&A系統(tǒng),可以偵測到服務(wù)人員在服務(wù)過程中的關(guān)鍵詞,提供專業(yè)的技術(shù)指導(dǎo)。
在營銷方向,有高端裝備企業(yè),嘗試將AI與市場活動等結(jié)合起來,撰寫策劃文案。美的集團(tuán)也將AI接入到集團(tuán)的系統(tǒng)中,對文稿等基本的日常工作,做輔助測試。
鹿崇看到大模型已應(yīng)用到了制造業(yè)的定價和運(yùn)維上。在定價方面,很多制造企業(yè)的產(chǎn)品定價缺乏針對性,很難根據(jù)產(chǎn)品歷史銷售、市場環(huán)境、成本因素等變化適時科學(xué)的調(diào)整。AI技術(shù)的使用,使得定價模型成為可能。
在運(yùn)維方面,大量的數(shù)據(jù)已讓工廠中的機(jī)器開口“說話”。在機(jī)器發(fā)生疲勞之后,一些模型結(jié)合起來,可以做到預(yù)防性/預(yù)測性維護(hù)策略更科學(xué)。
而大模型最直接的應(yīng)用落地是產(chǎn)品,比如AIPC、AI手機(jī)。
在過去一年,邴金友看到,像光伏、新能源或新型高端裝備業(yè),所處的市場競爭壓力較大、變化較快,更愿意采用大模型創(chuàng)新技術(shù)。另外,一些制造企業(yè)的三產(chǎn)或數(shù)科公司,對大模型的接受度也較高。
“大模型在制造業(yè)有點狀落地。按照Gartner的技術(shù)曲線,目前處于上升期?!壁鹩呀榻B。
03 面對大模型,制造業(yè)要做哪些準(zhǔn)備?
從2024年開始,幾乎每周,大模型都有“爆炸性”新聞推出。而根據(jù)業(yè)界的信息,在接下來,仍有一些公司的大招放出。阿里巴巴集團(tuán)副總裁、瓴羊CEO朋新宇接觸的不少企業(yè),焦慮于自己不知道該怎么做。在焦慮不斷延伸下,社會上也出現(xiàn)了“AI的盡頭是賣課”這樣一些社會怪相。
鹿崇坦承,現(xiàn)在概念談得多,但真正的應(yīng)用還要一步步做。
“如果落到企業(yè)層面,無非是三樣?xùn)|西:算力、企業(yè)的數(shù)據(jù),以及企業(yè)的人才?!迸笮掠罘治稣f,從算力來講,除了OpenAI等少數(shù)企業(yè),對大多數(shù)企業(yè)而言,大家的起跑線幾乎一樣。
從數(shù)據(jù)來說,OpenAI已把地球上所有的公開數(shù)據(jù)基本上都收集完了,但是對企業(yè)最有價值的數(shù)據(jù),往往是企業(yè)的自有數(shù)據(jù),這部分是OpenAI收集不到的。企業(yè)要考慮如何把這些數(shù)據(jù)的質(zhì)量提升,變成好的資產(chǎn),與大模型結(jié)合。“我覺得這是企業(yè)能抓得住的、實實在在的投入?!?/p>
從人才來說,對于大多數(shù)企業(yè)來講,去找AI領(lǐng)域的大牛,本質(zhì)上并沒有必要,關(guān)鍵是現(xiàn)在這樣的人才也找不到。企業(yè)反而需要那些理解如何應(yīng)用大模型,如何與企業(yè)工作流去對話,將大模型的能力轉(zhuǎn)變成企業(yè)生產(chǎn)力的一撥人?!捌髽I(yè)要抓得住這撥人?!?/p>
汪齊齊則強(qiáng)調(diào)了行業(yè)專家的力量。他以直播帶貨為例,社交平臺的興起,解放了個人的生產(chǎn)力,改變了許多傳統(tǒng)行業(yè)的運(yùn)作模式。但是,這種模式的成功,往往依賴于對特定行業(yè)深入了解的專家。”例如,一個精通化妝品銷售的專家可能不擅長電子產(chǎn)品的直播銷售,反之亦然?!八f,盡管技術(shù)為各個領(lǐng)域提供了不同程度新的機(jī)會,但真正的專業(yè)知識和行業(yè)理解仍然是不可或缺的。
“不管大模型未來以什么樣的姿態(tài)出現(xiàn),它一定會出現(xiàn)?!迸笮掠钫f,企業(yè)要做好準(zhǔn)備。
“人工智能屬于智能制造第5級可以實現(xiàn)的目標(biāo)。”聯(lián)想宋濤說,企業(yè)需要從基本的業(yè)務(wù)梳理,軟件應(yīng)用和平臺打通等數(shù)字化工作開始落實,打好地基。而這些也需要基礎(chǔ)架構(gòu)的支持,云計算、混合云、數(shù)據(jù)安全、數(shù)據(jù)管理等基礎(chǔ)工作,這也是幫助企業(yè)重新梳理IT、OT、DT、ET等之間的機(jī)會。
宋濤也提到了人工智能技術(shù)落地的四大要素——算力、數(shù)據(jù)、算法和場景。其中,場景是驅(qū)動,要挖掘能夠利用AI降本提效的場景。算力是底層支撐,數(shù)據(jù)是養(yǎng)分,而算法是人工智能技術(shù)形成的價值。
他建議,在人工智能落地中,優(yōu)先做好算力建設(shè)和數(shù)據(jù)存儲,再做好數(shù)據(jù)治理和數(shù)據(jù)價值的挖掘;用高質(zhì)量數(shù)據(jù),去訓(xùn)練好對應(yīng)的算法,從而對業(yè)務(wù)產(chǎn)生價值。而AI的落地,也需要對應(yīng)的人才,分步、分期通過技術(shù)實現(xiàn)。
朋新宇提到上周政府工作報告中的“發(fā)展新質(zhì)生產(chǎn)力”?!按竽P陀糜谥悄苤圃焓潜娡鶜w?!彼f,從OpenAI這一年的動作來看,它打開了新的空間——人類的空間、經(jīng)濟(jì)的空間以及企業(yè)發(fā)展的空間?!氨举|(zhì)上,目前行業(yè)里還沒有看到真正顛覆性的改變,但這也是離企業(yè)現(xiàn)場更近的這些人們的職責(zé)。”