文|零態(tài)LT 卓心月
編輯|胡展嘉
大模型從概念到落地,到底有多快?
近期科技圈最引人注目的2023世界人工智能大會(WAIC 2023),給出了讓所有人震驚的答案:半年!半年,對于任何一個科技賽道而言,都不算長,甚至有的賽道還只停留在“萌芽”階段,但大模型賽道卻在這么短時間內(nèi)完成了從概念到落地的進程。
今年一季度行業(yè)還在討論“要不要”的問題,到了第二季度,各個大廠扎堆入局做大模型的趨勢,則是玩家們在回答“怎么做”了。
這個答案,實質(zhì)上已由參加WAIC大會的30多家大模型的廠商們劃了重點——首先解決技術(shù)問題,緊接著是場景落地,最后是商業(yè)與規(guī)模化。
“此前的人工智能落地難點更多在技術(shù)層面,如自動駕駛領(lǐng)域,其發(fā)展多年,但商業(yè)化落地仍讓玩家們看不到曙光。”一位行業(yè)人士在參觀WAIC大會后提到:“相對而言,大模型的落地難度相對要小一些。但需要注意的是,大模型的市場競爭會更加激烈。”
此次WAIC大會中,30多家企業(yè)集中“秀肌肉”,其中不乏百度、騰訊、阿里、華為、京東等巨頭,同時也有商湯、網(wǎng)易等垂直領(lǐng)域的選手。
就在此時,我國首個大模型標準化專題組組長,由上海人工智能實驗室與百度、華為、阿里等企業(yè)聯(lián)合擔任的消息傳出,這些首批入圍的企業(yè)也被業(yè)內(nèi)賦予了“國家隊”稱號。種種跡象表明,一場由“國家隊”引領(lǐng)的更高維度的大模型PK戰(zhàn),正式開打。
01 從“群模亂舞”到“國家隊引領(lǐng)”
今年年初以來,大模型毋庸置疑成為科技最爆點,并且很快成為各家企業(yè)“主旋律”。似乎沒有任何一家大廠敢公開表示自己不會涉及于此。據(jù)不完全統(tǒng)計,今年上半年正式公開宣布做大模型的企業(yè)就有近百家。
阿里、百度、騰訊、字節(jié)跳動、京東等為代表的互聯(lián)網(wǎng)大廠,科大訊飛、商湯科技為代表的AI公司,以及教育企業(yè)如孩子王、金融類企業(yè)如同花順等為代表的各行業(yè)公司,紛紛入局。
此外,國內(nèi)還火速興起了AI大模型的創(chuàng)業(yè)風(fēng)潮,諸多科技大佬及大廠高管、前高管等投身大模型,開啟再創(chuàng)業(yè)。如原美團聯(lián)合創(chuàng)始人王慧文高調(diào)入局AI大模型(目前其成立的“光年之外”已被美團收購);創(chuàng)新工場CEO李開復(fù),搜狐創(chuàng)始人王小川、前京東AI業(yè)務(wù)開路人周伯文等都加入了AI大模型的創(chuàng)業(yè)大潮中。這一景象雖不如當年的“千團大戰(zhàn)”那般壯觀,但對于需要極高技術(shù)門檻的人工智能+解決方案為主的大模型賽道而言,已經(jīng)足夠令外界意外。
最近幾年時間,to B賽道異?;馃?,企業(yè)數(shù)字化轉(zhuǎn)型與升級需求日益旺盛、降本增效也是企業(yè)極為核心的訴求。甚至不少行業(yè)人士認為,大模型已成為科技圈最有希望獲得增量的領(lǐng)域。而這也成為大模型快速風(fēng)靡的動因之一。
WAIC2023現(xiàn)場(圖:零態(tài)LT攝)
7月6~8日在上海召開的WAIC大會上,30余家大模型企業(yè)爭搶著展示在大模型層面的布局和成果,也成為行業(yè)發(fā)展的標志性事件。
百度作為國內(nèi)首家宣布All In 人工智能的廠商,在大會現(xiàn)場展現(xiàn)了其“鎮(zhèn)館之寶”之一的文心一格,讓進入展廳的觀眾實現(xiàn)人人都能“P圖”。華為則將其Atlas 900 PoD A2搬到了現(xiàn)場,大秀其硬件端基礎(chǔ)算力的實力;在阿里云分論壇現(xiàn)場,“通義家庭”再添AI繪畫模型“通義萬相”,這是阿里在三個月時間內(nèi)公布的第三個大模型產(chǎn)品。
行業(yè)在大模型上的熱情,加速了“國家隊”的成立。
7月7日,WACI 2023大會上,由國家標準委指導(dǎo)的國家人工智能標準化總體宣布,我國首個大模型標準化專題組組長由上海人工智能實驗室與百度、華為、阿里等企業(yè)聯(lián)合擔任。自此,大模型的“國家隊”集結(jié)。
事實上,早在今年5月,國家就啟動了大模型標準化的相關(guān)工作,新組建的專題小組將承擔大模型的標準化制訂工作,目的是推動大模型和標準化的實踐結(jié)合,促進人工智能產(chǎn)業(yè)的健康發(fā)展。自此,喧囂半年的大模型賽道正式宣告走向標準化道路。
02 巨頭“爭鳴”,賽道競爭進入高維戰(zhàn)
2023世界人工智能大會,大模型當之無愧成為“頂流”。
百度文心、阿里通義、華為盤古,以及訊飛星火、商湯日日新、網(wǎng)易伏羲等30多個大模型悉數(shù)亮相。在大會現(xiàn)場,巨頭們紛紛拋棄概念,更近一步,秀出了各家的落地成果。
7月7日下午,華為開發(fā)者大會2023(Cloud)上,華為常務(wù)董事、華為云CEO張平安宣布,華為云盤古大模型3.0正式發(fā)布。并表示,華為的“盤古大模型很忙,忙著做事,沒有時間作詩?!贝伺e也被認為是暗指此前發(fā)布的大模型喜歡在發(fā)布會現(xiàn)場寫詩、寫散文等動作。因為華為希望用盤古大模型幫助各行各業(yè),例如金融、政務(wù)、礦山、氣象等,而非專注在語音大模型層面。
據(jù)稱,截至目前,盤古大模型已經(jīng)在氣象、醫(yī)藥研發(fā)、電力、語種等領(lǐng)域落地,并交付了多個千億參數(shù)大模型。
阿里云CTO周靖人提到,“將把促進中國大模型生態(tài)的繁榮作為首要目標,向大模型創(chuàng)業(yè)公司提供全方面的服務(wù)”。很明顯,這延續(xù)了阿里云提出的MaaS(模型即服務(wù))概念。
百度作為較早入局的玩家,其文心大模型的成果歷來受到業(yè)界關(guān)注。在本次大會上,百度首席技術(shù)官王海峰表示,現(xiàn)在百度已經(jīng)升級到文心大模型3.5。效果提升50%、訓(xùn)練速度提升2倍,推理速度提升了30倍。
除了“國家隊”消息外,諸如騰訊在內(nèi)的互聯(lián)網(wǎng)大廠也在加速大模型從概念到落地的進程。
最近20天,騰訊在大模型上的重磅消息頻傳。6月19日首次公開透露對大模型的思考,6月26日首次披露自研星脈高性能計算網(wǎng)絡(luò),7月7日,騰訊云副總裁、騰訊云智能負責(zé)人吳運聲介紹,在應(yīng)用創(chuàng)新方面,騰訊云行業(yè)大模型能力應(yīng)用到金融風(fēng)控、交互翻譯、數(shù)智人客服等場景中,提升了智能應(yīng)用效率。
可以看到,隨著廠商的迅速涌入,國內(nèi)大模型已經(jīng)快速走過了概念階段,如今各家重點均放在了如何落地,以及如何商業(yè)化上。
已經(jīng)打響的升維戰(zhàn)中,門檻抬高、難度加大。這對于任何廠商而言,都是不小的挑戰(zhàn)。
03 全方位開“卷”,搶占大模型“高地”的正確姿勢
事實上,大模型雖然很火,但從入局到真正落地并推向市場,其間難度不小,很多難點已然顯現(xiàn)。資金、人才、基礎(chǔ)設(shè)施、場景及商業(yè)化落地等,成為每個玩家都要跨過的“障礙賽”。
在大模型發(fā)展初期,就有行業(yè)人士表示“大模型是大廠的游戲”,言下之意,“大模型非常燒錢”,只有大廠能燒得起。據(jù)鈦媒體不完全統(tǒng)計,2022年,華為在研發(fā)費用上投入1615億元,成為研發(fā)投入資金最多的企業(yè);其次,騰訊以614億元、阿里以555億元排名第三。百度在過去十年,在AI領(lǐng)域的投入超過1000億元?;ヂ?lián)網(wǎng)大廠每年在研發(fā)上的投入,使其擁有了實力雄厚的研發(fā)團隊,在大模型賽道上成為當之無愧的“第一梯隊”。
但它們也不可能一味地投入而不求回報。從目前動態(tài)來看,均在加快實現(xiàn)行業(yè)落地。雄厚的資金投入研發(fā),盡快實現(xiàn)商業(yè)化,再投入到AI模型的開發(fā)的訓(xùn)練中——這是一個支撐大模型玩家的循環(huán)。
正如騰訊副總裁、騰訊政企業(yè)務(wù)總裁李強所說:“大模型時代,數(shù)據(jù)、網(wǎng)絡(luò)、算力構(gòu)成了底層基礎(chǔ)設(shè)施的‘鐵三角’?!钡瑫r他也表示,“面向垂直產(chǎn)業(yè)的模型,會是大模型價值的引爆點?!毖韵轮?,資金和技術(shù)只是進軍大模型行業(yè)的必要條件和蓄勢,真正的重頭戲還在落地層面。
人才是大模型落地競爭中極為重要的一環(huán)。
今年一季度,各家公司即開始了“搶人大戰(zhàn)”。彼時,王慧文表示愿意拿出75%的股份邀請頂級研發(fā)人才,李開復(fù)則喊話在全球范圍內(nèi)招募世界級人才,百度愿以25~40k月薪招聘AI大模型算法工程師,阿里更豪氣,愿意以40~70k月薪招聘大模型訓(xùn)練及算法工程師。同時,在某招聘網(wǎng)站上,大模型產(chǎn)品、運營崗位的薪資也達到了35~60k的月薪水平。
WAIC2023現(xiàn)場(圖:零態(tài)LT攝)
其次,算法、算力、數(shù)據(jù)等“基礎(chǔ)設(shè)施”仍是大模型的重中之重。據(jù)相關(guān)機構(gòu)對國內(nèi)外10款A(yù)I大模型的測評,整體來看,國內(nèi)大模型在詞句理解和知識題方面超越國外模型,即國產(chǎn)AI大模型對 字的基礎(chǔ)認知和學(xué)習(xí)能 較強。但同時,也應(yīng)注意到,在數(shù)據(jù)層面,大模型的發(fā)展需要高質(zhì)量的訓(xùn)練數(shù)據(jù)集。
在算力層面,雖然我國已有阿里、百度、騰訊、華為等一些頭部科技公司完成數(shù)據(jù)中心建設(shè),也不乏商湯、曠視等垂直領(lǐng)域的玩家大筆投入,但在容量上仍有不小的提升空間。
最后是落地場景和商業(yè)化方面。
不同細分場景落地、不同行業(yè)的商業(yè)化落地成本過高,也是行業(yè)共同面臨的課題。據(jù)估算,大模型訓(xùn)練一次的成本介于200萬美元~1200萬美元之間,整體上看,AI大模型的商業(yè)變現(xiàn)還需要時間。
更加務(wù)實的廠商們選擇在自己的一些優(yōu)勢領(lǐng)域發(fā)力。如騰訊在金融、教育等領(lǐng)域率先落地,一站式MaaS服務(wù)為企業(yè)減負;百度文心大模型在升級后,將成本降至過去的10%。截至目前,百度智能云與300多家生態(tài)伙伴在超過400個場景中取得不錯的測試效果。華為則在自己的政企領(lǐng)域開始奮力落地…
可以看到,這場關(guān)于未來之爭的大模型之戰(zhàn),正火力全開。
04 寫在最后
“群模大戰(zhàn)”之下,任何玩家都要抓住機會,不少人將之當作時代的紅利。這無可厚非,在這個競爭愈發(fā)激烈的賽道上,即使困難重重,國內(nèi)大模型仍朝著更完善、更務(wù)實的技術(shù)方向、商業(yè)化落地方向走去。
這種高舉高打、又落在實處的行業(yè)競爭態(tài)勢,勢必加速我國大模型技術(shù)的發(fā)展步調(diào),推動中國AI產(chǎn)業(yè)的整體技術(shù)升級。