文|慢放
隨著「百模大戰(zhàn)」進(jìn)入深水區(qū),國內(nèi)的科技巨頭、互聯(lián)網(wǎng)大廠、AIGC創(chuàng)企及行業(yè)龍頭紛紛遞交了最新答卷。
10月31日,阿里云不僅推出最新通義千問大模型2.0版本,還推出了八大行業(yè)大模型、大模型應(yīng)用開發(fā)平臺(tái),并從AI基礎(chǔ)設(shè)施層面全方位布局,本次發(fā)布可謂阿里云的AI「全家桶」爆發(fā)。
而不久之前,百度除了正式發(fā)布文心一言4.0版本外,包括新搜索、新地圖、新文庫等數(shù)十款百度AI原生應(yīng)用「全家桶」也正式亮相。
那么面向AI浪潮,阿里云與百度雙方的大模型產(chǎn)品及實(shí)力如何?將在大模型方面有哪些新布局?誰更有望為AI大模型產(chǎn)業(yè)化落地提供更好的底座支持?
本文通過對(duì)雙方AI「全家桶」的產(chǎn)品、底層算力、行業(yè)應(yīng)用與生態(tài)等方面進(jìn)行深入對(duì)比探討,試圖解答上述疑問,為國內(nèi)已經(jīng)布局大模型或者準(zhǔn)備應(yīng)用大模型的企業(yè),提供發(fā)展模式與方向。
Part 01、大模型“全家桶”PK
10月31日,阿里云正式發(fā)布了千億級(jí)參數(shù)大模型通義千問2.0,同時(shí)扔出一個(gè)AI「全家桶」,從IaaS(基礎(chǔ)設(shè)施即服務(wù))、PaaS(平臺(tái)即服務(wù))和MaaS(模型即服務(wù))全方位秀出“肌肉”。
相比4月發(fā)布的1.0版本,新版本在復(fù)雜指令理解、文學(xué)創(chuàng)作、通用數(shù)學(xué)、知識(shí)記憶、幻覺抵御等能力上均有顯著提升。在10個(gè)權(quán)威測評(píng)中,通義千問2.0綜合性能超過GPT-3.5,正在加速追趕GPT-4。此外,通義千問APP在各大手機(jī)應(yīng)用市場正式上線,所有人都可通過APP直接體驗(yàn)最新模型能力。
與此同時(shí),為推動(dòng)大模型更易在千行百業(yè)集成落地,基于通義大模型訓(xùn)練的8大行業(yè)模型組團(tuán)上線,主要包括通義靈碼-智能編碼助手,通義智文-AI閱讀助手,通義聽悟-工作學(xué)習(xí)AI助手,通義星塵-個(gè)性化角色創(chuàng)作平臺(tái),通義點(diǎn)金-智能投研助手,通義曉蜜-智能客服,通義仁心-個(gè)人專屬健康助手,通義法睿-AI法律顧問。
盡管阿里云這次發(fā)布了八大產(chǎn)品模型,但阿里云CTO周靖人強(qiáng)調(diào),阿里云此舉并非為了直接To C提供服務(wù),而是To B。做行業(yè)模型,更多是像個(gè)面向客戶的Demo,讓客戶先了解到大模型能做什么。
在令人眼花繚亂的各類產(chǎn)品發(fā)布背后,阿里云面向AI時(shí)代其實(shí)已經(jīng)做出了堅(jiān)定選擇——做AI時(shí)代的基礎(chǔ)設(shè)施、開源路線、開放平臺(tái)。
除了阿里云在10月提交了一份新答卷之外,國內(nèi)各家大模型廠商也紛紛拿出通用大模型的新版本,試圖一較高下,例如騰訊、百度、訊飛、智譜、百川......
其中,早在半個(gè)月前——10月17日,百度發(fā)布了文心一言4.0版本,新版本在理解、生成、邏輯、記憶四大能力都有顯著提升。其中理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達(dá)到理解的近3倍,記憶的提升幅度也達(dá)到了理解的2倍多。百度基于文心大模型研制了智能代碼助手Comate,從內(nèi)部應(yīng)用效果來看,整體的代碼采納率達(dá)到40%,高頻用戶的代碼采納率達(dá)到60%。
此外,包括新搜索、新地圖、新文庫等數(shù)十款百度AI原生應(yīng)用“全家桶”也正式亮相,備受外界關(guān)注。
從產(chǎn)品角度來看,阿里云和百度都推出了大模型的新版本,并且在不同領(lǐng)域都擁有一定優(yōu)勢。阿里云的通義千問2.0版本在大模型能力和行業(yè)應(yīng)用方面表現(xiàn)突出,而百度文心一言4.0版本則在語言理解、生成和邏輯能力方面更優(yōu)異。
不過有意思的是,百度似乎對(duì)自己的技術(shù)實(shí)力更自信,起碼在對(duì)外宣傳的口徑上是這樣。周靖人在云棲大會(huì)上表示,通義千問2.0綜合性能超過GPT-3.5。而百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏宣稱文心一言4.0綜合水平與GPT-4相比已經(jīng)毫不遜色。
Part 02、大模型背后的AI基礎(chǔ)設(shè)施
大模型的發(fā)展需要更強(qiáng)壯的AI基礎(chǔ)設(shè)施,基礎(chǔ)設(shè)施主要是兩個(gè)核心部分構(gòu)成——芯片與云。
首先由于大模型需要大量的計(jì)算資源和存儲(chǔ)空間,因此需要高性能的芯片來支持其運(yùn)行。
飛天芯片是阿里云自主研發(fā)的大規(guī)模分布式AI芯片,專為云計(jì)算和大數(shù)據(jù)處理而設(shè)計(jì)。它采用了一種新型的架構(gòu)設(shè)計(jì),可支持多種深度學(xué)習(xí)框架,包括TensorFlow、PyTorch等。飛天芯片不僅僅是一顆芯片,它還內(nèi)置了阿里云自研的云操作系統(tǒng),可以與阿里云的其他產(chǎn)品和服務(wù)無縫集成,提供一體化的解決方案。
昆侖芯片則是百度自主研發(fā)的AI加速器芯片,專注于高性能計(jì)算和智能推斷。它采用了高性能計(jì)算架構(gòu),可實(shí)現(xiàn)高能效比和低功耗。昆侖芯片支持多種數(shù)據(jù)類型,包括圖像、語音、自然語言等,適用于多種AI應(yīng)用場景。
飛天芯片和昆侖芯片都具有強(qiáng)大的計(jì)算能力。飛天芯片的分布式計(jì)算能力使其在處理大規(guī)模數(shù)據(jù)時(shí)具有顯著優(yōu)勢,并且支持大容量內(nèi)存和分布式存儲(chǔ),可滿足云計(jì)算和大數(shù)據(jù)處理的需求。而昆侖芯片的高性能計(jì)算架構(gòu)則使其在推斷等計(jì)算密集型任務(wù)中表現(xiàn)出色。同時(shí)昆侖芯片采用了高速緩存和優(yōu)化存儲(chǔ)技術(shù),提高了數(shù)據(jù)處理速度和效率。
3月17日,李彥宏在亞布力中國企業(yè)家論壇上分享,昆侖芯片現(xiàn)在很適合做大模型的推理,將來會(huì)適合做訓(xùn)練。
其次大模型的實(shí)質(zhì)是一場“云計(jì)算之爭”。
在這場爭奪中,阿里云是國內(nèi)最早布局云計(jì)算的平臺(tái)之一,可謂是國內(nèi)云計(jì)算領(lǐng)域的先驅(qū)?;厮葜潦嗄昵埃⒗镌圃谠朴?jì)算和大數(shù)據(jù)尚未成為主流的年代,就堅(jiān)信云計(jì)算的重要性,并開始著手布局。當(dāng)時(shí),很多國內(nèi)技術(shù)公司認(rèn)為“做云還太早”、“云只是舊瓶裝新酒”,但阿里云選擇了堅(jiān)定的信念:“必須要做,客戶需要,市場需要”,“每年給阿里云投10個(gè)億,投個(gè)十年,做不出來再說”。
如今,云計(jì)算不僅成為全社會(huì)重要的基礎(chǔ)設(shè)施,也為今天熱潮翻涌的AI大模型創(chuàng)新提供算力底座。而阿里巴巴完整的AI技術(shù)體系,正是建立于自研云計(jì)算的基礎(chǔ)之上。根據(jù)IDC相關(guān)報(bào)告,2022年下半年,中國公有云市場上,阿里云的市場份額為31.9%,排名第一。
在云棲大會(huì)上,阿里云針對(duì)大模型升級(jí)了AI基礎(chǔ)設(shè)施,提供更高性能、更低成本的智能算力。周靖人介紹稱,全新升級(jí)的阿里云人工智能平臺(tái)PAI,底層采用HPN 7.0新一代AI集群網(wǎng)絡(luò)架構(gòu),高效協(xié)同調(diào)度各類芯片,可支持高達(dá)10萬卡量級(jí)的集群可擴(kuò)展規(guī)模,讓超大集群像一臺(tái)計(jì)算機(jī)般高效運(yùn)轉(zhuǎn)。
據(jù)了解,阿里云PAI可支撐多個(gè)萬億參數(shù)大模型同時(shí)訓(xùn)練,超大規(guī)模分布式訓(xùn)練加速比高達(dá)96%,遠(yuǎn)超業(yè)界水平;在大模型訓(xùn)練任務(wù)中,更可節(jié)省超過50%算力資源,性能全球領(lǐng)先。
從業(yè)績看,百度云則發(fā)力較晚,在2018年第四季度才開始公布業(yè)績。據(jù)百度財(cái)報(bào)顯示,百度云2019年實(shí)現(xiàn)營收46.5億元,2021年則實(shí)現(xiàn)營收151億元,兩年增長224.73%。2023年二季度,百度智能云收入45億元,同比增長5%。李彥宏在財(cái)報(bào)電話會(huì)上透露,繼一季度首次盈利后,本季度,百度智能云再次盈利。不過,與一季度一樣,百度并沒有給出具體數(shù)據(jù)。
百度云的優(yōu)勢則在于其搜索引擎所擁有的海量數(shù)據(jù),側(cè)重于融合AI能力,將AI技術(shù)與云基礎(chǔ)設(shè)施服務(wù)相結(jié)合,聚焦智能服務(wù)突出差異化,基于“云智一體”的技術(shù)和產(chǎn)品,在制造、金融、能源等領(lǐng)域積極實(shí)踐。
百度創(chuàng)始人李彥宏將大模型視為改變?cè)朴?jì)算市場游戲規(guī)則的存在,而阿里董事會(huì)主席兼CEO張勇則將大降價(jià)、聯(lián)合伙伴推動(dòng)大模型落地、產(chǎn)品被集成作為關(guān)鍵的“三板斧”。
隨著時(shí)間的推進(jìn),2023年云廠商們相較于2022年的“保守”狀態(tài),已經(jīng)開始了奔跑,預(yù)示著這個(gè)市場將迎來一場激烈的競爭。
Part 03、大模型的商業(yè)化解法,已告別免費(fèi)時(shí)代
如今,大模型競爭已經(jīng)進(jìn)入第二階段——拼落地、拼應(yīng)用、拼商業(yè)化。
阿里云積極推動(dòng)大模型在各行業(yè)的落地,已經(jīng)與60多個(gè)行業(yè)頭部伙伴進(jìn)行深度合作,通義千問已經(jīng)在辦公、文旅、電力、政務(wù)、醫(yī)保、交通、制造、金融、軟件開發(fā)等領(lǐng)域落地。早在今年9月,阿里集團(tuán)CEO吳泳銘在全員信中表示,要讓阿里各個(gè)場景都變成AI技術(shù)的應(yīng)用場。如今,淘寶天貓、釘釘、天貓精靈、斑馬智行等均接入通義千問大模型,先后發(fā)布了適合各自業(yè)務(wù)場景的AI應(yīng)用。
百度也展示了文心一言在商業(yè)化方面的成果。自8月31日文心一言面向全社會(huì)開放以來,其用戶規(guī)模已經(jīng)達(dá)到4500萬,開發(fā)者5.4萬,場景4300個(gè),應(yīng)用825個(gè),插件超過500個(gè)。此外,百度還推出了會(huì)員模式,開通后可解鎖文心大模型4.0。
在世界大會(huì)上,百度千帆還推出了自己的“App Store”——AI原生應(yīng)用商店,為基于文心大模型開發(fā)的應(yīng)用提供了交易平臺(tái)。目前,應(yīng)用商店已經(jīng)針對(duì)智能辦公、營銷服務(wù)、行業(yè)職能、生產(chǎn)提效、分析決策5個(gè)場景上線了百度自研以及客戶開發(fā)的AI應(yīng)用。
顯而易見,大模型與行業(yè)的融合發(fā)展已是主要趨勢,具體的場景還在逐步探索,一批典型案例則已經(jīng)發(fā)布。
李彥宏提到,百度正在大力推動(dòng)數(shù)字技術(shù)與實(shí)體經(jīng)濟(jì)的深度融合。大模型技術(shù)已應(yīng)用在制造、能源、電力、化工、交通等實(shí)體產(chǎn)業(yè)中,他認(rèn)為,“大模型正成為新型工業(yè)化的重要推動(dòng)力。例如,百度與浦發(fā)銀行合作推出了智能客服“小浦”,與吉利汽車合作推出了智能駕駛“銀河”。同時(shí),百度還通過開源的方式向公眾開放文心一言4.0版本,以推動(dòng)大模型技術(shù)的普及和應(yīng)用。
阿里云則將大模型應(yīng)用于電商、金融、制造等領(lǐng)域。例如,阿里云與美的集團(tuán)合作推出了智能家居“美的美居”,與吉利汽車合作推出了智能駕駛“斑馬智行”。此外,阿里云還通過與政府、高校和其他企業(yè)合作的方式,推動(dòng)大模型技術(shù)的普及和應(yīng)用。
此外在商業(yè)辦公方面,雙方也有諸多的應(yīng)用落地。
今年4月18日,釘釘宣布接入阿里巴巴的通義千問大模型,表態(tài)將用大模型把釘釘重做一遍。當(dāng)時(shí),釘釘發(fā)布了一個(gè)AI“魔法棒”,演示了聊天、文檔、音視頻會(huì)議等4大高頻場景中的智能化應(yīng)用。4個(gè)月后,釘釘在生態(tài)大會(huì)上交出了新的答卷。葉軍稱,釘釘已有17條產(chǎn)品線、55個(gè)場景全面接入大模型,實(shí)現(xiàn)智能化改造。
百度的辦公軟件如流則可以針對(duì)群聊信息多的辦公痛點(diǎn),“一秒劃重點(diǎn)”,差旅助手不僅能訂機(jī)票酒店,甚至還能通過接入CRM等公司系統(tǒng),總結(jié)出拜訪客戶的背景資料和談話參考。最新發(fā)布的商業(yè)辦公工具GBI可以通過自然語言進(jìn)行交流使用,主要針對(duì)商業(yè)辦公場景,例如快速進(jìn)行工程報(bào)價(jià)計(jì)算、完成商業(yè)競價(jià)方案等。
經(jīng)歷了10月份的密集更新后,國內(nèi)大模型產(chǎn)品也在積極探索商業(yè)化,或?qū)⒏鎰e免費(fèi)時(shí)代。
11月1日,百度正式上線文心一言專業(yè)版,定價(jià)59.9元/月,連續(xù)包月優(yōu)惠價(jià)為49.9元/月,同時(shí)還推出文心一言和文心一格的聯(lián)合會(huì)員,價(jià)格為99元/月。這也成為國內(nèi)首個(gè)采用會(huì)員模式面向C端收費(fèi)的大模型產(chǎn)品。
此前,釘釘也公布大模型落地應(yīng)用場景的商業(yè)化方案,在專業(yè)版年費(fèi)9800元基礎(chǔ)上,增加1萬至2萬元即可獲得一定的大模型調(diào)用額度次數(shù)。
可以看出,生成式AI產(chǎn)品的收費(fèi)已經(jīng)是大勢所趨。這是因?yàn)橛?xùn)練和運(yùn)行大型模型需要大量的計(jì)算資源,包括高性能服務(wù)器、大規(guī)模數(shù)據(jù)集和專業(yè)的算法工程師團(tuán)隊(duì)。因此,沒有任何一家企業(yè)能夠持續(xù)地提供免費(fèi)服務(wù)。
實(shí)際上,在生成式AI的商業(yè)化落地方面,國外的AI巨頭已經(jīng)采取了行動(dòng)。
例如,今年2月,OpenAI推出了ChatGPT的付費(fèi)訂閱版——ChatGPT Plus,每月收費(fèi)為20美元。而微軟在9月21日宣布,Microsoft 365 Copilot將于11月1日起向企業(yè)用戶提供服務(wù)。這項(xiàng)服務(wù)將為Word、Excel、PowerPoint等應(yīng)用添加生成式AI功能,每個(gè)用戶每月需要支付30美元的費(fèi)用,按年付費(fèi)。
總體來說,阿里云和百度都在大模型的行業(yè)應(yīng)用和商業(yè)化方面取得了一定的成果。阿里云的通義千問2.0版本在辦公、文旅、電力等多個(gè)領(lǐng)域都有成功的應(yīng)用案例,而百度則通過文心一言在搜索、地圖、文庫等領(lǐng)域?yàn)橛脩籼峁┝烁悄艿姆?wù)。
Part 04、關(guān)鍵較量:生態(tài)系統(tǒng)的構(gòu)建和優(yōu)化
最終,在大模型的競賽中,關(guān)鍵的較量在于生態(tài)系統(tǒng)的構(gòu)建和優(yōu)化。
先從宏觀的愿景來看,阿里云要“打造一朵AI時(shí)代最開放的云”,百度移動(dòng)生態(tài)決定開啟大模型的下一程,“從AI人人可用,到生態(tài)共榮”。
10月31日,阿里巴巴董事會(huì)主席蔡崇信在云棲大會(huì)開幕式上致辭。“開放”成為其致詞中最高頻的詞語。他堅(jiān)信“不開放就沒有生態(tài),沒有生態(tài)就沒有未來?!?/p>
再從微觀數(shù)據(jù)來看,中國超過一半的大模型公司都在阿里云上運(yùn)行,包括百川智能、智譜AI、零一萬物、昆侖萬維、vivo、復(fù)旦大學(xué)等。截至目前,中國眾多頭部主流大模型都已通過阿里云對(duì)外提供API服務(wù),包括通義系列、Baichuan系列、智譜AIChatGLM系列、姜子牙通用大模型等,大模型廠商與阿里云一同面向客戶。
在國內(nèi),阿里云是頭部大廠中最早做模型開源的公司,堅(jiān)定選擇開源開放。從今年8月開始,阿里云陸續(xù)開源了通義千問7B、14B參數(shù)的通用模型與對(duì)話模型。在今年云棲大會(huì)上,周靖人再次宣布通義千問72B模型即將開源,將成為中國參數(shù)最大的開源模型。
值得一提的是,阿里云自研大模型與第三方模型并非競爭關(guān)系。恰恰相反,阿里云為所有大模型提供開放的社區(qū),還提供免費(fèi)的GPU算力幫助開發(fā)者去體驗(yàn)三方大模型,截至目前阿里云已免費(fèi)提供超3000萬小時(shí)的免費(fèi)GPU算力。
大模型也在反哺阿里云,阿里云成為一朵走向“自動(dòng)駕駛”的云。周靖人表示,“基于阿里云通義大模型,我們對(duì)云上產(chǎn)品也進(jìn)行了AI化改造,超過30款云產(chǎn)品具備了大模型的能力,帶來了開發(fā)效率的大幅提升?!?/p>
此外,阿里云還發(fā)布了一款A(yù)I開源社區(qū)“魔搭”,短短一年后便匯聚了280萬開發(fā)者、2300多個(gè)優(yōu)質(zhì)模型以及超過一億的AI模型下載量。這些成果展示了阿里云在大模型領(lǐng)域的領(lǐng)先地位和強(qiáng)大的生態(tài)優(yōu)勢。
周靖人表示,阿里云要通過訓(xùn)練及推理平臺(tái)PAI、開放的模型社區(qū)魔搭、一站式模型服務(wù)平臺(tái)“百煉”,來系統(tǒng)地服務(wù)和滿足大模型生態(tài)中所有人的需求,共同促進(jìn)生態(tài)繁榮。
隨著大模型應(yīng)用落地進(jìn)入下半場,百度也在不斷發(fā)力“大模型生態(tài)”的建設(shè)?!拔覀兿M@片土壤可以'長出'更多樹、更多花、更多草。”百度集團(tuán)資深副總裁、百度移動(dòng)生態(tài)事業(yè)群組總經(jīng)理何俊杰表示。
至今,百度的內(nèi)容生態(tài)已有64萬創(chuàng)作者使用AI工具生產(chǎn)了1400萬條內(nèi)容 , 獲得300億播放量。在商業(yè)生態(tài),目前“輕舸”已經(jīng)覆蓋400余家企業(yè),平均廣告創(chuàng)編時(shí)間由2小時(shí)縮短到5分鐘,平均轉(zhuǎn)化量提升10%。
今年9月,百度還正式發(fā)布了文心一言插件生態(tài)平臺(tái)——靈境矩陣。李彥宏表示,插件是?種特殊的AI原?應(yīng)?,也是?檻最低,最容易上?的AI原?應(yīng)?,能讓開發(fā)者、創(chuàng)業(yè)者快速加?到?態(tài)中。目前,靈境插件平臺(tái)已有2.7萬開發(fā)者申請(qǐng)入駐,覆蓋20多個(gè)領(lǐng)域。千帆大模型平臺(tái)有42個(gè)主流大模型入駐,有17000家企業(yè)客戶,覆蓋了各行各業(yè)的近500個(gè)場景。這些展示了百度智能云在大模型領(lǐng)域的實(shí)力和生態(tài)建設(shè)成果。
此外,在2023百度云智大會(huì)上,百度發(fā)布了四個(gè)生態(tài)伙伴支持計(jì)劃,包括與10+綜合伙伴共同成長、與100+應(yīng)用伙伴專項(xiàng)發(fā)展、與10000+創(chuàng)新企業(yè)應(yīng)用服務(wù)以及代理伙伴轉(zhuǎn)型升級(jí)計(jì)劃。
雙方對(duì)比分析來看,在生態(tài)建設(shè)方面,阿里云通過打造開源社區(qū)、匯聚大量開發(fā)者、推出優(yōu)質(zhì)模型等舉措,形成了強(qiáng)大的生態(tài)優(yōu)勢。而百度智能云則通過發(fā)布四個(gè)生態(tài)伙伴支持計(jì)劃、搭建插件平臺(tái)與大模型平臺(tái)等手段,積極構(gòu)建大模型的生態(tài)體系。
在合作模式方面,阿里云注重與合作伙伴的協(xié)同創(chuàng)新,通過共同研發(fā)、優(yōu)化和推廣大模型應(yīng)用來實(shí)現(xiàn)合作共贏。而百度智能云則更加注重與產(chǎn)業(yè)鏈上下游企業(yè)的合作,通過發(fā)布綜合伙伴共同成長計(jì)劃、應(yīng)用伙伴專項(xiàng)發(fā)展計(jì)劃等舉措,建立起了較為完善的大模型合作體系。
結(jié)語
2023年,云計(jì)算市場以及大模型之戰(zhàn)中,依然充滿了不確定性,但確定的是,隨著大模型進(jìn)入下半場,國內(nèi)市場會(huì)帶來新的一輪角逐。而阿里云與百度仍然有著毫無爭議的身位優(yōu)勢,這些優(yōu)勢中既包括云計(jì)算軟硬件系統(tǒng)的技術(shù)研發(fā)能力,也包括盈利能力。
且看大模型的下半場,阿里云與百度誰更勝一籌。
參考資料:
阿里云丨通義星塵、通義靈碼、鎮(zhèn)岳510……一文了解云棲重大發(fā)布!
百度智能云丨百度袁佛玉:大模型時(shí)代,生態(tài)變革前夜
和訊網(wǎng)丨百度世界大會(huì)發(fā)布文心大模型4.0,李彥宏花式秀“AI全家桶”
深淺atom丨智能云:百度的第二曲線,沈抖的關(guān)鍵一戰(zhàn)
琶洲派丨百度文心一言開始收費(fèi),大模型迎來收費(fèi)時(shí)代?
甲子光年丨開源與開放,阿里云的大模型解法