10月24日,第七屆世界聲博會暨2024科大訊飛全球1024開發(fā)者節(jié)開幕式上,訊飛星火4.0 Turbo如約而至。
為了第一時間獲得相關(guān)信息,萬千開發(fā)者匯聚在合肥體育中心。最受關(guān)注的原因,在于訊飛星火不同于其他許多大模型——它是國內(nèi)第一個、也是唯一一個基于全國產(chǎn)算力底座訓(xùn)練出的大模型。
早在2023年上半年,科大訊飛就與華為組建了聯(lián)合特戰(zhàn)隊(duì),就大模型底座能力進(jìn)行高強(qiáng)度的攻關(guān)訓(xùn)練;2023年10月24日,科大訊飛又?jǐn)y手華為,宣布首個支撐萬億參數(shù)大模型訓(xùn)練的萬卡國產(chǎn)算力平臺“飛星一號”正式啟用。
從這個角度而言,訊飛星火的模型能力,不僅是國產(chǎn)AI產(chǎn)業(yè)發(fā)展實(shí)力的一個側(cè)影,也是國產(chǎn)算力產(chǎn)業(yè)的實(shí)力體現(xiàn)。
而本次科大訊飛不負(fù)所望發(fā)布了多項(xiàng)性能位居行業(yè)前列的星火4.0 Turbo。不僅如此,科大訊飛還宣布聯(lián)合華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營有限公司三方打造的國產(chǎn)超大規(guī)模智算平臺“飛星二號”正式啟動。
這也意味著國產(chǎn)大模型的技術(shù)升級與落地攻堅(jiān)戰(zhàn),又進(jìn)入了新的階段。
攜手華為,為國產(chǎn)算力“拓荒”
在發(fā)布會現(xiàn)場,科大訊飛董事長劉慶峰不僅發(fā)布了訊飛星火4.0 Turbo,還首發(fā)了10項(xiàng)基于訊飛星火底座能力的硬核產(chǎn)品與創(chuàng)新應(yīng)用,如超擬人數(shù)字人、星火多語言大模型、訊飛星火醫(yī)學(xué)影像大模型等等,堪稱是一場從底層技術(shù)能力到場景落地全面上新的AI盛會。
成績絕非輕易得來。眾所周知,人工智能的模型效果取決于三大要素,算力、算法、數(shù)據(jù)。在至關(guān)重要的算力領(lǐng)域,海外芯片企業(yè)掌握著絕對的市場主導(dǎo)權(quán)。
這也是大模型爆發(fā)一年多以來,國內(nèi)各大模型廠商們紛紛下場競購英偉達(dá)、AMD等企業(yè)產(chǎn)品,將寶貴的發(fā)展資金拱手予人的原因。甚至在2023年時,曾經(jīng)出現(xiàn)過單片英偉達(dá)A100芯片售價高達(dá)超10萬元的荒誕情節(jié)。
然而,在大模型這場權(quán)力之爭中,從一開始,科大訊飛就想要把任何可能左右模型能力的要素,都緊握在自己的“手里”。正是在這樣的背景下,訊飛與華為攜手,讓訊飛星火大模型從一開始就在國產(chǎn)算力底座上完成訓(xùn)練。
2023年10月24日,兩家企業(yè)攜手宣布首個全國產(chǎn)萬卡算力集群“飛星一號”平臺正式上線,旨在支撐萬億參數(shù)大模型訓(xùn)練。
不同于市場上已有一定成熟度的算力平臺,此前踏足全國產(chǎn)智算算力平臺領(lǐng)域的玩家少之又少,這也意味著訊飛與華為需要不斷試錯。
劉慶峰透露,“飛星一號”平臺上線以來的一年時間里,科大訊飛攜手華為攻克了很多“疑難雜癥”,在昇騰910B的基礎(chǔ)上,解決了500多次以上的基礎(chǔ)軟硬件問題和模型適配問題。
不過,兩者的探索也取得了傲人的成績,如今基于昇騰生態(tài)的大模型訓(xùn)練效果,已經(jīng)有了大幅提升。
可以說在國產(chǎn)算力上,針對大模型和人工智能最前沿的很多無人區(qū)問題,90%都是由訊飛與華為共同發(fā)現(xiàn)并解決的。本次科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營有限公司三方聯(lián)合打造的國產(chǎn)超大規(guī)模智算平臺“飛星二號”,旨在走得更遠(yuǎn),不僅要推動算力規(guī)模從萬卡向萬P發(fā)展,還要在自主可控的底座與平臺之上,進(jìn)一步推進(jìn)AI落地和真正普惠。
聯(lián)手華為,解開央國企AI落地之痛
不僅是技術(shù)研發(fā)層面的攜手并進(jìn),訊飛與各大合作伙伴還從場景層面出發(fā),共同推進(jìn)大模型技術(shù)的實(shí)際落地應(yīng)用,在各個領(lǐng)域打磨案例。數(shù)據(jù)顯示,科大訊飛是今年1-9月份大模型市場中標(biāo)數(shù)量、中標(biāo)金額第一的廠商。作為國內(nèi)采用國產(chǎn)算力底座的大模型,訊飛星火天然在能源、金融、通信等安全要求極高的領(lǐng)域擁有著落地優(yōu)勢,已經(jīng)拿下了多個優(yōu)質(zhì)的央國企標(biāo)的。實(shí)際上,近期最新發(fā)布的許多通用大模型背后,都有訊飛星火的身影。比如科大訊飛聯(lián)手中國石油、中國移動、華為共建的昆侖大模型;攜手中國海油、中國電信打造的“海能”人工智能模型;以及攜手中國綠發(fā)打造的泰山大模型。
還有越來越多的央國企客戶開始積極為訊飛星火帶來的效率提升“買單”。央國企客戶數(shù)據(jù)顯示,基于訊飛的SFT數(shù)據(jù)工具鏈,原先至少需要1-2個月時間來構(gòu)建的50萬條高質(zhì)量數(shù)據(jù),現(xiàn)在僅需兩周就能完成。訊飛星火建立了場景優(yōu)化工具鏈,5大類13種場景可實(shí)現(xiàn)自適應(yīng)模板匹配訓(xùn)練,平均效果提升30%。切實(shí)為客戶提質(zhì)增效。在社會民生領(lǐng)域,訊飛星火大模型同樣在深入生活,逐步實(shí)現(xiàn)AI普惠的夢想。比如在發(fā)布會上,科大訊飛展示了與華為聯(lián)合研發(fā)的聲音修復(fù)技術(shù)。根據(jù)演示,中國殘疾人藝術(shù)團(tuán)知名舞蹈演員魏菁陽在該技術(shù)的幫助下,可以清晰表達(dá)出自己的意思,一掃因天生聽力缺陷造成的障礙。
可以說科大訊飛與華為的攜手共創(chuàng)之下,B端和C端的大模型應(yīng)用落地正在齊頭并進(jìn)。上述聲音修復(fù)技術(shù)也已在搭載鴻蒙系統(tǒng)的移動終端中上線,讓過往“不被看見”的人群,能手握一把與人溝通的鑰匙。
生態(tài)是AI創(chuàng)新之匙
會上,劉慶峰講道:“今天人工智能的發(fā)展絕不是只有科大訊飛一家,只有生態(tài)的繁榮才有人工智能的大未來。”因?yàn)樯钪O獨(dú)木不成林的道理,與不同產(chǎn)業(yè)鏈環(huán)節(jié)合作伙伴的攜手并進(jìn)已經(jīng)寫進(jìn)了科大訊飛的大模型發(fā)展戰(zhàn)略之中。「電廠」獲知,除華為之外,科大訊飛與中國移動、中國電信等運(yùn)營商也已達(dá)成深度合作關(guān)系,推動國產(chǎn)大模型產(chǎn)業(yè)鏈發(fā)展加速。此外,科大訊飛還在通過各種方式,持續(xù)為各行業(yè)合作伙伴賦能。
據(jù)劉慶峰分享,接下來公司還計(jì)劃開放科大訊飛全場景資源助力開發(fā)者,不僅在開發(fā)環(huán)節(jié)助力開發(fā)者,更要賦能后者完成從產(chǎn)品開發(fā)到商業(yè)成功的跨越。此外,科大訊飛將牽頭成立AI基金,用5億創(chuàng)業(yè)基金推動開發(fā)者創(chuàng)業(yè),加速前沿技術(shù)產(chǎn)業(yè)化進(jìn)程,并與地方政府聯(lián)合為AI創(chuàng)業(yè)團(tuán)隊(duì)提供產(chǎn)業(yè)落地支撐。訊飛與華為等合作伙伴的深入合作,不僅切實(shí)滿足了許多行業(yè)和領(lǐng)域的需求,更為國產(chǎn)自主的大模型產(chǎn)業(yè)鏈樹立了新范式?!皼]有成功的企業(yè),只有時代的企業(yè)”,科大訊飛對國產(chǎn)大模型生態(tài)的押注,也是響應(yīng)時代呼喚國產(chǎn)自主、安全可控的回響。劉慶峰將國內(nèi)人工智能產(chǎn)業(yè)的發(fā)展總結(jié)為五個關(guān)鍵詞:頂天立地、自主可控、通專結(jié)合、端云聯(lián)動、軟硬一體。他說道:“堅(jiān)持這五個關(guān)鍵點(diǎn),我們的人工智能就有大未來。不論是訊飛、華為代表的企業(yè),還是萬千投身于模型生態(tài)建設(shè)的開發(fā)者,“大未來”的時代脈搏,正跳動在每一個主體的身上。