《科創(chuàng)板日?qǐng)?bào)》3月23日訊 (記者 毛明江 黃心怡)今日,一家頗為低調(diào)的通用大模型創(chuàng)業(yè)公司,在上海舉行的2024全球開(kāi)發(fā)者先鋒大會(huì)期間正式對(duì)外亮相,在公眾面前揭開(kāi)其神秘面紗。
階躍星辰創(chuàng)始人、CEO姜大昕博士在大會(huì)開(kāi)幕式上對(duì)外發(fā)布了Step系列通用大模型,包括Step-1千億參數(shù)語(yǔ)言大模型、Step-1V千億參數(shù)多模態(tài)大模型以及Step-2萬(wàn)億參數(shù)MoE語(yǔ)言大模型預(yù)覽版。
▍技術(shù)大牛云集 以實(shí)現(xiàn)AGI為目標(biāo)
階躍星辰成立于2023年4月,聚集了多位人工智能界頂尖人才。其創(chuàng)始人和CEO是前微軟全球副總裁、微軟亞洲互聯(lián)網(wǎng)工程院首席科學(xué)家姜大昕博士,核心創(chuàng)始團(tuán)隊(duì)包括系統(tǒng)負(fù)責(zé)人朱亦博博士和數(shù)據(jù)負(fù)責(zé)人焦斌星博士。
姜大昕是自然語(yǔ)言處理領(lǐng)域的全球知名專(zhuān)家,在機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、自然語(yǔ)言處理和生物信息學(xué)等領(lǐng)域擁有豐富的研究及工程經(jīng)驗(yàn)。朱亦博擁有多次單集群萬(wàn)卡以上的系統(tǒng)建設(shè)與管理實(shí)踐經(jīng)驗(yàn)。焦斌星此前擔(dān)任微軟必應(yīng)引擎核心搜索團(tuán)隊(duì)負(fù)責(zé)人,負(fù)責(zé)利用數(shù)據(jù)挖掘和NLP算法優(yōu)化索引和搜索質(zhì)量。
據(jù)悉,階躍星辰自成立起,在算力、數(shù)據(jù)、算法和系統(tǒng)這四大要素上綜合布局,在大模型技術(shù)路徑上堅(jiān)定投入攀登Scaling Law。公司創(chuàng)始團(tuán)隊(duì)認(rèn)為,攀登Scaling Law是必須堅(jiān)持但極其艱巨的任務(wù),階躍星辰團(tuán)隊(duì)因此聚集。公司有信心在通用人工智能領(lǐng)域開(kāi)啟追趕OpenAI的競(jìng)逐。
▍官宣Step系列大模型 萬(wàn)億參數(shù)模型可預(yù)覽
雖然成立僅一年,階躍星辰團(tuán)隊(duì)對(duì)通往AGI的技術(shù)路徑,有自己獨(dú)到的深入理解。
首先堅(jiān)定相信Scaling Law是方向,參數(shù)量決定了模型智能水平的上限,因此Step-1千億參數(shù)語(yǔ)言大模型訓(xùn)練成功后,隨即開(kāi)展Step-2萬(wàn)億參數(shù)大模型的訓(xùn)練工作。
其次是認(rèn)識(shí)到多模理解和生成的統(tǒng)一是通往AGI的必經(jīng)之路。Step-1V千億參數(shù)多模態(tài)大模型,在多模理解上做到了業(yè)內(nèi)領(lǐng)先。一方面驗(yàn)證了Step-1語(yǔ)言大模型的能力,另一方面也為多模生成打下一個(gè)好基礎(chǔ)。
實(shí)測(cè)是檢驗(yàn)大模型能力的最好方式。在中國(guó)權(quán)威的大型模型評(píng)估平臺(tái)“司南”(OpenCompass)多模態(tài)模型評(píng)測(cè)榜單中,階躍星辰研發(fā)的Step-1V 千億參數(shù)多模態(tài)大模型位列第一,性能比肩 GPT-4V。Step-1V的多模理解能力突出,可以精準(zhǔn)描述和理解圖像中的文字、數(shù)據(jù)、圖表等信息,并根據(jù)圖像信息實(shí)現(xiàn)內(nèi)容創(chuàng)作、邏輯推理、數(shù)據(jù)分析等多項(xiàng)任務(wù)。此外,Step-1V亦可實(shí)現(xiàn)視頻理解。
千億參數(shù)模型只是階躍星辰團(tuán)隊(duì)在攀登通用人工智能路上邁出的第一步。此次階躍星辰還發(fā)布了Step-2 萬(wàn)億參數(shù)語(yǔ)言大模型預(yù)覽版,提供API接口給部分合作伙伴試用。
Step-2萬(wàn)億參數(shù)語(yǔ)言大模型采用 MoE 架構(gòu),聚焦深度智能的探索。據(jù)了解,參數(shù)量從千億到萬(wàn)億,增長(zhǎng)了一個(gè)數(shù)量級(jí),對(duì)算力、系統(tǒng)、數(shù)據(jù)、算法四個(gè)方面都提出了極高的要求,業(yè)內(nèi)只有極少數(shù)公司能做到。訓(xùn)練萬(wàn)億參數(shù)模型體現(xiàn)了階躍星辰的核心技術(shù)能力,也說(shuō)明了公司探索通用人工智能的決心。
▍自有+合作 探索C端應(yīng)用
當(dāng)下,模型能力決定了AI應(yīng)用水平的上限,同時(shí)也將創(chuàng)造全新的應(yīng)用機(jī)會(huì)。階躍星辰在此方面通過(guò)自有產(chǎn)品和合作產(chǎn)品兩種方式,展開(kāi)了積極探索。團(tuán)隊(duì)研發(fā)并推出了兩款面向C端用戶的大模型產(chǎn)品——效率工具“躍問(wèn)”和AI開(kāi)放世界平臺(tái)“冒泡鴨”。均已全面開(kāi)放使用。
此外階躍星辰在金融、網(wǎng)絡(luò)文學(xué)、知識(shí)服務(wù)等領(lǐng)域已與合作伙伴達(dá)成深度合作,共同探索面向C端用戶的創(chuàng)新應(yīng)用。
在金融領(lǐng)域,階躍星辰與上海報(bào)業(yè)旗下界面財(cái)聯(lián)社達(dá)成深度合作,雙方圍繞 AIGC 財(cái)經(jīng)資訊、智能投研、智能投顧等領(lǐng)域推進(jìn)大模型的應(yīng)用落地。在網(wǎng)絡(luò)文學(xué)領(lǐng)域,階躍星辰與中文在線獨(dú)家達(dá)成深度戰(zhàn)略合作,共同探索大模型在靈感激發(fā)、內(nèi)容創(chuàng)作等網(wǎng)絡(luò)文學(xué)創(chuàng)作領(lǐng)域的應(yīng)用。在知識(shí)服務(wù)領(lǐng)域,階躍星辰與中國(guó)知網(wǎng)、中文在線達(dá)成戰(zhàn)略合作,圍繞大眾知識(shí)服務(wù)等場(chǎng)景研究和推進(jìn)大模型的應(yīng)用。
“智能階躍,十倍每一個(gè)人的可能”,是階躍星辰的企業(yè)slogan。當(dāng)下,大模型技術(shù)的研發(fā)和落地應(yīng)用仍在快速迭代和探索中,圍繞這一前沿技術(shù),聚集最頂尖的人才與豐厚的戰(zhàn)略資源,無(wú)疑是大模型創(chuàng)業(yè)公司的核心競(jìng)爭(zhēng)力。
階躍星辰在這樣的大環(huán)境下從幕后走向臺(tái)前,正式亮相并發(fā)布了一系列重要模型與產(chǎn)品,釋放出公司管理層的技術(shù)理念與追求:實(shí)現(xiàn)通用人工智能或許并不遙遠(yuǎn)。