文|獵云網(wǎng) 王非
距4月14日雷軍官宣殺入大模型不到4個月,小米大模型終于首次曝光,并交出了一份初步成績單。
多方消息顯示,小米大模型MiLM-6B現(xiàn)身C-Eval、CMMLU大模型評測榜單。
根據(jù)GitHub項目頁給出的信息,MiLM-6B(下稱:小米大模型)是由小米開發(fā)的一個大規(guī)模預訓練語言模型,參數(shù)規(guī)模為64億。
相關頁面顯示,小米大模型在C-Eval榜單中排名第9、同參數(shù)量級排名第1,在CMMLU中文向大模型排名第1。
值得一提的是,雷軍將于8月14日晚間的新品發(fā)布會上,發(fā)表年度演講。
本次演講以“成長”為主題,雷軍發(fā)布的微博透露,“當初做的一個決定,改變了我的一生。”而且,這個決定讓他慶幸至今。
外界猜測,雷軍年度演講的內(nèi)容,除了與小米造車相關,或許還將與小米籌備已久的大模型有關。
來源:微博截圖
小米大模型取得雙“第一”,下周一或亮相
C-Eval榜單,全稱C-Eval全球大模型綜合性考試測試榜,是由清華大學、上海交通大學和愛丁堡大學合作構建的中文語言模型綜合性考試評估套件。
該套件覆蓋人文、社科、理工、其他專業(yè)四個大方向,包括52個學科,涵蓋微積分、線性代數(shù)等多個知識領域。共有13948道中文知識和推理型題目,難度分為中學、本科、研究生、職業(yè)等四個考試級別,能夠更加全面的對模型的語言處理能力進行評估,對中文社區(qū)語言大模型的研發(fā)有著很好的參考價值。
具體而言,在C-Eval評估中,小米大模型的平均分為60.2,在STEM、社會科學、人文科學、其他這四個類別中,均取得了不錯的表現(xiàn)。
來源:C-Eval截圖
其中,在STEM(科學、技術、工程和數(shù)學教育)全部20個科目中,小米大模型得分54.5,在計量師、物理、化學、生物等多個項目中獲得了較高的準確率;在10個社會科學科目中,小米大模型得分71.7,在教育學和地理外的所有科目中,獲得了較為理想的準確率;在11個人文科學科目中,小米大模型得分62.7,在歷史與法律基礎上,獲得了不錯的準確率;在其他分類下,小米大模型則得分57.7。
整體而言,小米大模型在法學、數(shù)學、編程、概率論、離散數(shù)學等科目上的表現(xiàn),仍然有明顯進步空間。
CMMLU,則是由MBZUAI、上海交通大學、微軟亞洲研究院合作完成的,一個全面的中文大模型基準。它涵蓋了67個主題,涉及自然科學、社會科學、工程、人文、以及常識等,可以全面地評估大模型在中文知識儲備和語言理解上的能力。
在CMMLU中文向大模型評估中,小米大模型在zero-shot和five-shot測試中的平均分分別為60.37和57.17,表現(xiàn)出良好的知識和推理能力。
在zero-shot測試中,小米大模型在人文學科得分63.49,社會科學得分66.2,其他得分62.14,中國特定主題得分62.07,平均分為60.37。
來源:CMMLU截圖
在five-shot測試中,小米大模型在人文學科得分61.12,社會科學得分61.68,其他得分58.84,中國特定主題得分59.39,平均分為57.17。
來源:CMMLU截圖
小米大模型首次曝光于上述兩個評測榜單中,并取得“雙第一”的不錯成績,也為其接下來的亮相,帶來了充足底氣。
至于亮相的時間,或許就在下周一,小米舉辦的新品發(fā)布會中,雷軍的年度演講環(huán)節(jié)。
此前,雷軍曾表示,“今年的演講比前幾年更長些,演講之后是我們的年度新品發(fā)布,還會披露我們技術探索的新進展。今年內(nèi)容也非常多,估計3小時左右。”
雷軍口中的“技術探索的新進展”,除了小米汽車,可能就要數(shù)小米大模型了。
任命欒劍做領頭人,千人團隊百億研發(fā)護航
4月14日,據(jù)澎湃新聞報道,小米集團發(fā)布內(nèi)部郵件,任命欒劍擔任技術委員會AI實驗室大模型團隊負責人,向技術委員會副主席、AI實驗室主任王斌匯報。
公開資料顯示,欒劍現(xiàn)任小米技術委員會AI實驗室語音生成團隊負責人,曾任東芝研究院研究員、微軟工程院高級語音科學家、微軟小冰首席語音科學家及語音團隊負責人等職位。
緊隨其后,雷軍于4月14日晚間在微博發(fā)文,首度談及小米對大模型和AIGC的看法。
“全力以赴、堅決擁抱”,雷軍為小米大模型發(fā)展定調(diào)!他還透露,對于大模型,小米“正在研發(fā)一些有趣的技術和產(chǎn)品,等我們打磨好了,再給大家展示?!?/p>
雷軍在微博提及小米,在AI領域有AI實驗室、小愛同學、自動駕駛等團隊。
來源:微博截圖
此外,從服務能力協(xié)同來看,雷軍手中亦有金山云這張底牌。金山云是金山軟件的附屬公司,在公司掌舵人雷軍超前布局下,是與阿里巴巴最早在中國全力進軍云計算的企業(yè)。
要知道,ChatGPT熱潮帶來的AI競爭,最直接的受益者正是云計算平臺。一方面,生成式AI應用背后的大模型需要更強的算力;另一方面,區(qū)別于傳統(tǒng)云計算平臺提供的算力、存儲等資源,擁有大模型的云廠商未來可以提供基于大模型開發(fā)應用。
早在今年2月的小米投資者日上,對于小米在ChatGPT上的布局,小米手機部總裁曾學忠就表示,ChatGPT基于AI大模型、千億級參數(shù)量、數(shù)據(jù)量、還有人工標注支撐,AI大模型方面小米一直都有投入。手機和汽車業(yè)務有很多AI大模型落地的場景。
隨后,在今年3月的2022年財報電話會議上,小米集團總裁盧偉冰談到ChatGPT相關問題時表示,小米很早就在AI大模型方面進行了許多部署,同時采用了多技術路線并行的策略,小愛同學就是小米大模型落地的代表。
5月24日晚,小米披露的2023年第一季度業(yè)績數(shù)據(jù)中提到,目前小米AI領域相關研發(fā)人員超1200人,未來小米將不斷挖掘AI相關的用戶場景,發(fā)揮技術優(yōu)勢,并以開放的態(tài)度與合作伙伴開拓更多機會。
盧偉冰再次強調(diào),小米會積極擁抱大模型技術,但小米不會像OpenAI那樣去做通用大模型,而是尋求大模型與自身業(yè)務的深度協(xié)同,例如與小愛同學、MIUI、機器人等業(yè)務相結合,同時也不斷提升集團的內(nèi)部工作效率。
小米副總裁、首席財務官林世偉也在業(yè)績電話會上透露,“已經(jīng)把業(yè)內(nèi)大模型團隊都過了一遍”,小米會采用慣用的“打法”,也就是戰(zhàn)略投資等方式,來實現(xiàn)AI大模型方面的生態(tài)合作。
第一季度業(yè)績數(shù)據(jù)還顯示,小米一季度持續(xù)投入研發(fā),研發(fā)支出同比增長17.7%達41億元。小米表示,預計2023年總研發(fā)投入將超200億元。
從目前綜合信息來看,小米大模型“萬事俱備,只欠東風”。下周一晚間,能否見證它的正式亮相,外界正翹首以待。