文|獵云網(wǎng) 王非
“全力以赴、堅(jiān)決擁抱”,雷軍為小米大模型發(fā)展定調(diào)。
繼任命欒劍擔(dān)任技術(shù)委員會AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人后,雷軍于4月14日晚間在微博發(fā)文,首度談及小米對大模型和AIGC的看法。
除了定下發(fā)展基調(diào),雷軍還透露,對于大模型,小米“正在研發(fā)一些有趣的技術(shù)和產(chǎn)品,等我們打磨好了,再給大家展示?!?/p>
事實(shí)上自3月份以來,各路互聯(lián)網(wǎng)大佬和技術(shù)大牛,以及BAT華為360商湯等大廠密集發(fā)聲,雷軍此番表態(tài),可謂“雖遲但到”。
值得注意的是,雷軍在微博提及小米,在AI領(lǐng)域有AI實(shí)驗(yàn)室、小愛同學(xué)、自動駕駛等團(tuán)隊(duì)。
于是,小米在大模型領(lǐng)域的發(fā)力方向,可窺一二。
來源:微博截圖
出身微軟,欒劍成小米大模型領(lǐng)頭人
4月14日,據(jù)澎湃新聞報(bào)道,小米集團(tuán)發(fā)布內(nèi)部郵件,任命欒劍擔(dān)任技術(shù)委員會AI實(shí)驗(yàn)室大模型團(tuán)隊(duì)負(fù)責(zé)人,向技術(shù)委員會副主席、AI實(shí)驗(yàn)室主任王斌匯報(bào)。
公開資料顯示,欒劍現(xiàn)任小米技術(shù)委員會AI實(shí)驗(yàn)室語音生成團(tuán)隊(duì)負(fù)責(zé)人,曾任東芝研究院研究員、微軟工程院高級語音科學(xué)家、微軟小冰首席語音科學(xué)家及語音團(tuán)隊(duì)負(fù)責(zé)人等職位。
目前,網(wǎng)絡(luò)上關(guān)于欒劍的報(bào)道并不多。在知乎上,他的個人標(biāo)簽為“小米NlP技術(shù)高級總監(jiān)”。
2018年5月,知乎官方發(fā)布《我們和微軟小冰發(fā)了一首單曲 | 為「新知青年」而唱》一文后,欒劍本人還贊同了該文章。
據(jù)SegmentFault報(bào)道,2019年11月,在微軟小冰的一場內(nèi)部WorkShop上,時任微軟小冰首席語音科學(xué)家欒劍與另外兩位“首席科學(xué)家”共同分享了微軟小冰當(dāng)年在自然語言處理、語音學(xué)研究、多模態(tài)生成等領(lǐng)域研究進(jìn)展。
來源:SegmentFault
彼時,欒劍以《小冰唱歌技術(shù)進(jìn)展》為題演講。他提到,微軟小冰團(tuán)隊(duì)“在語音合成領(lǐng)域大方面的東西可能已經(jīng)解決,但語義理解方面,可能還需要通過長時間的積累和技術(shù)的發(fā)酵?!弊罱K,團(tuán)隊(duì)找到了一個更有挑戰(zhàn)性的課題——唱歌。做唱歌主要有三個原因:第一個原因,唱歌的門檻比說話高;第二唱歌的情感表達(dá)更加豐富激烈;第三它是一個很重要的娛樂形式。
值得一提的是,欒劍還在現(xiàn)場分享中提到,深度學(xué)習(xí)其實(shí)在上世紀(jì)90年代就火過一陣,但那個時候卻沒有取得像今天這么大的成果。他認(rèn)為主要有兩個主要的原因:
1、因?yàn)橛布夹g(shù)的方法,當(dāng)時的算力還不夠,現(xiàn)在有GPU,而且GPU還在不斷地升級,所以它的計(jì)算能力在提高;2. 另外一個很重要的支撐就是數(shù)據(jù),現(xiàn)在有大數(shù)據(jù)的支持,所以才能夠把深度學(xué)習(xí)做得這么好。
隨后,欒劍就從微軟跳槽到了小米,具體時間不詳。
北京大學(xué)現(xiàn)代信號與數(shù)據(jù)處理實(shí)驗(yàn)室于2021年5月發(fā)布的文章顯示,2020年5月,小米人工智能部語音技術(shù)總監(jiān)王育軍及其團(tuán)隊(duì)?wèi)?yīng)邀來校舉行北大&小米技術(shù)交流會。當(dāng)天,欒劍博士的匯報(bào)題目是《語音生成技術(shù)》,介紹了語音合成的基本概念,并就該領(lǐng)域的關(guān)鍵問題展開討論。
來源:北京大學(xué)現(xiàn)代信號與數(shù)據(jù)處理實(shí)驗(yàn)室
今年以來,ChatGPT爆火后,欒劍也在4月份接連在知乎發(fā)布兩篇文章,分享自己的感悟。
作為“一個AI領(lǐng)域近20年的從業(yè)者”,欒劍在4月5日發(fā)布的《一個關(guān)于ChatGPT能力涌現(xiàn)成因的猜想》一文中認(rèn)為,產(chǎn)生“涌現(xiàn)”能力的三要素可總結(jié)為:
大數(shù)據(jù):如果數(shù)據(jù)不夠豐富,就可能也沒必要挖掘出“概念”與“常識”;大模型:如果參數(shù)量不夠多,模型沒有足夠的空間去完成“層級結(jié)構(gòu)”;多任務(wù):如果任務(wù)比較單一,模型沒有動力去做結(jié)構(gòu)調(diào)整,“平行結(jié)構(gòu)”成為模型的“偷懶”選擇。
隨后在4月8日發(fā)布的《hatGPT的訓(xùn)練過程對“雞娃”的啟示》一文中,欒劍“通過類比,嘗試定性地探討兒童教育可以從ChatGPT的訓(xùn)練過程中得到哪些啟示”。
出身微軟,擁有豐富的AI語音技術(shù)儲備和工作經(jīng)歷,如今擔(dān)任小米大模型團(tuán)隊(duì)負(fù)責(zé)人后,欒劍如何發(fā)揮自身優(yōu)勢,又能與“小愛同學(xué)”碰撞出怎樣的火花,我們也只能拭目以待。
內(nèi)有千人AI團(tuán)隊(duì),外有金山云護(hù)駕
當(dāng)?shù)貢r間4月14日,英國《金融時報(bào)》援引知情人士消息報(bào)道,特斯拉CEO埃隆 馬斯克(Elon Musk)正在組建人工智能初創(chuàng)公司,為了與ChatGPT的研發(fā)公司OpenAI展開競爭。
作為中美互聯(lián)網(wǎng)圈,最受矚目的“網(wǎng)紅創(chuàng)始人”。馬斯克都來了,雷軍還會遠(yuǎn)嗎?
巧合地是,兩人都是在4月14日,針對大模型,顯露出自己的布局。
事實(shí)上,小米入局大模型領(lǐng)域可謂“水到渠成”。
從內(nèi)部人才儲備來看,小米目前已擁有超過1200人的AI團(tuán)隊(duì)。如今,雷軍也終于為大模型團(tuán)隊(duì)選定了欒劍為“舵手”。
來源:小米官網(wǎng)
從服務(wù)能力協(xié)同來看,雷軍手中亦有金山云這張底牌。金山云是金山軟件的附屬公司,在公司掌舵人雷軍超前布局下,是與阿里巴巴最早在中國全力進(jìn)軍云計(jì)算的企業(yè)。
ChatGPT熱潮帶來的AI競爭,最直接的受益者正是云計(jì)算平臺。
一方面,生成式AI應(yīng)用背后的大模型需要更強(qiáng)的算力。OpenAI此前公布過一組數(shù)據(jù),目前大模型訓(xùn)練所需算力的增速保持在3-4個月/倍速度增長,遠(yuǎn)超摩爾定律18-24個月/倍。
另一方面,區(qū)別于傳統(tǒng)云計(jì)算平臺提供的算力、存儲等資源,擁有大模型的云廠商未來可以提供基于大模型開發(fā)應(yīng)用。李彥宏不久前在接受采訪時就拋出過類似的觀點(diǎn),未來企業(yè)在購買云計(jì)算的時候不看底層算力,而是看大模型的優(yōu)劣。
就在本周,阿里和騰訊先后官宣“大動作”。
在4月11日舉辦的阿里云峰會上,張勇表示,智能化時代帶來算力的爆發(fā),同時也提出了更高的要求,阿里云將為AI時代提供好算力基礎(chǔ)和大模型能力,全面服務(wù)智能化進(jìn)程。為此,阿里云要做好核心兩件事:第一,讓算力更普惠,推動自研技術(shù)和規(guī)?;?jīng)營的正循環(huán),持續(xù)釋放技術(shù)紅利;第二,讓AI更普及,讓每家企業(yè)的產(chǎn)品都能接入大模型升級改造,并有能力打造自己的專屬大模型。
隨后在4月14日,騰訊面向大模型訓(xùn)練,發(fā)布“超強(qiáng)算力集群”,要助力企業(yè)云上訓(xùn)練AI大模型,解決中小企業(yè)和創(chuàng)業(yè)公司的算力壓力。
金山云方面雖然并未像阿里騰訊那樣“聲勢浩大”,但也已有相關(guān)動作。
天眼查App顯示,近日,北京金山辦公軟件股份有限公司申請注冊多個“chat 會議”“chat 演示”“chat 表單”“chat Office”“chat everything”等商標(biāo),國際分類為網(wǎng)站服務(wù),當(dāng)前商標(biāo)狀態(tài)均為申請中。
來源:天眼查
內(nèi)有千人AI團(tuán)隊(duì)并由欒劍掌舵,外有金山云護(hù)駕,小米大模型已順利起航。
小愛同學(xué)距ChatGPT,還差一個文心一言
早在今年2月的小米投資者日上,對于小米在ChatGPT上的布局,小米手機(jī)部總裁曾學(xué)忠就表示,ChatGPT基于AI大模型、千億級參數(shù)量、數(shù)據(jù)量、還有人工標(biāo)注支撐,AI大模型方面小米一直都有投入。手機(jī)和汽車業(yè)務(wù)有很多AI大模型落地的場景。
隨后,在今年3月的2022年財(cái)報(bào)電話會議上,小米集團(tuán)總裁盧偉冰談到ChatGPT相關(guān)問題時表示,小米很早就在AI大模型方面進(jìn)行了許多部署,同時采用了多技術(shù)路線并行的策略,小愛同學(xué)就是小米大模型落地的代表。
據(jù)盧偉冰介紹,小愛同學(xué)已經(jīng)做了6年,在與用戶的交互體驗(yàn)中積累了長期可復(fù)用的經(jīng)驗(yàn),同時,小米有豐富的場景落地經(jīng)驗(yàn),小愛同學(xué)支持手機(jī)、音箱、車等多場景的智能融合。未來小米將繼續(xù)大模型研究,引入更加先進(jìn)的大模型能力,包括探索多模態(tài)能力、智能座艙交互體驗(yàn)提升等。
不難發(fā)現(xiàn),小愛同學(xué)或許是小米在大模型領(lǐng)域,最直觀最先落地的產(chǎn)品。
來源:小米官網(wǎng)
然而,需要注意的是,小愛同學(xué)的產(chǎn)品能力,與基于GPT-3.5訓(xùn)練而來的ChatGPT仍有不小差距。何況,OpenAI也已發(fā)布了更為先進(jìn)的GPT-4大模型,就連GPT-5也已身處“傳說”中。
此前,微軟CEO薩蒂亞·納德拉最近在接受英國《金融時報(bào)》采訪時表示,蘋果的Siri、亞馬遜的Alexa,微軟自家的Cortana(中文名:小娜)以及公認(rèn)拔尖的Google Assistant,這些語音助手有一個算一個:都笨得跟石頭一樣。
隨后,微軟在2021年就正式宣布停止支持iOS和Android上的Cortana應(yīng)用,僅保留對Windows平臺的支持。
直到OpenAI帶來了ChatGPT,微軟直接“滿血復(fù)活”,戰(zhàn)斗力爆表。
Siri聯(lián)合創(chuàng)始人Adam Cheyer也在近期表示,ChatGPT理解復(fù)雜信息的能力讓現(xiàn)有的語音助手看起來很蠢。
那么,“小愛同學(xué)+ChatGPT”,究竟會怎樣?
在全球最大的代碼托管平臺Github上,有開發(fā)者嘗試將ChatGPT接入小愛同學(xué),Star數(shù)已經(jīng)達(dá)到了1.3k。據(jù)項(xiàng)目介紹,只要有ChatGPT的賬號、小愛音箱、正常連接ChatGPT的網(wǎng)絡(luò)以及python 3.8+,人人都可以在小愛音箱上使用“ChatGPT版小愛同學(xué)”。
具體原理為,喚起小愛同學(xué)后,以“幫我”開頭詢問的問題會自動以文本形式發(fā)送一份給ChatGPT,同時會屏蔽小愛同學(xué)原本的回答,替換成“正在問GPT,請耐心等待”,而ChatGPT生成的文本則會被小愛同學(xué)通過TTS(語音合成技術(shù))進(jìn)行語音回答。
從開發(fā)者的演示顯示,整個過程足夠流暢,實(shí)際回答也遠(yuǎn)超小愛同學(xué)原本的“智力”。
然而,小米官方顯然不能直接與OpenAI合作,推出“ChatGPT版小愛同學(xué)”。
作為對比,早在今年2月,百度旗下人工智能助手“小度”就宣布,小度將融合“文心一言”的全面能力,打造針對智能設(shè)備場景的人工智能模型“小度靈機(jī)”,并應(yīng)用到小度全系產(chǎn)品。
隨后在3月份的文心一言發(fā)布會上,百度創(chuàng)始人李彥宏曾表示,文心一言差不多是今年1月份ChatGPT的水平,但差距不大,可能只是一兩個月的時間。
由此可見,小愛同學(xué)距離ChatGPT,至少還差一個文心一言,然后再加“一兩個月的時間”。