界面新聞記者 | 彭新
界面新聞編輯 | 宋佳楠
美國科技巨頭谷歌持續(xù)在大語言模型領(lǐng)域向OpenAI和Meta發(fā)起進(jìn)攻。
2月21日晚,谷歌宣布新一代免費(fèi)可商用大語言模型Gemma在全球開放使用。該模型被谷歌視為自身“最先進(jìn)的開放模型”。
這是該公司在開放AI大模型領(lǐng)域做出的一大動作。谷歌DeepMind產(chǎn)品管理總監(jiān)Tris Warkentin稱,開放模型對谷歌來說是一個新的機(jī)會,讓其可以與社區(qū)和谷歌之外的人合作,在AI研發(fā)方面創(chuàng)造新的機(jī)會。
Gemma得名于拉丁語“寶石”,僅用于處理文本信息,其基礎(chǔ)技術(shù)架構(gòu)與谷歌最強(qiáng)AI模型Gemini一致,但參數(shù)規(guī)模較小,僅有20億參數(shù)和70億參數(shù)兩個規(guī)模版本,且兩種參數(shù)規(guī)模的Gemma模型都會有預(yù)訓(xùn)練和指令微調(diào)版本。
較小的參數(shù)規(guī)模有助于Gemma實(shí)現(xiàn)更廣泛部署。谷歌介紹稱,Gemma支持主流AI框架,還可在筆記本電腦、臺式機(jī)、物聯(lián)網(wǎng)、移動設(shè)備和云端等環(huán)境上運(yùn)行。
該公司公布的測評結(jié)果顯示,Gemma在數(shù)學(xué)、編碼、推理精通性和知識測試等許多外部基準(zhǔn)測試中都優(yōu)于Llama 2模型。Llama 2是Meta發(fā)布的最新一代開源大模型,包含了70億、130億和700億參數(shù)的模型。
值得注意的是,谷歌強(qiáng)調(diào)Gemma為開放模型,而非“開源”,這意味著谷歌并不會分享Gemma的多項(xiàng)技術(shù)細(xì)節(jié),包括Gemma的源代碼、訓(xùn)練數(shù)據(jù)等。在應(yīng)用上,谷歌稱其使用條款允許所有組織負(fù)責(zé)任地進(jìn)行商用和分發(fā)。
開放Gemma或是針對開源大模型領(lǐng)域所受批評的部分回應(yīng)。此前谷歌和OpenAI因堅(jiān)持技術(shù)封閉而遭到外界抨擊,兩者在最新、最先進(jìn)的模型上都選擇了閉源,被認(rèn)為不利于技術(shù)進(jìn)步。
對此,新浪微博新技術(shù)研發(fā)負(fù)責(zé)人張俊林評價稱,Gemma代表谷歌大模型策略的轉(zhuǎn)變——兼顧開源和閉源,開源主打性能最強(qiáng)大的小規(guī)模模型,希望戰(zhàn)勝M(fèi)eta和Mistral(歐洲AI公司,推出了Mistral 7B開源AI模型);閉源主打規(guī)模大的效果最好的大模型,希望盡快追上OpenAI。
在AI社區(qū),目前Meta的Llama 2一直是最強(qiáng)大的開源大模型之一,該模型信息和源代碼支持免費(fèi)商用,因此獲得大量AI開發(fā)者支持。
谷歌顯然希望借助Gemma吸引更多開發(fā)者進(jìn)入谷歌云生態(tài)。一方面,Gemma針對谷歌自研云端AI芯片TPU進(jìn)行了優(yōu)化,聲稱可發(fā)揮更好的效能。同時,谷歌云新用戶還會獲得300美元云積分,用來研究Gemma。
此外,Gemma將能夠在英偉達(dá)芯片上運(yùn)行,由雙方合作進(jìn)行優(yōu)化,以加速該模型在云端數(shù)據(jù)中心、PC端側(cè)的推理性能。如將Gemma用于搭載英偉達(dá)GPU的AI PC上,驅(qū)動本地聊天機(jī)器人軟件,并與英偉達(dá)的多項(xiàng)AI工具集成。
OpenAI、谷歌、Meta等大型科技公司的大模型之戰(zhàn)有愈演愈烈之勢。
谷歌在2023年3月推出AI對話機(jī)器人Bard,并在去年5月推出最新的閉源大語言模型PaLM2。在上周,該公司官宣“下一代AI大模型” Gemini 1.5,稱在諸多方面已經(jīng)超越OpenAI的GPT-4 Turbo。Meta則熱衷模型開源,旗下Llama 2最為知名。
而在近日,OpenAI發(fā)布文生視頻模型Sora再次引爆AI圈,也進(jìn)一步拉開了與其他大模型公司的距離。谷歌要最終趕超OpenAI仍將充滿諸多不確定性。