正在閱讀:

谷歌落子,大模型的路該往何處去?

掃一掃下載界面新聞APP

谷歌落子,大模型的路該往何處去?

期待信號(hào),更期待落地。

文 | 產(chǎn)業(yè)家 思杭 皮爺

在微軟GPT-4遇到諸多問(wèn)題的最近,谷歌終于向外界展示出了其強(qiáng)勁的實(shí)力。

就在昨天,一年一度的Google I/O開(kāi)發(fā)者大會(huì)在美國(guó)加州山景城的海濱露天劇場(chǎng)拉開(kāi)帷幕。與往年不同的是,今年的大會(huì)主題是近期火爆全球的「AI大模型」,因此格外熱鬧。

在會(huì)上,最重磅的消息是,谷歌推出了最新語(yǔ)言模型——PaLM 2,并作為本次發(fā)布會(huì)中大部分AI功能的基礎(chǔ)模型。

盡管從AI模型整個(gè)領(lǐng)域來(lái)看,PaLM 2并未取得突破性進(jìn)展,只是在多語(yǔ)言、推理和翻譯功能有所改進(jìn),諸如數(shù)據(jù)隱私和AI“幻覺(jué)”等問(wèn)題依舊存在,但就部分性能而言,PaLM 2已經(jīng)超過(guò)GPT-4。

從各項(xiàng)參數(shù)來(lái)看,谷歌的大模型已經(jīng)覆蓋到了自身的產(chǎn)品應(yīng)用,這些產(chǎn)品應(yīng)用包括文檔等辦公產(chǎn)品,也更包括和底層云計(jì)算的打通,同時(shí)還有“個(gè)性化AI”概念的提出,這些動(dòng)作無(wú)不在向外界傳遞出一個(gè)信號(hào):谷歌大模型已經(jīng)可以全面落地,不論在C端還是B端,不論是輕量級(jí)部署,還是本地部署。

在過(guò)去的一兩個(gè)月中,中國(guó)市場(chǎng)風(fēng)起云涌,TO B市場(chǎng)的變化更是一日千里。在大模型這條道路上,出現(xiàn)了各種形形色色的模型的定義,不論是大模型、產(chǎn)業(yè)模式,還是小模型等等,都以一種全新的概念姿態(tài)出現(xiàn)。但細(xì)看其具體的應(yīng)用,其中的很多功能接近同質(zhì)化,尤其是在TO B領(lǐng)域的應(yīng)用上,同時(shí)更不乏基于開(kāi)源進(jìn)行開(kāi)發(fā)的“套娃”模型。

于此之中,落地場(chǎng)景和產(chǎn)品也更是寥寥無(wú)幾。

差距是客觀存在的,不論是對(duì)標(biāo)微軟的Open-AI,還是谷歌的PaLM 2,中國(guó)的大模型目前仍需要更大程度的在底層能力上的補(bǔ)齊,而透過(guò)谷歌的這次發(fā)布會(huì),未來(lái)中國(guó)大模型的路該朝向何方?或許會(huì)有一些答案。

一、PaLM 2:有望超越GPT-4

PaLM 2作為谷歌最新大語(yǔ)言模型,是本次發(fā)布會(huì)的重磅消息。

據(jù)美國(guó)科技媒體記者Federic,“PaLM 2將應(yīng)用于谷歌最新發(fā)布的Bard聊天工具中,成為OpenAI的ChatGPT的最大競(jìng)爭(zhēng)者。此外,PaLM 2也是今天宣布的大部分AI功能的基礎(chǔ)模型?!?/p>

多語(yǔ)言性:PaLM 2 在多語(yǔ)言文本方面進(jìn)行了嚴(yán)格的培訓(xùn),涵蓋100多種語(yǔ)言。這極大提高了其理解、生成和翻譯各種語(yǔ)言的能力,包括理解習(xí)語(yǔ)、詩(shī)歌和謎語(yǔ)。

推理:PaLM 2有廣泛的數(shù)據(jù)集,包括科學(xué)論文和網(wǎng)頁(yè)。因此,它展示了在邏輯、常識(shí)推理和數(shù)學(xué)方面的改進(jìn)能力。

編碼:PaLM 2在大量公開(kāi)可用的源代碼數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練。這意味著它擅長(zhǎng)Python和JavaScript等流行的編程語(yǔ)言,還可以用Prolog,F(xiàn)ortran和Verilog等語(yǔ)言生成專門(mén)的代碼。

與其他大語(yǔ)言模型一樣,搭建PaLM 2需要耗費(fèi)大量的時(shí)間成本和資源。然而,PaLM 2能應(yīng)用于C端和B端兩種環(huán)境,企業(yè)客戶可根據(jù)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),以便在特定場(chǎng)景下執(zhí)行任務(wù)。

如今,PaLM 2已應(yīng)用于谷歌的25個(gè)功能和產(chǎn)品,包括Google Bard聊天機(jī)器人和Google Workspace協(xié)同文檔。

其中,PaLM 2的最輕版本Gecko足夠小,可以在手機(jī)上運(yùn)行,每秒處理20個(gè)tokens,大約相當(dāng)于16或17個(gè)英文單詞。不過(guò),雖然PaLM 2雖然在推理和語(yǔ)言等方面取得了較為顯著的成績(jī),但它仍面臨著技術(shù)挑戰(zhàn)和大模型的共性問(wèn)題。

比如一些專家已經(jīng)開(kāi)始質(zhì)疑創(chuàng)建語(yǔ)言模型所使用訓(xùn)練數(shù)據(jù)的合法性。因?yàn)檫@些數(shù)據(jù)從互聯(lián)網(wǎng)上抓取,通常包括受版權(quán)保護(hù)的文本和盜版電子書(shū)。而谷歌在PaLM 2的升級(jí)中,也并沒(méi)有披露更多關(guān)于數(shù)據(jù)源的細(xì)節(jié)。

另外,AI“幻覺(jué)”問(wèn)題也未得到解決。大模型擅長(zhǎng)編造信息,谷歌研究副總裁Zoubin Ghahramani在接受The Verge采訪時(shí)表示,在這方面,PaLM 2是對(duì)早期模型的改進(jìn),“從某種意義上說(shuō),我們正在投入大量精力不斷改進(jìn)基礎(chǔ)性和歸因指標(biāo)”,但他指出,在AI領(lǐng)域,打擊人工智能產(chǎn)生的虛假信息,“還有很長(zhǎng)的路要走”。

二、大模型會(huì)“魔法”——編輯器和創(chuàng)作器

在這次發(fā)布會(huì)中,兩個(gè)具體的功能成為焦點(diǎn)。

第一個(gè)是Google推出的人工智能驅(qū)動(dòng)的魔法編輯器(Magic Editor)。用戶可以在照片的特定部分進(jìn)行復(fù)雜編輯,并填補(bǔ)照片空白。

另一個(gè)功能是魔術(shù)創(chuàng)作器(Magic Compose),利用生成式AI幫助人們撰寫(xiě)個(gè)性化信息。它可以以不同風(fēng)格撰寫(xiě)信息,甚至可以莎士比亞風(fēng)格的信息。

基于AI大模型,谷歌地圖還發(fā)布「沉浸式路線視圖」,在洛杉磯、舊金山、紐約、倫敦、阿姆斯特丹、柏林等15個(gè)城市進(jìn)行試點(diǎn)。用戶可在導(dǎo)航時(shí)使用該功能,提前看到整個(gè)路線的動(dòng)態(tài)街景視角,包括交通模擬、自行車道、復(fù)雜十字路口、停車等詳細(xì)信息。

除了谷歌的“魔法工具”和谷歌地圖,還有更多基于PaLM 2的AI新功能。比如,在音樂(lè)方面,谷歌推出了MusicLM,可將文本轉(zhuǎn)化為音樂(lè)。假設(shè)你在舉辦一個(gè)晚宴,通過(guò)簡(jiǎn)單輸入“晚宴的深情爵士樂(lè)”,該工具即可創(chuàng)建歌曲的多個(gè)版本。

此外,Google Workspace也實(shí)現(xiàn)了AI辦公功能。據(jù)了解,谷歌將在180多個(gè)國(guó)家和地區(qū)提供英語(yǔ)版本的Bard聊天機(jī)器人,而且還推出了對(duì)日語(yǔ)和韓語(yǔ)的支持。在不久的將來(lái),Bard會(huì)支持40種語(yǔ)言。

在此基礎(chǔ)上,谷歌還通過(guò)Bard與Adobe合作,開(kāi)發(fā)了藝術(shù)生成功能。

在谷歌文檔的側(cè)面,將會(huì)出現(xiàn)一個(gè)新面板——Sidekick,可以幫助用戶在寫(xiě)作時(shí)閱讀并整理文檔,根據(jù)上下文提供與內(nèi)容有關(guān)的建議,可以對(duì)標(biāo)Notion。

同時(shí),優(yōu)化的還有自身的搜索。據(jù)了解,谷歌正在試驗(yàn)一種由人工智能驅(qū)動(dòng)的對(duì)話模式。用戶搜索時(shí)會(huì)看到建議的后續(xù)步驟,可以根據(jù)對(duì)話模式進(jìn)入建議的下一步。此外,谷歌還引入了“觀點(diǎn)”過(guò)濾器。

三、AI生成代碼,Codey比肩GitHub Copilot

本次,Google發(fā)布的代碼生成工具「Codey」,是對(duì)GitHub Copilot的一個(gè)回應(yīng)。Codey經(jīng)過(guò)專門(mén)培訓(xùn),可以處理與編碼相關(guān)的提示,并且還接受過(guò)處理與Google Cloud相關(guān)查詢培訓(xùn)。

Codey是基于谷歌的PaLM 2大語(yǔ)言模型的編碼工具。谷歌表示,該工具是在大量獲得許可的開(kāi)源代碼、大量?jī)?nèi)部谷歌代碼、公司所有代碼示例及其參考應(yīng)用程序的基礎(chǔ)上進(jìn)行訓(xùn)練的。

谷歌表示,該模型是在大量獲得許可的開(kāi)源代碼、大量?jī)?nèi)部谷歌代碼、公司所有代碼示例及其參考應(yīng)用程序的基礎(chǔ)上進(jìn)行訓(xùn)練的。開(kāi)發(fā)人員能夠直接在他們的IDE聊天框中與Codey聊天,或者在文本文件中寫(xiě)評(píng)論,讓它生成相關(guān)代碼。

對(duì)于Codey,谷歌的愿景是,它希望通過(guò)這種聊天機(jī)器人技術(shù),在不久的將來(lái),開(kāi)發(fā)人員可以管理他們?cè)诠雀柙粕系乃蟹?wù),包括部署和擴(kuò)展應(yīng)用程序。

四、谷歌云的“三大基礎(chǔ)模型”

從Transformer架構(gòu)到PaLM 2,除卻GPT模型之外,實(shí)際上,谷歌一直保持領(lǐng)導(dǎo)者地位。

在本次在Google I/O 2023大會(huì)上,Google Cloud又邁出了一大步,對(duì)代碼生成模式和模型調(diào)整都做出了改善。以下為本次更新的三大基礎(chǔ)模型:

Codey,文本到代碼模型,幫助開(kāi)發(fā)人員完成代碼、生成和聊天

Imagen,文本到圖像模型,幫助客戶生成和編輯高質(zhì)量圖像,滿足任何業(yè)務(wù)需求

Chirp,語(yǔ)音轉(zhuǎn)文本模型,用于翻譯、溝通和交流

這些基礎(chǔ)模型可通過(guò)API訪問(wèn),也可以在生成式AI Studio中的UI進(jìn)行調(diào)整,或部署到數(shù)據(jù)科學(xué)筆記本。

值得一提的是,獨(dú)特的調(diào)優(yōu)功能能夠結(jié)合人工反饋來(lái)訓(xùn)練,可用于微調(diào)基礎(chǔ)模型的獎(jiǎng)勵(lì)模型。這對(duì)于醫(yī)療、金融和電子商務(wù)等行業(yè)有著十分重要的應(yīng)用。

寫(xiě)在最后:

今年,Google I/O大會(huì)之所以備受關(guān)注的一個(gè)焦點(diǎn)在于,其基于自身的大模型,谷歌做到了將固有的全部產(chǎn)品接近重塑的程度,這種重塑不單純是產(chǎn)品邏輯上的重塑,更是能真實(shí)落地、真實(shí)使用的重構(gòu)。

比如面向C端的辦公文檔,比如與Adobe結(jié)合的圖片設(shè)計(jì),比如文生圖、圖生文、文生音樂(lè)等等,相較于Open-AI的發(fā)布,谷歌的大模型表達(dá)更加具象和入微,也更貼近人們生活的場(chǎng)景。

而在B端業(yè)務(wù)上,更是如此。

不論是其在低代碼/無(wú)代碼上的進(jìn)一步邁步,還是基于谷歌云三大模型的梳理和拆解,再或者是在機(jī)器人智能的結(jié)合下進(jìn)行智能交互、智能指令的新企業(yè)模式,都展示出谷歌可以將AI大模型真正應(yīng)用到企業(yè)生產(chǎn)和TO B場(chǎng)景中。這種應(yīng)用不是單純的AI算法,而是真正基于大模型的特定業(yè)務(wù)表達(dá)。

從這些視角來(lái)看,這也更是中國(guó)大模型應(yīng)該去踐行的。

在過(guò)去的多年時(shí)間里,中國(guó)在移動(dòng)互聯(lián)網(wǎng)方面處于領(lǐng)先地位,這種領(lǐng)先體現(xiàn)在互聯(lián)網(wǎng)的廣泛使用、智能手機(jī)的極高普及率,這些領(lǐng)先最終沉淀出的就是真實(shí)有價(jià)值的數(shù)據(jù),而這也是如今百度騰訊阿里京東以及其它企業(yè)做大模型的基礎(chǔ)。

但在數(shù)據(jù)訓(xùn)練之上,基于軟件層面和基于開(kāi)發(fā)層面的真實(shí)場(chǎng)景的表達(dá),如今卻甚為少見(jiàn)。

或者說(shuō),單純的比較參數(shù)量級(jí)僅代表的是大模型本身的能力,而并不是其能賦能產(chǎn)業(yè)的能力,谷歌和微軟的成功應(yīng)用也在昭示這一點(diǎn):大模型應(yīng)該和真正的場(chǎng)景結(jié)合,基于此才能釋放更大的想象力和價(jià)值。

不論是谷歌,還是微軟,在其大模型發(fā)布后,都能看到的是其矩陣內(nèi)的產(chǎn)品的迅速跟進(jìn),對(duì)中國(guó)大模型企業(yè)而言,也更應(yīng)該強(qiáng)化大模型的應(yīng)用層,在具備微信、淘寶等一眾全球移動(dòng)互聯(lián)網(wǎng)時(shí)代最有明星價(jià)值的產(chǎn)品的土壤上,在這個(gè)制造業(yè)發(fā)達(dá),供應(yīng)鏈眾多,數(shù)字化轉(zhuǎn)型迫切的環(huán)境里,中國(guó)本土的大模型具備的價(jià)值將更大,其能攪動(dòng)的市場(chǎng)變化也會(huì)更為劇烈。

對(duì)中國(guó)大模型廠商而言,市場(chǎng)期待的,也恰是這些真正可落地的應(yīng)用和實(shí)踐。這些實(shí)踐可以在社交,在電商,在低代碼,在供應(yīng)鏈,也更可以在一個(gè)個(gè)中國(guó)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的新洼地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

谷歌

5.8k
  • 谷歌據(jù)悉將開(kāi)發(fā)可控制計(jì)算機(jī)的人工智能
  • 高通與谷歌達(dá)成多年戰(zhàn)略合作,將提供生成式AI數(shù)字座艙解決方案

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

谷歌落子,大模型的路該往何處去?

期待信號(hào),更期待落地。

文 | 產(chǎn)業(yè)家 思杭 皮爺

在微軟GPT-4遇到諸多問(wèn)題的最近,谷歌終于向外界展示出了其強(qiáng)勁的實(shí)力。

就在昨天,一年一度的Google I/O開(kāi)發(fā)者大會(huì)在美國(guó)加州山景城的海濱露天劇場(chǎng)拉開(kāi)帷幕。與往年不同的是,今年的大會(huì)主題是近期火爆全球的「AI大模型」,因此格外熱鬧。

在會(huì)上,最重磅的消息是,谷歌推出了最新語(yǔ)言模型——PaLM 2,并作為本次發(fā)布會(huì)中大部分AI功能的基礎(chǔ)模型。

盡管從AI模型整個(gè)領(lǐng)域來(lái)看,PaLM 2并未取得突破性進(jìn)展,只是在多語(yǔ)言、推理和翻譯功能有所改進(jìn),諸如數(shù)據(jù)隱私和AI“幻覺(jué)”等問(wèn)題依舊存在,但就部分性能而言,PaLM 2已經(jīng)超過(guò)GPT-4。

從各項(xiàng)參數(shù)來(lái)看,谷歌的大模型已經(jīng)覆蓋到了自身的產(chǎn)品應(yīng)用,這些產(chǎn)品應(yīng)用包括文檔等辦公產(chǎn)品,也更包括和底層云計(jì)算的打通,同時(shí)還有“個(gè)性化AI”概念的提出,這些動(dòng)作無(wú)不在向外界傳遞出一個(gè)信號(hào):谷歌大模型已經(jīng)可以全面落地,不論在C端還是B端,不論是輕量級(jí)部署,還是本地部署。

在過(guò)去的一兩個(gè)月中,中國(guó)市場(chǎng)風(fēng)起云涌,TO B市場(chǎng)的變化更是一日千里。在大模型這條道路上,出現(xiàn)了各種形形色色的模型的定義,不論是大模型、產(chǎn)業(yè)模式,還是小模型等等,都以一種全新的概念姿態(tài)出現(xiàn)。但細(xì)看其具體的應(yīng)用,其中的很多功能接近同質(zhì)化,尤其是在TO B領(lǐng)域的應(yīng)用上,同時(shí)更不乏基于開(kāi)源進(jìn)行開(kāi)發(fā)的“套娃”模型。

于此之中,落地場(chǎng)景和產(chǎn)品也更是寥寥無(wú)幾。

差距是客觀存在的,不論是對(duì)標(biāo)微軟的Open-AI,還是谷歌的PaLM 2,中國(guó)的大模型目前仍需要更大程度的在底層能力上的補(bǔ)齊,而透過(guò)谷歌的這次發(fā)布會(huì),未來(lái)中國(guó)大模型的路該朝向何方?或許會(huì)有一些答案。

一、PaLM 2:有望超越GPT-4

PaLM 2作為谷歌最新大語(yǔ)言模型,是本次發(fā)布會(huì)的重磅消息。

據(jù)美國(guó)科技媒體記者Federic,“PaLM 2將應(yīng)用于谷歌最新發(fā)布的Bard聊天工具中,成為OpenAI的ChatGPT的最大競(jìng)爭(zhēng)者。此外,PaLM 2也是今天宣布的大部分AI功能的基礎(chǔ)模型?!?/p>

多語(yǔ)言性:PaLM 2 在多語(yǔ)言文本方面進(jìn)行了嚴(yán)格的培訓(xùn),涵蓋100多種語(yǔ)言。這極大提高了其理解、生成和翻譯各種語(yǔ)言的能力,包括理解習(xí)語(yǔ)、詩(shī)歌和謎語(yǔ)。

推理:PaLM 2有廣泛的數(shù)據(jù)集,包括科學(xué)論文和網(wǎng)頁(yè)。因此,它展示了在邏輯、常識(shí)推理和數(shù)學(xué)方面的改進(jìn)能力。

編碼:PaLM 2在大量公開(kāi)可用的源代碼數(shù)據(jù)集上進(jìn)行了預(yù)訓(xùn)練。這意味著它擅長(zhǎng)Python和JavaScript等流行的編程語(yǔ)言,還可以用Prolog,F(xiàn)ortran和Verilog等語(yǔ)言生成專門(mén)的代碼。

與其他大語(yǔ)言模型一樣,搭建PaLM 2需要耗費(fèi)大量的時(shí)間成本和資源。然而,PaLM 2能應(yīng)用于C端和B端兩種環(huán)境,企業(yè)客戶可根據(jù)特定領(lǐng)域的數(shù)據(jù)進(jìn)行微調(diào),以便在特定場(chǎng)景下執(zhí)行任務(wù)。

如今,PaLM 2已應(yīng)用于谷歌的25個(gè)功能和產(chǎn)品,包括Google Bard聊天機(jī)器人和Google Workspace協(xié)同文檔。

其中,PaLM 2的最輕版本Gecko足夠小,可以在手機(jī)上運(yùn)行,每秒處理20個(gè)tokens,大約相當(dāng)于16或17個(gè)英文單詞。不過(guò),雖然PaLM 2雖然在推理和語(yǔ)言等方面取得了較為顯著的成績(jī),但它仍面臨著技術(shù)挑戰(zhàn)和大模型的共性問(wèn)題。

比如一些專家已經(jīng)開(kāi)始質(zhì)疑創(chuàng)建語(yǔ)言模型所使用訓(xùn)練數(shù)據(jù)的合法性。因?yàn)檫@些數(shù)據(jù)從互聯(lián)網(wǎng)上抓取,通常包括受版權(quán)保護(hù)的文本和盜版電子書(shū)。而谷歌在PaLM 2的升級(jí)中,也并沒(méi)有披露更多關(guān)于數(shù)據(jù)源的細(xì)節(jié)。

另外,AI“幻覺(jué)”問(wèn)題也未得到解決。大模型擅長(zhǎng)編造信息,谷歌研究副總裁Zoubin Ghahramani在接受The Verge采訪時(shí)表示,在這方面,PaLM 2是對(duì)早期模型的改進(jìn),“從某種意義上說(shuō),我們正在投入大量精力不斷改進(jìn)基礎(chǔ)性和歸因指標(biāo)”,但他指出,在AI領(lǐng)域,打擊人工智能產(chǎn)生的虛假信息,“還有很長(zhǎng)的路要走”。

二、大模型會(huì)“魔法”——編輯器和創(chuàng)作器

在這次發(fā)布會(huì)中,兩個(gè)具體的功能成為焦點(diǎn)。

第一個(gè)是Google推出的人工智能驅(qū)動(dòng)的魔法編輯器(Magic Editor)。用戶可以在照片的特定部分進(jìn)行復(fù)雜編輯,并填補(bǔ)照片空白。

另一個(gè)功能是魔術(shù)創(chuàng)作器(Magic Compose),利用生成式AI幫助人們撰寫(xiě)個(gè)性化信息。它可以以不同風(fēng)格撰寫(xiě)信息,甚至可以莎士比亞風(fēng)格的信息。

基于AI大模型,谷歌地圖還發(fā)布「沉浸式路線視圖」,在洛杉磯、舊金山、紐約、倫敦、阿姆斯特丹、柏林等15個(gè)城市進(jìn)行試點(diǎn)。用戶可在導(dǎo)航時(shí)使用該功能,提前看到整個(gè)路線的動(dòng)態(tài)街景視角,包括交通模擬、自行車道、復(fù)雜十字路口、停車等詳細(xì)信息。

除了谷歌的“魔法工具”和谷歌地圖,還有更多基于PaLM 2的AI新功能。比如,在音樂(lè)方面,谷歌推出了MusicLM,可將文本轉(zhuǎn)化為音樂(lè)。假設(shè)你在舉辦一個(gè)晚宴,通過(guò)簡(jiǎn)單輸入“晚宴的深情爵士樂(lè)”,該工具即可創(chuàng)建歌曲的多個(gè)版本。

此外,Google Workspace也實(shí)現(xiàn)了AI辦公功能。據(jù)了解,谷歌將在180多個(gè)國(guó)家和地區(qū)提供英語(yǔ)版本的Bard聊天機(jī)器人,而且還推出了對(duì)日語(yǔ)和韓語(yǔ)的支持。在不久的將來(lái),Bard會(huì)支持40種語(yǔ)言。

在此基礎(chǔ)上,谷歌還通過(guò)Bard與Adobe合作,開(kāi)發(fā)了藝術(shù)生成功能。

在谷歌文檔的側(cè)面,將會(huì)出現(xiàn)一個(gè)新面板——Sidekick,可以幫助用戶在寫(xiě)作時(shí)閱讀并整理文檔,根據(jù)上下文提供與內(nèi)容有關(guān)的建議,可以對(duì)標(biāo)Notion。

同時(shí),優(yōu)化的還有自身的搜索。據(jù)了解,谷歌正在試驗(yàn)一種由人工智能驅(qū)動(dòng)的對(duì)話模式。用戶搜索時(shí)會(huì)看到建議的后續(xù)步驟,可以根據(jù)對(duì)話模式進(jìn)入建議的下一步。此外,谷歌還引入了“觀點(diǎn)”過(guò)濾器。

三、AI生成代碼,Codey比肩GitHub Copilot

本次,Google發(fā)布的代碼生成工具「Codey」,是對(duì)GitHub Copilot的一個(gè)回應(yīng)。Codey經(jīng)過(guò)專門(mén)培訓(xùn),可以處理與編碼相關(guān)的提示,并且還接受過(guò)處理與Google Cloud相關(guān)查詢培訓(xùn)。

Codey是基于谷歌的PaLM 2大語(yǔ)言模型的編碼工具。谷歌表示,該工具是在大量獲得許可的開(kāi)源代碼、大量?jī)?nèi)部谷歌代碼、公司所有代碼示例及其參考應(yīng)用程序的基礎(chǔ)上進(jìn)行訓(xùn)練的。

谷歌表示,該模型是在大量獲得許可的開(kāi)源代碼、大量?jī)?nèi)部谷歌代碼、公司所有代碼示例及其參考應(yīng)用程序的基礎(chǔ)上進(jìn)行訓(xùn)練的。開(kāi)發(fā)人員能夠直接在他們的IDE聊天框中與Codey聊天,或者在文本文件中寫(xiě)評(píng)論,讓它生成相關(guān)代碼。

對(duì)于Codey,谷歌的愿景是,它希望通過(guò)這種聊天機(jī)器人技術(shù),在不久的將來(lái),開(kāi)發(fā)人員可以管理他們?cè)诠雀柙粕系乃蟹?wù),包括部署和擴(kuò)展應(yīng)用程序。

四、谷歌云的“三大基礎(chǔ)模型”

從Transformer架構(gòu)到PaLM 2,除卻GPT模型之外,實(shí)際上,谷歌一直保持領(lǐng)導(dǎo)者地位。

在本次在Google I/O 2023大會(huì)上,Google Cloud又邁出了一大步,對(duì)代碼生成模式和模型調(diào)整都做出了改善。以下為本次更新的三大基礎(chǔ)模型:

Codey,文本到代碼模型,幫助開(kāi)發(fā)人員完成代碼、生成和聊天

Imagen,文本到圖像模型,幫助客戶生成和編輯高質(zhì)量圖像,滿足任何業(yè)務(wù)需求

Chirp,語(yǔ)音轉(zhuǎn)文本模型,用于翻譯、溝通和交流

這些基礎(chǔ)模型可通過(guò)API訪問(wèn),也可以在生成式AI Studio中的UI進(jìn)行調(diào)整,或部署到數(shù)據(jù)科學(xué)筆記本。

值得一提的是,獨(dú)特的調(diào)優(yōu)功能能夠結(jié)合人工反饋來(lái)訓(xùn)練,可用于微調(diào)基礎(chǔ)模型的獎(jiǎng)勵(lì)模型。這對(duì)于醫(yī)療、金融和電子商務(wù)等行業(yè)有著十分重要的應(yīng)用。

寫(xiě)在最后:

今年,Google I/O大會(huì)之所以備受關(guān)注的一個(gè)焦點(diǎn)在于,其基于自身的大模型,谷歌做到了將固有的全部產(chǎn)品接近重塑的程度,這種重塑不單純是產(chǎn)品邏輯上的重塑,更是能真實(shí)落地、真實(shí)使用的重構(gòu)。

比如面向C端的辦公文檔,比如與Adobe結(jié)合的圖片設(shè)計(jì),比如文生圖、圖生文、文生音樂(lè)等等,相較于Open-AI的發(fā)布,谷歌的大模型表達(dá)更加具象和入微,也更貼近人們生活的場(chǎng)景。

而在B端業(yè)務(wù)上,更是如此。

不論是其在低代碼/無(wú)代碼上的進(jìn)一步邁步,還是基于谷歌云三大模型的梳理和拆解,再或者是在機(jī)器人智能的結(jié)合下進(jìn)行智能交互、智能指令的新企業(yè)模式,都展示出谷歌可以將AI大模型真正應(yīng)用到企業(yè)生產(chǎn)和TO B場(chǎng)景中。這種應(yīng)用不是單純的AI算法,而是真正基于大模型的特定業(yè)務(wù)表達(dá)。

從這些視角來(lái)看,這也更是中國(guó)大模型應(yīng)該去踐行的。

在過(guò)去的多年時(shí)間里,中國(guó)在移動(dòng)互聯(lián)網(wǎng)方面處于領(lǐng)先地位,這種領(lǐng)先體現(xiàn)在互聯(lián)網(wǎng)的廣泛使用、智能手機(jī)的極高普及率,這些領(lǐng)先最終沉淀出的就是真實(shí)有價(jià)值的數(shù)據(jù),而這也是如今百度騰訊阿里京東以及其它企業(yè)做大模型的基礎(chǔ)。

但在數(shù)據(jù)訓(xùn)練之上,基于軟件層面和基于開(kāi)發(fā)層面的真實(shí)場(chǎng)景的表達(dá),如今卻甚為少見(jiàn)。

或者說(shuō),單純的比較參數(shù)量級(jí)僅代表的是大模型本身的能力,而并不是其能賦能產(chǎn)業(yè)的能力,谷歌和微軟的成功應(yīng)用也在昭示這一點(diǎn):大模型應(yīng)該和真正的場(chǎng)景結(jié)合,基于此才能釋放更大的想象力和價(jià)值。

不論是谷歌,還是微軟,在其大模型發(fā)布后,都能看到的是其矩陣內(nèi)的產(chǎn)品的迅速跟進(jìn),對(duì)中國(guó)大模型企業(yè)而言,也更應(yīng)該強(qiáng)化大模型的應(yīng)用層,在具備微信、淘寶等一眾全球移動(dòng)互聯(lián)網(wǎng)時(shí)代最有明星價(jià)值的產(chǎn)品的土壤上,在這個(gè)制造業(yè)發(fā)達(dá),供應(yīng)鏈眾多,數(shù)字化轉(zhuǎn)型迫切的環(huán)境里,中國(guó)本土的大模型具備的價(jià)值將更大,其能攪動(dòng)的市場(chǎng)變化也會(huì)更為劇烈。

對(duì)中國(guó)大模型廠商而言,市場(chǎng)期待的,也恰是這些真正可落地的應(yīng)用和實(shí)踐。這些實(shí)踐可以在社交,在電商,在低代碼,在供應(yīng)鏈,也更可以在一個(gè)個(gè)中國(guó)產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型的新洼地。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。