正在閱讀:

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風(fēng)頭

掃一掃下載界面新聞APP

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風(fēng)頭

OpenAI大戰(zhàn)谷歌。

文|鋅財(cái)經(jīng) 孫鵬越

編輯|大風(fēng)

這些天的硅谷,亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平臺(tái)公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競(jìng)爭(zhēng)對(duì)手,但我無法不去思考OpenAI和谷歌之間的美學(xué)差異。

下面附著的兩張發(fā)布會(huì)現(xiàn)場(chǎng)圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI干凈明了,極具科技感;而谷歌則離人群非常遠(yuǎn),十分過時(shí)。

山姆-奧特曼如此氣急敗壞,還是因?yàn)樵谏现?,OpenAI和谷歌同時(shí)發(fā)布AI新品,雙方打的你來我往:你說GPT-4o全球最先進(jìn),我說Gemini家族能覆蓋全生態(tài)全路徑。

兩家硅谷巨頭的直接對(duì)抗,把科技競(jìng)賽的強(qiáng)度拉滿,就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌并不是無的放矢,這場(chǎng)谷歌I/O大會(huì)在觀看性上,確實(shí)難以令人滿意。

首先是時(shí)間太長(zhǎng),谷歌I/O大會(huì)足足有接近兩個(gè)小時(shí),主持人連續(xù)提起了121次AI字眼,甚至有觀眾在社交平臺(tái)抱怨自己都快睡著了。

然后就是產(chǎn)品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級(jí)及新品,可以說是“AI全家桶”。

發(fā)布AI搜索:Google Search;

升級(jí)了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);

新發(fā)布了手機(jī)版Gemini App:以手機(jī)應(yīng)用程序形式,支持和AI視頻對(duì)話;

發(fā)布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。

雖然谷歌AI全家桶看上去格外炫酷,但實(shí)際上對(duì)比OpenAI的GPT-4o依然差上很多,更多是硬件性升級(jí),單純給大模型升級(jí)一下參數(shù)。

最令人印象深刻的兩項(xiàng)功能,是AI搜索Google Search和AI助理Project Astra。

首先是Google Search,搜索作為谷歌起家的根本,這些年遭受到了微軟的重創(chuàng)。微軟的Bing已經(jīng)借助ChatGPT,給傳統(tǒng)搜索引擎帶來了“億點(diǎn)點(diǎn)”AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類產(chǎn)品,來搶占Google搜索市場(chǎng)。

壓力之下,谷歌推出Google Search來穩(wěn)定自家護(hù)城河,下定決心重塑搜索體驗(yàn)。

據(jù)演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。

所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(yàn)(SGE)”。

用戶在搜索框內(nèi)鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對(duì)搜索結(jié)果的總結(jié)和概括,以及推薦的鏈接。

AI Overview還內(nèi)置了“多步推理功能Multi-Step Reasoning”、“計(jì)劃功能Planning in Search”、“視頻提問Ask With Video”。

另外一個(gè)發(fā)布會(huì)亮點(diǎn),就是谷歌推出的AI助理Project Astra。

Project Astra就是一個(gè)完全對(duì)標(biāo)GPT-4o的產(chǎn)品,產(chǎn)品形態(tài)和使用邏輯基本和ChatGPT無二。用戶可以和它實(shí)時(shí)對(duì)話、視頻聊天。

并且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項(xiàng)功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。

唯一有點(diǎn)不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎(chǔ)上拓展延長(zhǎng)。用戶還可以輸入提示詞,進(jìn)一步調(diào)整音樂風(fēng)格,進(jìn)行樂曲的二度創(chuàng)作。

總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。

我們能在一系列AI新產(chǎn)品里,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架里縫縫補(bǔ)補(bǔ),升級(jí)一下算力,換個(gè)新框架。

能給用戶帶來震撼感的產(chǎn)品呢?

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到凌亂,OpenAI則是簡(jiǎn)潔明了。

僅僅只有半個(gè)多小時(shí),全程由公司CTO和兩位工程師face to face,以對(duì)話形式展示產(chǎn)品,非常具有電影感。

甚至CEO山姆-奧特曼都沒有現(xiàn)身發(fā)布會(huì),完全用產(chǎn)品力來震撼用戶。

現(xiàn)場(chǎng)的演示嘉賓拿著手機(jī)攝像頭,讓GPT-4o識(shí)別自己的表情,來判斷自己的情緒。

GPT-4o很快識(shí)別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?

演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應(yīng)著人類的“愛意”。

GPT-4o能感受到你的呼吸節(jié)奏、能“看出”你文字當(dāng)中包含的情緒、甚至可以打斷它的話,重新為話題增加新的語境,它也能作出完美回應(yīng)……

這樣的人工智能,讓你想到了什么?

是的,一個(gè)完美戀人。

就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕,逐漸成為現(xiàn)實(shí)。誰會(huì)不喜歡一個(gè)熱情洋溢、事事有回應(yīng)、提供豐富情緒價(jià)值的伴侶呢?

哪怕它是AI。

GPT-4o給后來者谷歌一個(gè)下馬威,也給出未來AI大模型的一個(gè)滿分答案:不管是生成式AI大模型也好,聊天機(jī)器人也好,不用再去關(guān)心什么硬件什么參數(shù),AI的最終方向就是越來越像人類。

OpenAI并沒有過多描述自己的算力、自己的硬件升級(jí),只是由首席技術(shù)官穆里·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進(jìn)一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進(jìn)行推理?!?/p>

現(xiàn)階段的GPT-4o已經(jīng)擺脫了對(duì)文本、圖片或語音的束縛,它的識(shí)別能力進(jìn)化到了“聽覺”和“視覺”。

用“聽”來捕捉情緒變化,比如能判斷對(duì)方急促的呼吸方式不對(duì);用“看”來識(shí)別你寫在紙上的方程式數(shù)學(xué)問題,一步步教你解題步驟。

甚至它還可以通過手機(jī)攝像頭,回答你“這個(gè)人穿什么牌子的襯衫?”

比起谷歌眼花繚亂、不知從哪下手的AI全家桶,GPT-4o已經(jīng)領(lǐng)先到大氣層了。

免費(fèi),但又不完全免費(fèi)

GPT-4o除了在能力上,給了谷歌一個(gè)下馬威外,OpenAI還放了大招:

穆里-穆拉蒂表示,GPT-4o將免費(fèi)提供給所有用戶使用,不但當(dāng)下免費(fèi),甚至以后OpenAI做產(chǎn)品就是要免費(fèi)優(yōu)先,為的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費(fèi)版本還是付費(fèi)GPT-4版。

不得不說,當(dāng)服務(wù)免費(fèi)時(shí),用戶就是產(chǎn)品。

如果GPT-4o真的能徹底取消付費(fèi)制度,那么OpenAI獲得的數(shù)據(jù)量會(huì)超出想象。

可惜的是,OpenAI還是缺少“用免費(fèi)改變世界”的魄力,背后還是有不少的貓膩。

首先,OpenA在官網(wǎng)公告上明確說明,免費(fèi)用戶在使用GPT-4o時(shí),OpenAI做出了權(quán)限上的分級(jí)。

免費(fèi)用戶可以使用GPT-4o的分析數(shù)據(jù)、創(chuàng)建報(bào)表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費(fèi)功能。

但是免費(fèi)用戶會(huì)有消息數(shù)量的限制,PIUS用戶的消息將是免費(fèi)用戶的5倍,Team和Enterprise用戶限制將會(huì)更高。

每天能用多久?每天能發(fā)幾條?GPT-4o并沒有詳細(xì)說明。

或許,我們可以參考OpenAI上一代GPT-4,限制每個(gè)用戶每天的使用時(shí)間在3小時(shí)以內(nèi),并限制每天生成的信息數(shù)量不超過25條。

雖然說這一限制在一定程度上,提高了信息的質(zhì)量和用戶的注意力。但還是要感嘆一句,互聯(lián)網(wǎng)的免費(fèi),永遠(yuǎn)不是真免費(fèi)。

哪怕到了AI時(shí)代,這個(gè)法則也同樣適用。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

OpenAI

  • 阿里云通義開源首個(gè)多模態(tài)推理模型QVQ
  • OpenAI已討論開發(fā)一款人形機(jī)器人

評(píng)論

暫無評(píng)論哦,快來評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風(fēng)頭

OpenAI大戰(zhàn)谷歌。

文|鋅財(cái)經(jīng) 孫鵬越

編輯|大風(fēng)

這些天的硅谷,亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平臺(tái)公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競(jìng)爭(zhēng)對(duì)手,但我無法不去思考OpenAI和谷歌之間的美學(xué)差異。

下面附著的兩張發(fā)布會(huì)現(xiàn)場(chǎng)圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI干凈明了,極具科技感;而谷歌則離人群非常遠(yuǎn),十分過時(shí)。

山姆-奧特曼如此氣急敗壞,還是因?yàn)樵谏现埽琌penAI和谷歌同時(shí)發(fā)布AI新品,雙方打的你來我往:你說GPT-4o全球最先進(jìn),我說Gemini家族能覆蓋全生態(tài)全路徑。

兩家硅谷巨頭的直接對(duì)抗,把科技競(jìng)賽的強(qiáng)度拉滿,就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌并不是無的放矢,這場(chǎng)谷歌I/O大會(huì)在觀看性上,確實(shí)難以令人滿意。

首先是時(shí)間太長(zhǎng),谷歌I/O大會(huì)足足有接近兩個(gè)小時(shí),主持人連續(xù)提起了121次AI字眼,甚至有觀眾在社交平臺(tái)抱怨自己都快睡著了。

然后就是產(chǎn)品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級(jí)及新品,可以說是“AI全家桶”。

發(fā)布AI搜索:Google Search;

升級(jí)了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);

新發(fā)布了手機(jī)版Gemini App:以手機(jī)應(yīng)用程序形式,支持和AI視頻對(duì)話;

發(fā)布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。

雖然谷歌AI全家桶看上去格外炫酷,但實(shí)際上對(duì)比OpenAI的GPT-4o依然差上很多,更多是硬件性升級(jí),單純給大模型升級(jí)一下參數(shù)。

最令人印象深刻的兩項(xiàng)功能,是AI搜索Google Search和AI助理Project Astra。

首先是Google Search,搜索作為谷歌起家的根本,這些年遭受到了微軟的重創(chuàng)。微軟的Bing已經(jīng)借助ChatGPT,給傳統(tǒng)搜索引擎帶來了“億點(diǎn)點(diǎn)”AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類產(chǎn)品,來搶占Google搜索市場(chǎng)。

壓力之下,谷歌推出Google Search來穩(wěn)定自家護(hù)城河,下定決心重塑搜索體驗(yàn)。

據(jù)演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。

所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(yàn)(SGE)”。

用戶在搜索框內(nèi)鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對(duì)搜索結(jié)果的總結(jié)和概括,以及推薦的鏈接。

AI Overview還內(nèi)置了“多步推理功能Multi-Step Reasoning”、“計(jì)劃功能Planning in Search”、“視頻提問Ask With Video”。

另外一個(gè)發(fā)布會(huì)亮點(diǎn),就是谷歌推出的AI助理Project Astra。

Project Astra就是一個(gè)完全對(duì)標(biāo)GPT-4o的產(chǎn)品,產(chǎn)品形態(tài)和使用邏輯基本和ChatGPT無二。用戶可以和它實(shí)時(shí)對(duì)話、視頻聊天。

并且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項(xiàng)功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。

唯一有點(diǎn)不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎(chǔ)上拓展延長(zhǎng)。用戶還可以輸入提示詞,進(jìn)一步調(diào)整音樂風(fēng)格,進(jìn)行樂曲的二度創(chuàng)作。

總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。

我們能在一系列AI新產(chǎn)品里,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架里縫縫補(bǔ)補(bǔ),升級(jí)一下算力,換個(gè)新框架。

能給用戶帶來震撼感的產(chǎn)品呢?

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到凌亂,OpenAI則是簡(jiǎn)潔明了。

僅僅只有半個(gè)多小時(shí),全程由公司CTO和兩位工程師face to face,以對(duì)話形式展示產(chǎn)品,非常具有電影感。

甚至CEO山姆-奧特曼都沒有現(xiàn)身發(fā)布會(huì),完全用產(chǎn)品力來震撼用戶。

現(xiàn)場(chǎng)的演示嘉賓拿著手機(jī)攝像頭,讓GPT-4o識(shí)別自己的表情,來判斷自己的情緒。

GPT-4o很快識(shí)別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?

演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應(yīng)著人類的“愛意”。

GPT-4o能感受到你的呼吸節(jié)奏、能“看出”你文字當(dāng)中包含的情緒、甚至可以打斷它的話,重新為話題增加新的語境,它也能作出完美回應(yīng)……

這樣的人工智能,讓你想到了什么?

是的,一個(gè)完美戀人。

就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕,逐漸成為現(xiàn)實(shí)。誰會(huì)不喜歡一個(gè)熱情洋溢、事事有回應(yīng)、提供豐富情緒價(jià)值的伴侶呢?

哪怕它是AI。

GPT-4o給后來者谷歌一個(gè)下馬威,也給出未來AI大模型的一個(gè)滿分答案:不管是生成式AI大模型也好,聊天機(jī)器人也好,不用再去關(guān)心什么硬件什么參數(shù),AI的最終方向就是越來越像人類。

OpenAI并沒有過多描述自己的算力、自己的硬件升級(jí),只是由首席技術(shù)官穆里·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進(jìn)一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進(jìn)行推理。”

現(xiàn)階段的GPT-4o已經(jīng)擺脫了對(duì)文本、圖片或語音的束縛,它的識(shí)別能力進(jìn)化到了“聽覺”和“視覺”。

用“聽”來捕捉情緒變化,比如能判斷對(duì)方急促的呼吸方式不對(duì);用“看”來識(shí)別你寫在紙上的方程式數(shù)學(xué)問題,一步步教你解題步驟。

甚至它還可以通過手機(jī)攝像頭,回答你“這個(gè)人穿什么牌子的襯衫?”

比起谷歌眼花繚亂、不知從哪下手的AI全家桶,GPT-4o已經(jīng)領(lǐng)先到大氣層了。

免費(fèi),但又不完全免費(fèi)

GPT-4o除了在能力上,給了谷歌一個(gè)下馬威外,OpenAI還放了大招:

穆里-穆拉蒂表示,GPT-4o將免費(fèi)提供給所有用戶使用,不但當(dāng)下免費(fèi),甚至以后OpenAI做產(chǎn)品就是要免費(fèi)優(yōu)先,為的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費(fèi)版本還是付費(fèi)GPT-4版。

不得不說,當(dāng)服務(wù)免費(fèi)時(shí),用戶就是產(chǎn)品。

如果GPT-4o真的能徹底取消付費(fèi)制度,那么OpenAI獲得的數(shù)據(jù)量會(huì)超出想象。

可惜的是,OpenAI還是缺少“用免費(fèi)改變世界”的魄力,背后還是有不少的貓膩。

首先,OpenA在官網(wǎng)公告上明確說明,免費(fèi)用戶在使用GPT-4o時(shí),OpenAI做出了權(quán)限上的分級(jí)。

免費(fèi)用戶可以使用GPT-4o的分析數(shù)據(jù)、創(chuàng)建報(bào)表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費(fèi)功能。

但是免費(fèi)用戶會(huì)有消息數(shù)量的限制,PIUS用戶的消息將是免費(fèi)用戶的5倍,Team和Enterprise用戶限制將會(huì)更高。

每天能用多久?每天能發(fā)幾條?GPT-4o并沒有詳細(xì)說明。

或許,我們可以參考OpenAI上一代GPT-4,限制每個(gè)用戶每天的使用時(shí)間在3小時(shí)以內(nèi),并限制每天生成的信息數(shù)量不超過25條。

雖然說這一限制在一定程度上,提高了信息的質(zhì)量和用戶的注意力。但還是要感嘆一句,互聯(lián)網(wǎng)的免費(fèi),永遠(yuǎn)不是真免費(fèi)。

哪怕到了AI時(shí)代,這個(gè)法則也同樣適用。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。