正在閱讀:

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風頭

掃一掃下載界面新聞APP

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風頭

OpenAI大戰(zhàn)谷歌。

文|鋅財經 孫鵬越

編輯|大風

這些天的硅谷,亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平臺公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競爭對手,但我無法不去思考OpenAI和谷歌之間的美學差異。

下面附著的兩張發(fā)布會現(xiàn)場圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI干凈明了,極具科技感;而谷歌則離人群非常遠,十分過時。

山姆-奧特曼如此氣急敗壞,還是因為在上周,OpenAI和谷歌同時發(fā)布AI新品,雙方打的你來我往:你說GPT-4o全球最先進,我說Gemini家族能覆蓋全生態(tài)全路徑。

兩家硅谷巨頭的直接對抗,把科技競賽的強度拉滿,就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌并不是無的放矢,這場谷歌I/O大會在觀看性上,確實難以令人滿意。

首先是時間太長,谷歌I/O大會足足有接近兩個小時,主持人連續(xù)提起了121次AI字眼,甚至有觀眾在社交平臺抱怨自己都快睡著了。

然后就是產品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級及新品,可以說是“AI全家桶”。

發(fā)布AI搜索:Google Search;

升級了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);

新發(fā)布了手機版Gemini App:以手機應用程序形式,支持和AI視頻對話;

發(fā)布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。

雖然谷歌AI全家桶看上去格外炫酷,但實際上對比OpenAI的GPT-4o依然差上很多,更多是硬件性升級,單純給大模型升級一下參數(shù)。

最令人印象深刻的兩項功能,是AI搜索Google Search和AI助理Project Astra。

首先是Google Search,搜索作為谷歌起家的根本,這些年遭受到了微軟的重創(chuàng)。微軟的Bing已經借助ChatGPT,給傳統(tǒng)搜索引擎帶來了“億點點”AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類產品,來搶占Google搜索市場。

壓力之下,谷歌推出Google Search來穩(wěn)定自家護城河,下定決心重塑搜索體驗。

據(jù)演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。

所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(SGE)”。

用戶在搜索框內鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對搜索結果的總結和概括,以及推薦的鏈接。

AI Overview還內置了“多步推理功能Multi-Step Reasoning”、“計劃功能Planning in Search”、“視頻提問Ask With Video”。

另外一個發(fā)布會亮點,就是谷歌推出的AI助理Project Astra。

Project Astra就是一個完全對標GPT-4o的產品,產品形態(tài)和使用邏輯基本和ChatGPT無二。用戶可以和它實時對話、視頻聊天。

并且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。

唯一有點不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎上拓展延長。用戶還可以輸入提示詞,進一步調整音樂風格,進行樂曲的二度創(chuàng)作。

總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。

我們能在一系列AI新產品里,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架里縫縫補補,升級一下算力,換個新框架。

能給用戶帶來震撼感的產品呢?

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到凌亂,OpenAI則是簡潔明了。

僅僅只有半個多小時,全程由公司CTO和兩位工程師face to face,以對話形式展示產品,非常具有電影感。

甚至CEO山姆-奧特曼都沒有現(xiàn)身發(fā)布會,完全用產品力來震撼用戶。

現(xiàn)場的演示嘉賓拿著手機攝像頭,讓GPT-4o識別自己的表情,來判斷自己的情緒。

GPT-4o很快識別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?

演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應著人類的“愛意”。

GPT-4o能感受到你的呼吸節(jié)奏、能“看出”你文字當中包含的情緒、甚至可以打斷它的話,重新為話題增加新的語境,它也能作出完美回應……

這樣的人工智能,讓你想到了什么?

是的,一個完美戀人。

就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕,逐漸成為現(xiàn)實。誰會不喜歡一個熱情洋溢、事事有回應、提供豐富情緒價值的伴侶呢?

哪怕它是AI。

GPT-4o給后來者谷歌一個下馬威,也給出未來AI大模型的一個滿分答案:不管是生成式AI大模型也好,聊天機器人也好,不用再去關心什么硬件什么參數(shù),AI的最終方向就是越來越像人類。

OpenAI并沒有過多描述自己的算力、自己的硬件升級,只是由首席技術官穆里·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進行推理。”

現(xiàn)階段的GPT-4o已經擺脫了對文本、圖片或語音的束縛,它的識別能力進化到了“聽覺”和“視覺”。

用“聽”來捕捉情緒變化,比如能判斷對方急促的呼吸方式不對;用“看”來識別你寫在紙上的方程式數(shù)學問題,一步步教你解題步驟。

甚至它還可以通過手機攝像頭,回答你“這個人穿什么牌子的襯衫?”

比起谷歌眼花繚亂、不知從哪下手的AI全家桶,GPT-4o已經領先到大氣層了。

免費,但又不完全免費

GPT-4o除了在能力上,給了谷歌一個下馬威外,OpenAI還放了大招:

穆里-穆拉蒂表示,GPT-4o將免費提供給所有用戶使用,不但當下免費,甚至以后OpenAI做產品就是要免費優(yōu)先,為的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。

不得不說,當服務免費時,用戶就是產品。

如果GPT-4o真的能徹底取消付費制度,那么OpenAI獲得的數(shù)據(jù)量會超出想象。

可惜的是,OpenAI還是缺少“用免費改變世界”的魄力,背后還是有不少的貓膩。

首先,OpenA在官網(wǎng)公告上明確說明,免費用戶在使用GPT-4o時,OpenAI做出了權限上的分級。

免費用戶可以使用GPT-4o的分析數(shù)據(jù)、創(chuàng)建報表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費功能。

但是免費用戶會有消息數(shù)量的限制,PIUS用戶的消息將是免費用戶的5倍,Team和Enterprise用戶限制將會更高。

每天能用多久?每天能發(fā)幾條?GPT-4o并沒有詳細說明。

或許,我們可以參考OpenAI上一代GPT-4,限制每個用戶每天的使用時間在3小時以內,并限制每天生成的信息數(shù)量不超過25條。

雖然說這一限制在一定程度上,提高了信息的質量和用戶的注意力。但還是要感嘆一句,互聯(lián)網(wǎng)的免費,永遠不是真免費。

哪怕到了AI時代,這個法則也同樣適用。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。

OpenAI

  • OpenAI任命Aaron Chatterji擔任首席經濟學家
  • OpenAI聘請優(yōu)步前高管為首席合規(guī)官

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

山姆-奧特曼怒噴谷歌,GPT-4o搶了Gemini風頭

OpenAI大戰(zhàn)谷歌。

文|鋅財經 孫鵬越

編輯|大風

這些天的硅谷,亂成了一鍋粥。

OpenAI CEO山姆-奧特曼直接在社交平臺公開嘲諷谷歌的審美過于差勁,他表示:我努力不去過多思考我們的競爭對手,但我無法不去思考OpenAI和谷歌之間的美學差異。

下面附著的兩張發(fā)布會現(xiàn)場圖,左邊是OpenAI,右邊是谷歌。言下之意,就是OpenAI干凈明了,極具科技感;而谷歌則離人群非常遠,十分過時。

山姆-奧特曼如此氣急敗壞,還是因為在上周,OpenAI和谷歌同時發(fā)布AI新品,雙方打的你來我往:你說GPT-4o全球最先進,我說Gemini家族能覆蓋全生態(tài)全路徑。

兩家硅谷巨頭的直接對抗,把科技競賽的強度拉滿,就連CEO本人都坐不住了。

谷歌AI全家桶上線

山姆-奧特曼嘲諷谷歌并不是無的放矢,這場谷歌I/O大會在觀看性上,確實難以令人滿意。

首先是時間太長,谷歌I/O大會足足有接近兩個小時,主持人連續(xù)提起了121次AI字眼,甚至有觀眾在社交平臺抱怨自己都快睡著了。

然后就是產品太多,比起OpenAI僅有GPT-4o一款新品,谷歌這次則推出了十余種Gemini大模型的升級及新品,可以說是“AI全家桶”。

發(fā)布AI搜索:Google Search;

升級了Gemini大模型:Gemini 1.5 Flash(100 萬上下文)、Gemini Pro(200 萬上下文);

新發(fā)布了手機版Gemini App:以手機應用程序形式,支持和AI視頻對話;

發(fā)布視覺語言模型Project Astra:擁有Imagen3(圖像)、Music AI Sandbox(音樂)、Veo(視頻生成)三種能力。

雖然谷歌AI全家桶看上去格外炫酷,但實際上對比OpenAI的GPT-4o依然差上很多,更多是硬件性升級,單純給大模型升級一下參數(shù)。

最令人印象深刻的兩項功能,是AI搜索Google Search和AI助理Project Astra。

首先是Google Search,搜索作為谷歌起家的根本,這些年遭受到了微軟的重創(chuàng)。微軟的Bing已經借助ChatGPT,給傳統(tǒng)搜索引擎帶來了“億點點”AI降維打擊。

甚至就連OpenAI也在盛傳將推出AI搜索類產品,來搶占Google搜索市場。

壓力之下,谷歌推出Google Search來穩(wěn)定自家護城河,下定決心重塑搜索體驗。

據(jù)演示視頻來看,Google Search最核心的功能,就是搜索摘要功能AI Overview。

所謂的“搜索摘要功能”,就是谷歌之前提出來的“搜索生成式體驗(SGE)”。

用戶在搜索框內鍵入文本,直接在最上方跳出AI幫忙整理的信息摘要。其中包含用自然語言對搜索結果的總結和概括,以及推薦的鏈接。

AI Overview還內置了“多步推理功能Multi-Step Reasoning”、“計劃功能Planning in Search”、“視頻提問Ask With Video”。

另外一個發(fā)布會亮點,就是谷歌推出的AI助理Project Astra。

Project Astra就是一個完全對標GPT-4o的產品,產品形態(tài)和使用邏輯基本和ChatGPT無二。用戶可以和它實時對話、視頻聊天。

并且,和GPT-4o一樣,Project Astra也提供文生圖、文生視頻兩項功能。只不過不叫DALL·E和Sora,而是叫做Imagen 3和Veo。

唯一有點不一樣的,就是Project Astra提供了音樂生成模型Music AI Sandbox。

用戶可以上傳一小段音樂demo,Music AI Sandbox能在此基礎上拓展延長。用戶還可以輸入提示詞,進一步調整音樂風格,進行樂曲的二度創(chuàng)作。

總之,用一句話來概括谷歌AI全家桶,就是:東西很多,精品很少。

我們能在一系列AI新產品里,不斷看到ChatGPT的影子,但單純是在GPT-4o做好的框架里縫縫補補,升級一下算力,換個新框架。

能給用戶帶來震撼感的產品呢?

依然沒有看到。

越來越像人類的GPT-4o

比起谷歌的多到凌亂,OpenAI則是簡潔明了。

僅僅只有半個多小時,全程由公司CTO和兩位工程師face to face,以對話形式展示產品,非常具有電影感。

甚至CEO山姆-奧特曼都沒有現(xiàn)身發(fā)布會,完全用產品力來震撼用戶。

現(xiàn)場的演示嘉賓拿著手機攝像頭,讓GPT-4o識別自己的表情,來判斷自己的情緒。

GPT-4o很快識別完成,說:你看起來很開心,帶著燦爛的笑容,甚至有一絲興奮,你能分享你快樂的來源嗎?

演示嘉賓在紙上寫了“i love you”給GPT-4o,GPT-4o用帶有一絲絲嬌羞、熱情四溢的語氣快速回應著人類的“愛意”。

GPT-4o能感受到你的呼吸節(jié)奏、能“看出”你文字當中包含的情緒、甚至可以打斷它的話,重新為話題增加新的語境,它也能作出完美回應……

這樣的人工智能,讓你想到了什么?

是的,一個完美戀人。

就像是2013年上映的好萊塢電影《Her》,斯嘉麗配音的人工智能和人類談起了戀愛。

這一幕,逐漸成為現(xiàn)實。誰會不喜歡一個熱情洋溢、事事有回應、提供豐富情緒價值的伴侶呢?

哪怕它是AI。

GPT-4o給后來者谷歌一個下馬威,也給出未來AI大模型的一個滿分答案:不管是生成式AI大模型也好,聊天機器人也好,不用再去關心什么硬件什么參數(shù),AI的最終方向就是越來越像人類。

OpenAI并沒有過多描述自己的算力、自己的硬件升級,只是由首席技術官穆里·穆拉蒂 (Muri Murati) 表示,GPT-4o將提供與GPT-4同等水平的智能,但在文本、圖像以及語音處理方面均取得了進一步提升,“GPT-4o可以綜合利用語音、文本和視覺信息進行推理。”

現(xiàn)階段的GPT-4o已經擺脫了對文本、圖片或語音的束縛,它的識別能力進化到了“聽覺”和“視覺”。

用“聽”來捕捉情緒變化,比如能判斷對方急促的呼吸方式不對;用“看”來識別你寫在紙上的方程式數(shù)學問題,一步步教你解題步驟。

甚至它還可以通過手機攝像頭,回答你“這個人穿什么牌子的襯衫?”

比起谷歌眼花繚亂、不知從哪下手的AI全家桶,GPT-4o已經領先到大氣層了。

免費,但又不完全免費

GPT-4o除了在能力上,給了谷歌一個下馬威外,OpenAI還放了大招:

穆里-穆拉蒂表示,GPT-4o將免費提供給所有用戶使用,不但當下免費,甚至以后OpenAI做產品就是要免費優(yōu)先,為的就是讓更多的人能使用。

就連OpenAI CEO山姆奧特曼表示,新的GPT-4o是OpenAI有史以來最好的模型,它可供所有ChatGPT用戶使用,無論是免費版本還是付費GPT-4版。

不得不說,當服務免費時,用戶就是產品。

如果GPT-4o真的能徹底取消付費制度,那么OpenAI獲得的數(shù)據(jù)量會超出想象。

可惜的是,OpenAI還是缺少“用免費改變世界”的魄力,背后還是有不少的貓膩。

首先,OpenA在官網(wǎng)公告上明確說明,免費用戶在使用GPT-4o時,OpenAI做出了權限上的分級。

免費用戶可以使用GPT-4o的分析數(shù)據(jù)、創(chuàng)建報表、處理照片、上傳文件、使用記憶功能等,基本上GPT-4o涵蓋了GPT4所有的付費功能。

但是免費用戶會有消息數(shù)量的限制,PIUS用戶的消息將是免費用戶的5倍,Team和Enterprise用戶限制將會更高。

每天能用多久?每天能發(fā)幾條?GPT-4o并沒有詳細說明。

或許,我們可以參考OpenAI上一代GPT-4,限制每個用戶每天的使用時間在3小時以內,并限制每天生成的信息數(shù)量不超過25條。

雖然說這一限制在一定程度上,提高了信息的質量和用戶的注意力。但還是要感嘆一句,互聯(lián)網(wǎng)的免費,永遠不是真免費。

哪怕到了AI時代,這個法則也同樣適用。

本文為轉載內容,授權事宜請聯(lián)系原著作權人。