文|烏鴉智能說
據(jù)多家外媒近日?qǐng)?bào)道,知情人士透露稱,OpenAI正秘密研發(fā)一款新的搜索引擎,可能叫SearchGPT或Sonic,目標(biāo)是挑戰(zhàn)Google的搜索霸權(quán)。
“OpenAI即將向谷歌搜索發(fā)起挑戰(zhàn),這是谷歌迄今為止面臨的最嚴(yán)重威脅。”前 Mila 研究員、麻省理工講師Lior S在X平臺(tái)上爆料稱。
據(jù)X用戶名為Jimmy Apples的人工智能領(lǐng)域的知名爆料者預(yù)測(cè),OpenAI將在5月9日發(fā)布新產(chǎn)品。而值得注意的是,谷歌I/O開發(fā)者大會(huì)將于5月14日召開。也就是說,OpenAI將搶在這場(chǎng)盛會(huì)之前發(fā)布搜索產(chǎn)品,大有“先發(fā)制人”之意。
有趣的是,當(dāng)OpenAI搜索即將上線消息傳出,谷歌的股價(jià)沒有絲毫變化。這與一年前ChatGPT橫空出世,眾人大呼敲響搜索的喪鐘形成了天然之別。
為什么OpenAI會(huì)盯上谷歌這塊“蛋糕”?我們又該如何看待谷歌搜索業(yè)務(wù)的前景呢?
/ 01 / 盯上搜索“蛋糕”
從定義上看,搜索本質(zhì)是聯(lián)合整合信息的能力,AI搜索更進(jìn)一步,不用用戶挨個(gè)點(diǎn)開鏈接了,直接給你答案,相當(dāng)于升級(jí)版的搜索。根據(jù)業(yè)內(nèi)人士透露,有超過一半用戶在百度里輸入長(zhǎng)句子,甚至最后還帶問號(hào)。
這意味著,搜索幾乎是AI應(yīng)用最成熟的場(chǎng)景。Perplexity持續(xù)的流量增長(zhǎng)就是最好的證明。在a16z 最新發(fā)布的月訪問量前 50 的 GenAI 產(chǎn)品中,PerplexityAI 排名高居第七。根據(jù)Similarweb數(shù)據(jù),Perplexity今年前三月的流量分別為4560萬(wàn)、4954萬(wàn)和6149萬(wàn)。
盡管用戶體量依然差谷歌幾個(gè)量級(jí),但Perplexity仍然在一個(gè)Google長(zhǎng)期霸占的市場(chǎng)利用AI獲得了階段性顛覆成果。
在這樣的成績(jī)面前,Perplexity也水漲船高。2024 年 1 月,Perplexity 籌集了近 7400 萬(wàn)美元,估值達(dá)到 5.4 億美元,3 月初,Perplexity 以 10 億美元的估值完成了 5600 萬(wàn)美元的融資。根據(jù) TechCrunch 最新報(bào)道,Perplexity 正在籌集至少 2.5 億美元資金融資,最新估值在 25~30 億美元之間。
在國(guó)內(nèi)也一樣。AI搜索秘塔是僅次于文心一言和Kimi的第三大AI應(yīng)用產(chǎn)品。今年3月,秘塔的月訪問量為721萬(wàn),增長(zhǎng)了551%。
對(duì)于OpenAI來說,高昂的估值和龐大的研發(fā)開支,迫使其需要尋求更大的商業(yè)化突破。
一方面,ChatGPT的流量和商業(yè)化遭遇了階段性瓶頸。SimilarWeb網(wǎng)站數(shù)據(jù)顯示,在經(jīng)歷了2023年初的爆炸式增長(zhǎng)之后,ChatGPT 自2023年6月全球流量下降了9.7%,流量逐月起伏。
2024年2月,隨著GPT store和Sora的發(fā)布雖有所回升,但全球流量環(huán)比僅增長(zhǎng)1%,訪問量為 16 億次,還沒有完全恢復(fù)到2023年5月達(dá)到的峰值。受限于月活起伏,ChatGPT付費(fèi)用戶規(guī)模也不到1000萬(wàn)。
縱觀與AI匹配大規(guī)模商業(yè)化場(chǎng)景里,OpenAI 的選擇其實(shí)并不多,其很難跟微軟去搶 ToB 的市場(chǎng),也很難跟英偉達(dá)去搶芯片的市場(chǎng),更難跟 Apple 去搶終端市場(chǎng)。放眼望去,谷歌手上的搜索是OpenAI為數(shù)不多的可行選擇。
既有Perplexity的珠玉在前,AI搜索的商業(yè)化想象力也足夠大。2023年,谷歌的搜索廣告機(jī)創(chuàng)造了超過1750億美元的收入,廣告總收入占谷歌2023 年總收入的近 78%。即使在國(guó)內(nèi),被認(rèn)為“沒落”的百度靠著搜索一年也能賺1000億。
/ 02 / 大模型與搜索有何不同?
在很多人看來,Perplexity和大模型好像沒什么太大區(qū)別。ChatGPT本身就能直接解答用戶的提問,NewBing 也是默認(rèn)搜索加整合答案。這樣看來,OpenAI下場(chǎng)做搜索自然輕而易舉。
但其實(shí)并非如此。以AI搜索Perplexity為例,大模型和Perplexity的區(qū)別就是,一個(gè)能用、一個(gè)好用。大模型本身能搜索不假,但也會(huì)出現(xiàn)很多問題。
比方說,生成式AI無(wú)法做到實(shí)時(shí)更新,且受限于訓(xùn)練數(shù)據(jù),可能無(wú)法覆蓋相對(duì)小眾、缺乏通用性的長(zhǎng)尾知識(shí)。同時(shí),生成式AI對(duì)生成內(nèi)容的可控性較差,存在“幻覺”問題,用戶也難以對(duì)答案進(jìn)行直接驗(yàn)證。
Perplexity所做的事情就是,把這些大模型搜索過程中出現(xiàn)的“坑”一個(gè)個(gè)都填掉,其中最重要的事情就是信息的實(shí)時(shí)性和準(zhǔn)確性。
實(shí)時(shí)性方面,與ChatGPT等大模型依賴訓(xùn)練時(shí)的數(shù)據(jù)和語(yǔ)料獲取信息不同,Perplexity基于底層傳統(tǒng)搜索引擎開發(fā)而得,能夠及時(shí)抓取最新的信息。
準(zhǔn)確性方面,Perplexity做了兩件事情:減輕幻覺和內(nèi)容溯源。為了減少幻覺現(xiàn)象,Perplexity引入了RAG技術(shù)(檢索增強(qiáng)生成),RAG的作用好比是給模型提供一本教科書,讓它根據(jù)特定的問題去查找信息,通過關(guān)聯(lián)外部知識(shí)來提高答案的準(zhǔn)確性,有效減少了語(yǔ)言模型中出現(xiàn)的虛假信息,使得生成的回答更準(zhǔn)確可信。
與此同時(shí),Perplexity還對(duì)生成的每一句話都附有引用鏈接,在保證可靠性的同時(shí)便于用戶溯源或深入研究。
不僅如此,Perplexity還對(duì)召回和排序環(huán)節(jié)的算法做了創(chuàng)新,保證內(nèi)容的有用性及引用的精確程度。其中,“召回”指根據(jù)搜索指令從數(shù)據(jù)庫(kù)中獲取盡可能多的正確結(jié)果,“排序”指根據(jù)用戶搜索內(nèi)容的相關(guān)性對(duì)召回結(jié)果進(jìn)行排序,決定了搜索引擎的精確程度和性能上限。
這也讓Perplexity成為當(dāng)下綜合性能最好的AI搜索引擎。在2023年4月的論文中,斯坦福的研究人員對(duì)YouChat、Perplexity.AI、NeevaAI及BingChat四個(gè)生成式搜索引擎進(jìn)行了人工評(píng)估。結(jié)果顯示,Perplexity.ai生成內(nèi)容有用性的評(píng)分為4.56分,排名第二;引文召回率和精確度為68.7,排名第一;在泛搜索引擎類的體驗(yàn)中,綜合能力位于最前列。
除了在信息準(zhǔn)確、可靠上,Perplexity在響應(yīng)速度上也花了很多功夫。比如,Perplexity通過自研推理堆棧,讓其內(nèi)容生成速度快于GPT類通用模型。在模型側(cè),公司對(duì)GPT-3.5進(jìn)行微調(diào),在降低成本的同時(shí)進(jìn)一步提升響應(yīng)速度。
Perplexity的成功,也證明了一件事情:比起模型能力,產(chǎn)品本身單點(diǎn)的價(jià)值創(chuàng)造和體驗(yàn)的優(yōu)化,是一個(gè)更為重要的事情。這意味著,即使是擁有先進(jìn)大模型的OpenAI,想要提供更好的用戶搜索體驗(yàn),上述產(chǎn)品層面的優(yōu)化一樣也少不了。
不過相比Perplexity等產(chǎn)品公司做模型,模型公司做產(chǎn)品的難度要小得多。
/ 03 / 谷歌基本盤穩(wěn)固,但隱憂不小
去年年初,ChatGPT的爆火,很多人斷言,ChatGPT的出現(xiàn)幾乎就等于敲響搜索的喪鐘。按前谷歌第23位員工、Gmail的創(chuàng)建者之一Paul Buchheit的說法,像ChatGPT這樣的人工智能聊天機(jī)器人將摧毀谷歌,就像當(dāng)年搜索引擎徹底干掉黃頁(yè)電話簿一樣。
2023 年 2 月,微軟宣布將推出由 OpenAI 的 GPT 技術(shù)提供支持的新版 Bing 搜索引擎,以追逐谷歌的搜索主導(dǎo)地位。當(dāng)時(shí),微軟表示,僅1%的搜索廣告市場(chǎng)份額就價(jià)值 20 億美元的年收入。
但是,一年時(shí)間過去了,谷歌基本盤依然穩(wěn)固。StatCounter 的數(shù)據(jù)顯示,微軟的搜索引擎在 2024 年 1 月的市場(chǎng)份額僅為 3.43%,比去年同期增長(zhǎng)不到 1%。與此同時(shí),谷歌的市場(chǎng)占有率為 91.46%,相比去年僅下降了不到 1%。
去年以來,谷歌的搜索廣告收入逐季提升。到了今年一季度,搜索廣告同比增長(zhǎng)14%,甚至高于市場(chǎng)預(yù)期。
在產(chǎn)品層面,去年谷歌也推出了搜索生成體驗(yàn) (SGE),使用人工智能來生成復(fù)雜問題的上下文答案。看上去,谷歌似乎逐漸找到了用戶體驗(yàn)到商業(yè)化之間的平衡。可以說,Bing的挑戰(zhàn)失敗了。
所以,當(dāng)OpenAI的搜索即將上線,谷歌的股價(jià)也沒有絲毫變化。也就是說,市場(chǎng)并沒有給這個(gè)事件的影響給予充分的定價(jià)。
但客觀來說,不同于Perplexity,OpenAI的潛在威脅可要大得多。一方面,OpenAI天然擁有龐大的用戶池,ChatGPT手上有十幾億的用戶規(guī)模,日活在5000萬(wàn)左右。另一方面,OpenAI自身?yè)碛心P?,且性能更加先進(jìn)。一旦agent最后成為AI時(shí)代大一統(tǒng)的終極產(chǎn)品,擁有更先進(jìn)模型的OpenAI,將會(huì)給谷歌造成更大的麻煩。
換句話說,比起Perplexity,顯然OpenA更有可能給谷歌搜索業(yè)務(wù)帶來沖擊。尤瓦爾·赫拉利在《人類簡(jiǎn)史》中寫過這樣的一句話:歷史的鐵律就是,事后看來無(wú)可避免的事,在當(dāng)時(shí)看來總是毫不明顯。