文|智谷趨勢 斯絲
傳得沸沸揚揚的OpenAI搜索引擎,再一次延緩發(fā)布,留給世人巨大的懸念。
OpenAI創(chuàng)始人山姆·奧特曼說,這次即將要發(fā)布的,既不是GPT-5,也不是搜索引擎。而是一些“人們會喜歡的新東西!對我來說感覺像魔術一樣”。
額,魔不魔術的先不說,反正傳了一個星期的AI搜索引擎是沒影兒了。
但是,你細評他這句話,有沒有一種“我今天不發(fā)布,但我們一直在努力開發(fā)你們喜歡的、想象中的AI搜索引擎”這樣的言外之意。
換成中國話說,就是“革命還未成功,同志還在努力”。
那么問題來了,全村的希望——OpenAI,真的準備要革Google的命了嗎?
AI搜索呼之欲出
AI搜索已經在路上,這不是亂揣測。
路透社報道,根據最新的SSL證書日志,OpenAI在5月3日創(chuàng)建了一個名為search.chatgpt.com的子域名。只不過你現在點進去,估計還是“Not FOUND”。
放在更長的時間線里看,2022年12月GPT橫掃全球時,Google的CEO桑德爾·皮查伊就在公司內部發(fā)布了“紅色警報”,主動敲響了警鐘。
在皮查伊看來,GPT生下來就是要革自己命的。
但兩年過去,GPT-5都要來了,Google還是獨孤求敗,那個唯一可能敢叫囂的OpenAI搜索,到今天都還是404。
難道,做出一款AI搜索產品,對OpenAI來說,就這么難?
答案并非如此??纯碢erplexity就知道了。
根據最新媒體爆料,這家黃仁勛最愛的AI搜索公司正在進行至少2.5億美元的新一輪融資,估值可能膨脹至25億美元。此前,Perplexity在今年1月以5.4億美元的估值籌集近7400萬美元,后又在3月初以10億美元的估值獲得6300萬美元融資,跟投的公司里不乏英偉達、貝佐斯這些硅谷大佬。
就是這么一款10億美元估值的產品,其實也沒有多么驚天動地的體驗。
從主頁面來看,Perplexity與傳統搜索引擎區(qū)別不大,同樣設置了系統推薦話題、熱門話題和歷史搜索記錄等功能欄。
主要的區(qū)別在于,輸入搜索指令后,Perplexity生成的信息頁面里,包括了“sources”,信息來源、“answer”,AI總結的精簡回答以及“related”,相關問題。
想要更精準搜索,就可以在Focus中選擇不同的信息來源,比如可以檢索源自學術論文的信息、也可以在YouTube上搜索視頻,在Reddit上搜索相關討論。Perplexity會在內容頁面上附上信息來源標簽,減少AI問答的造假可能性。
如果點擊搜索欄里的Copilot,Perplexity就可以在連續(xù)的互動和追問中為用戶提供定制化的個性回答。要是愿意每月付上20美元訂閱Pro方案,就可以無限量的用Copilot進行搜索,也可以上傳文件和圖片,Perplexity會直接幫你總結文件內容。
簡單來說,Perplexity之于傳統搜索引擎的區(qū)別就在于信息篩選的便利性和個性化定制,的確可以解決傳統搜索引擎廣告泛濫、信息檢索精度有限的毛病。
截至今年3月,Perplexity今年總訪問量就達到1.6億,平均月活用戶達到5221萬。
看上去是一場史詩級的搜索革命正在開啟,但有一句話說得好,這個世界本身就是一個巨大的套娃。
Perplexity也不例外。
肉眼過去,Perplexity好像是周鴻祎所定義的“答案引擎”。但這個答案的生產邏輯是:用戶提出問題后,Perplexity接收到用戶需求,再去傳統搜索引擎上搜查相關鏈接,最后結合大語言模型把搜到的結果進行總結和提煉呈現。
套了一層傳統搜索引擎還不算,Perplexity的大模型也是GPT-3.5和Claude微調得來。
所以,我們大可以將當前的AI搜索看成是GPT和谷歌的結合體。
這也側面說明了Perplexity的技術護城河并不高。畢竟,現在開源大模型的推理和訓練能力都這么強了,還怕做不出一個拿得出手的AI搜索嗎。
阿里原副總裁賈揚清,就用500行代碼掀翻了AI搜索套殼產品。
今年1月份,賈揚清在推特上展示了一個對話式搜索引擎的demo。賈揚清在推文中介紹,這款叫做Lepton Search的AI搜索引擎Demo,基于他所創(chuàng)辦的LeptonAI提供的框架,用了一個周末就跑出來了。
而且,賈揚清還表示,自己無意入局AI搜索市場,把Demo給大家看,只是想證明“天下沒有難構建的AI應用”。感慨的同時也不忘順手艾特了Perplexity,表示“受到了他們優(yōu)秀產品的啟發(fā)”。
再往后,Perplexity創(chuàng)始人Aravind Srinivas下場捧了Lepton Search一番,還意味深長說了句:“看到包括Meta和阿里的前高管都在將Perplexity的UI頁面作為未來一些融資動作的參考,這真是太棒了!這說明Perplexity的影響不僅在于產品本身,還深入到了整個行業(yè)生態(tài)”。
一個套殼AI搜索的影響輻射到了整個生態(tài),這真的很難評。
但總而言之,AI搜索的準入門檻,比我們想象中低太多了。
但對OpenAI來說,既然都把人家叫做全村的希望了,肯定要做就要做點不一樣的。
就像月之暗面創(chuàng)始人楊植麟就說過,比傳統搜索引擎好個10%、20%,沒什么太大價值——只有一個顛覆性的東西,才配得上AGI這三個字。
OpenAI之困
這也能說明,為什么OpenAI的AI搜索遲遲不肯露面。當沒有把握產生另一個Sora級別的地震效果時,我要是奧特曼,我也會先溜一下粉絲。
而且今天,這個微妙的發(fā)布時間點說明了一切。
來捋一下OpenAI搜索的發(fā)布時間線——
首先,曾經準確預測過GPT-4發(fā)布時間的知名科技博主Jimmy Apples在Twitter上表示:“美東時間5月9日上午10點,OpenAI將舉行一場活動,這次活動顯然不會是發(fā)布新模型,而是發(fā)布搜索引擎”。
爆料后幾天,又有報道稱,OpenAI推遲本周的產品發(fā)布活動至下周一,5月13日。
在這期間內,網傳已經有人拿到GPT搜索的內測資格。華爾街見聞的報道中提到,從流傳出來的版本來看,GPT搜索對于蘋果發(fā)布會的內容可以迅速給出精準答案,但當提及“比特幣價格”這類實時更新的信息時,GPT搜索的準確率就不高了。
再然后,就是奧特曼緊急澄清,5月13日要發(fā)布的不是GPT-5,也不是AI搜索引擎。
我們假設網傳版本為真,網友對其的評價是“總體不錯,但仍有瑕疵”。
但此前業(yè)界的期待里,賈揚清說GPT可以終結“簡單調用傳統搜索并用LLM進行總結的”模式。
連OpenAI自己人,布拉德·萊特卡也暗示過,這一突破性的發(fā)展有望對GPT-5進行重大升級,相比之下,這可能會使今天的GPT看起來“糟糕得可笑”。
所以,結合到理想與現實的出入,OpenAI“溜粉”的花活也可以理解了。
畢竟,如果OpenAI搜索不能在13號的發(fā)布會上讓GPT-4和之前的幾代大模型“糟糕的可笑”,OpenAI和奧特曼就會在14號谷歌大會上變成皮查伊眼里“可笑的糟糕”。
為什么OpenAI再造一個Sora級別的AI搜索產品很難?
一個很重要的前提是,不管是基于大模型的AI搜索還是傳統搜索引擎,決定搜索質量的關鍵因素,都是數據。
對傳統搜索引擎來說,搜索次數越多,答案越精準;對AI搜索來說,語料庫越豐富、使用次數越多,大模型給出的答案越精準。
但是,OpenAI當前的兩座大山就是數據和流量的增長乏力。
數據方面,來自外部的非法數據使用的指控還在繼續(xù)。4月30日,包括《紐約每日新聞》《芝加哥論壇報》《奧蘭多哨兵報》《水星報》在內的美國八家新聞機構向OpenAI和微軟提起訴訟,指控其在未經許可的情況下,非法復制了數百萬篇文章來訓練AI模型。
同時,包括瑪麗格特·阿特伍德、丹·布朗和喬迪·皮考特在內的8500多名作者,也聯合敦促GPT等AI公司,在未經授權的情況下停止使用他們的作品。
流量方面,SimilarWeb網站數據顯示,在去年年初的爆發(fā)式增長后,GPT自2023年6月全球流量下降了9.7%,面臨著擴大用戶群的瓶頸。
數據獲取上頻繁被指控,再加上流量趨于見頂,OpenAI的搜索新故事,很難在今天講得漂亮。
還有一層更耐人尋味的是OpenAI與最大股東微軟之間的關系變化。
只要AI搜索引擎還需要從傳統搜索引擎里過一遍,就離不開Google和Bing兩大搜索引擎的授權。而且,Bing所授權的搜索結果因為是不包含廣告的純凈版本,更被AI搜索公司青睞。
但Bing的索引授權費從去年就基本上3倍起跳。如果搜索結果還包括Bing的大語言模型內容,授權費最高能漲到27倍。
AI搜索引擎,一邊靠著Google和Bing的索引庫喂養(yǎng),受后兩者掣肘的同時一邊還要準備推翻Google和Bing。
所以你猜,OpenAI要發(fā)布AI搜索引擎的消息傳出來之后,第一個睡不著覺的是老對手谷歌,還是老東家微軟。
更明白一點,當有一天OpenAI的搜索引擎能發(fā)布了,微軟Bing和它之間必然達成了某種利益共同或制衡約定。
再實際一點,回到最開始說的產品效果上,OpenAI目前釋放出的產品形態(tài)并未掀起一場產業(yè)地震。那么,這也側面說明,此刻發(fā)布AI搜索產品,可以給GPT帶來用戶增長,但并不能帶來爆發(fā)性增長。
從商人或者產品經理的角度考量,一個注定無法產生理想商業(yè)效益的產品,不是在沉默中被淘汰,就是被淘汰的很沉默。
畢竟,有為AI搜索賣力氣賺吆喝的時間,還不如再優(yōu)化一下GPT-5呢。
結語
AI搜索,真的有機會革掉Google的命嗎?現在看來,還有一段不短的路要走。
OpenAI正在努力解決一些數據和流量上的關鍵問題。
比如OpenAI在當地時間5月6日,宣布與英國《金融時報》達成內容許可協議,OpenAI可以利用《金融時報》數據庫來訓練AI模型。
再比如,更早之前,OpenAI就宣布免登錄即可使用,就是為吸引更多的用戶,獲得更豐富的數據。
而且,本月初,美國司法部和38個州對谷歌提出的嚴重壟斷指控結束了庭審。
虎嗅的報道中提到,訴訟文件中谷歌的壟斷行為包括通過與手機制造商和瀏覽器公司簽訂排他性合約,確保其搜索引擎成為默認設置,進而鞏固其市場主導地位。
谷歌辯稱這些合約處在“合法競爭”的范疇中。
但美國司法部的律師Kenneth Dintzer在庭審的總結中表示:“上一次重大科技壟斷裁決‘美國訴微軟’案‘非常適合’谷歌”。
1998年,美國對微軟反壟斷的指控,不僅險些讓微軟一分為二,更迫使其調整了企業(yè)商業(yè)策略和發(fā)展方向。
要是按照“非常適合”的說法,谷歌或許也將面臨“拆分”的可能性。
而更早些時候,國內首個AI搜索產品,昆侖萬維的天宮AI搜索和月之暗面Kimi長文本模型陸續(xù)發(fā)布時,關于“百度失其鹿,群雄共逐之”的坊間說法就沒停下過。
種種變動,都指向一個事實:
長達20年未有大變的搜索引擎領域,需要一個新的故事起點。
畢竟,作為Google或者百度搜索用戶的我們,對搜索頁面泛濫且無用的廣告、以及常?!把圆患傲x”的低精度關鍵詞搜索和虛假信息早已經疲憊不堪。
不過也得承認,目前可見的OpenAI的搜索產品形態(tài),并未有“歷史性”的創(chuàng)新。
也就是說,AI搜索距離“iPhone時刻”和通用AI搜索爆發(fā)的奇點,仍然遙遠。
但如果你也相信光的話,你一定會相信奧特曼。