文|侃科技
OpenAI推出ChatGPT兩個月后,百度終于要下場了。即便還在傳言階段,資本仍然直接給了一波13%的大漲。
搜索引擎對ChatGPT的反應(yīng)無疑是最受關(guān)注的。
在此之前,微軟被曝或是第一個將ChatGPT引入搜索引擎的巨頭,并且宣布增持OpenAI,谷歌也通過「Red code」的方式拉響警報,圍繞ChatGPT全面調(diào)整2023年在AI領(lǐng)域的工作。
姍姍來遲的百度,雖然官方三緘其口,但投資者們更傾向于相信這一消息,這表明投資者們認可百度研發(fā)ChatGPT的合理性,并且對百度版ChatGPT抱有期待。
而有關(guān)百度版ChatGPT的迷霧,正是本文嘗試探討的:百度做不做、怎么做以及為什么做?
01 做不做?
去年年底,李彥宏曾在內(nèi)部直播中做過一個分享,認為AIGC(AI生成內(nèi)容)和ChatGPT這些都是AI技術(shù)發(fā)展到一定地步后產(chǎn)生的新機會。但至于它會變成什么樣的產(chǎn)品,又能滿足什么樣的需求,還有很多的不確定性。
不過話鋒一轉(zhuǎn),李彥宏又堅定的表態(tài):這個事情很難,但百度必須要做。
而百度必須要做的理由,來自這兩個方面:
一方面,微軟、谷歌已經(jīng)動作在前,尤其是后者。1月初,谷歌的子公司DeepMind就推出了用以抗衡ChatGPT的Sparrow,并且還在加速布局生成式AI,包括文字生成AI模型Wordcraft、AI繪畫模型Imagen、視頻生成工具Imagen Video,以及在1月27日發(fā)布的音樂AI模型MusicLM;
另一方面,ChatGPT的確是搜索引擎的威脅。
摩根士丹利在去年12月的一份研報中直截了當?shù)谋硎荆赫Z言模型可以繼續(xù)獲得用戶,并從搜索查詢中獲得份額,并破壞谷歌作為互聯(lián)網(wǎng)用戶入口的地位。
一個不算好的消息是,ChatGPT上線5天就完成了100萬用戶的積累。而據(jù)Similarweb監(jiān)測,到1月份ChatGPT平均每天的獨立訪問者已超過1300萬,甚至瑞士跨國投行瑞銀集團(UBS)周三發(fā)布的一份研究報告顯示,ChatGPT在今年1月份的月活躍用戶數(shù)估計已達1億,成為史上增長最快的消費者應(yīng)用。
相比之下,達到1億月活躍用戶數(shù),TikTok花了大約9個月的時間,Instagram花了兩年半。
這意味著,搜索引擎迎來了自誕生起最強大的潛在敵人。
相比傳統(tǒng)的搜索引擎根據(jù)用戶提問,從而提供數(shù)千萬個相關(guān)鏈接索引,ChatGPT的優(yōu)勢在于,直接提供自己搜索和信息綜合的單一答案,讓用戶省去反復(fù)點擊鏈接找尋答案的復(fù)雜度。
據(jù)The Information報道,微軟Bing引入ChatGPT后,這些AI支持的答案可能會以包含信息來源的完整句子的形式呈現(xiàn),而不是引用可能解決用戶提出的問題來源或者鏈接列表的精選片段。也就是說,ChatGPT能夠輕易碾壓搜索引擎的「首條滿足率」。
但是,對于ChatGPT顛覆搜索引擎的說法并沒有得到廣泛認可。主要是ChatGPT在搜索領(lǐng)域的應(yīng)用仍具有幾大懸而未決的掣肘:
1)真實性無法保證。在學(xué)術(shù)、科研等嚴謹?shù)膽?yīng)用場景中,ChatGPT提供的答案并不一定都正確。由于ChatGPT只提供純文本,不引用實際網(wǎng)站,目前并沒有辦法從ChatGPT 的輸出中分辨真?zhèn)巍?/p>
2)信息的實時性難以保證。搜索引擎的索引可以實時更新,更為方便快捷,但對于大型語言模型而言,添加新的內(nèi)容需要重新訓(xùn)練模型,耗時且成本昂貴。
比如,GPT-3就需要1500萬美金和1750億參數(shù),由于沒有可以適合該模型的單個硬件,因此必須將其分解并分布在多個處理器上,例如A100GPU。設(shè)置和并行化這些處理器以訓(xùn)練和運行模型既是技術(shù)挑戰(zhàn),也是財務(wù)挑戰(zhàn)。
3)商業(yè)模式問題。此前,根據(jù)TechCrunch 估計,擁有100萬用戶的ChatGPT每天就要花費10萬美元,若應(yīng)用于Bing后經(jīng)歷高頻度的搜索查詢,商業(yè)運營成本極高。
最新的消息是,OpenAI發(fā)布了ChatGPT的試點訂閱計劃,訂閱者以20美元/月的價格即可獲得比免費版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。
02 怎么做?
盡管百度對推出類ChatGPT產(chǎn)品的消息不做回應(yīng),但在多家媒體的詳細爆料和資本的狂歡中,似乎已經(jīng)是板上釘釘?shù)氖聦崱?/p>
爆料稱,該項目在百度內(nèi)部由搜索(MEG)和技術(shù)中臺(TPG)團隊牽頭,呈現(xiàn)形式將會是生成式搜索,也就是將搜索和ChatGPT結(jié)合。
生成式搜索是百度2019年就發(fā)布的一項服務(wù),其具體形式類似ChatGPT,比如「北京GDP和上海GDP誰高」的問題,百度會直接給出答案,相當于省去了用戶分別搜索再自行計算的步驟。
今年1月初,百度搜索杰出架構(gòu)師辜斯繆曾在一次小范圍的媒體溝通會上透露,百度預(yù)計在3月會做一個比較大的升級,同時今年百度搜索在技術(shù)上最重要的工作就是要把整個檢索系統(tǒng)變成檢索+生成雙模系統(tǒng)。
如今根據(jù)媒體的爆料信息,預(yù)計百度版ChatGPT大概率將會是這種形式。
生成式搜索可以看作是生成式AI的一個版本(ChatGPT就是生成式AI的一種),而后者被認為是搜索引擎的未來:不僅僅是索引網(wǎng)頁與鏈接,而是為每一個查詢生成相應(yīng)的摘要、回答。
用生成式搜索來回應(yīng)ChatGPT,似乎是中美兩大搜索巨頭不約而同的選擇。這種看似戰(zhàn)略防御做法的背后,也有搜索引擎無法回避的苦衷。
雖然ChatGPT組織信息的方式更加簡練,能夠幫助整合信息、梳理段落要點,但當前搜索引擎給出的鏈接往往更加全面,因此使用方面ChatGPT并不具備壓倒性的替代優(yōu)勢。
并且,從ChatGPT本身來說,像百度、谷歌這樣的大公司要為數(shù)億甚至數(shù)十億用戶提供高可靠性的搜索服務(wù),不能僅僅因為一個東西似乎會成為未來,因為人人都為之瘋狂,就把一個不可信的、未經(jīng)嚴格測試的新技術(shù)嵌入進來。
就像谷歌其實在2021年5月就展示了人工智能系統(tǒng)LaMDA,嘗試用聊天機器人的技術(shù)來增強搜索引擎的使用體驗。
但直到現(xiàn)在谷歌仍不愿向公眾發(fā)布LaMDA。部分原因在于,LaMDA存在較高的誤差,且容易對用戶造成傷害,這也是ChatGPT類人工智能的通病。
而生成式AI對搜索引擎最大的威脅還不是來自技術(shù)不完善,而是對搜索引擎盈利模式的威脅。
一旦引入生成式AI搜索引擎,用戶就會減少在鏈接間跳轉(zhuǎn)、瀏覽的時間,也就減少了廣告投放的空間,這會使搜索引擎的盈利模式發(fā)生根本性的變化。
以廣告為主要收入的搜索引擎自然要謹慎。2022年前三季度,廣告營收占谷歌總收入的80%。百度也同樣如此,據(jù)其2022年Q3財報,廣告占百度當季營收的57.4%。
換言之,即便是百度將ChatGPT嵌入到搜索,其服務(wù)范圍也一定是謹慎的有選擇性的,更多是類似「秦始皇和漢尼拔誰年紀大」這種封閉式問題。
03 為什么做?
OpenAI在2019年拿了微軟的10億美金投資,代價是只能使用微軟的云計算服務(wù)。當然這并非是微軟的強盜邏輯,而是OpenAI確有苦衷。
小公司根本承擔(dān)不起數(shù)千億數(shù)據(jù)的喂養(yǎng)以及大算力芯片的消耗,以Stable Diffusion為例,它在4000臺A100顯卡集群上訓(xùn)練了一個月時間、學(xué)習(xí)了近59億條圖片數(shù)據(jù)才真正開發(fā)出來。
而通過Azure OpenAI服務(wù),開發(fā)者可以直接在微軟云上訪問OpenAI的大模型,并根據(jù)特定業(yè)務(wù)場景進行部署和微調(diào),以較低的成本開發(fā)出AI應(yīng)用。同時,支持OpenAI也就成為微軟試圖擴大云計算市場份額的有效手段。
百度去年12月發(fā)布的「AI大底座」,從IaaS層到PaaS層,為企業(yè)模型開發(fā)的全生命周期提供完整解決方案。名稱雖然不同,但內(nèi)核同微軟沒什么區(qū)別。都是給開發(fā)者降本增效,同時借勢提升自己的市場份額。
按照這個技術(shù)復(fù)利的進度和未來AI應(yīng)用的浪潮,百度云是有機會再改一改排名的。
對于百度而言,ChatGPT的另一個價值在于推動AIGC發(fā)展。
相比PGC、UGC,AIGC(AI Generated Content,AI生產(chǎn)內(nèi)容,例如GPT系列)具有效率和成本上的優(yōu)勢:
– AIGC效率更高:截止2021年3月,推出9個月后的GPT-3日均文本生成量45億,而2021年閱文集團新增文字量僅360億,僅相當于8天GPT-3的文字內(nèi)容生成量;
– AIGC成本更低:目前OpenAI定價最高的文字模型達芬奇(基于GPT-3)為每750詞約0.02美元,2021年閱文集團內(nèi)容成本為17.74億元(每750詞約37元),是調(diào)用OpenAI的API完成相同文字量生產(chǎn)所需的成本(約672萬元)的264倍。
理想狀況下,如果閱文集團將2021年全年360億的文字內(nèi)容生產(chǎn)量交給GPT-3,耗時8天即可完成,節(jié)約成本99%+,毛利率空間幾乎100%釋放。
雖然目前ChatGPT只有文本形式,但也有望在相關(guān)產(chǎn)業(yè)落地,比如有海量文本創(chuàng)造需求的網(wǎng)文平臺、新聞平臺等,可以借助ChatGPT完成內(nèi)容快速、低成本地擴增;教育及科研工具類平臺也可以借助ChatGPT實現(xiàn)定制化、擬人化的教學(xué)和輔助,如智能問答、智能批閱、輔導(dǎo)資料智能撰寫等。4
尾聲
ChatGPT推出的那一天,Twitter上有個叫josh的用戶馬上就說:“谷歌完蛋了?!瘪R斯克也在幾天后發(fā)推稱,ChatGPT好的驚人,我們離強的可怕的AI不遠了。
但對于大洋彼岸的我們而言,ChatGPT對搜索引擎有沒有威脅暫且不論,重要的還是應(yīng)該先有。所以當ChatGPT發(fā)布后,人們就在期待百度何時跟進。
所以不論百度版ChatGPT有沒有新花樣,只要發(fā)布就已經(jīng)是一種勝利了。
參考資料
[1] ChatGPT是否是AI的革命?國盛證券
[2] ChatGPT-真格基金分享,真格基金
[3] ChatGPT:又一個“人形機器人”主題,東吳證券
[4] 計算機行業(yè)專題報告:ChatGPT:開啟AI新紀元,財通證券
[5] ChatGPT要和搜索引擎搶飯碗?科技云報道
[6] 微軟vs谷歌:語言模型會不會壓倒搜索引擎?36氪
[7] 微軟的AI革命:一場深入業(yè)務(wù)底層的豪賭,虎嗅
[8] 百度將推出類似ChatGPT服務(wù)?財經(jīng)十一人
[9] ChatGPT: What is it? Why it Matters? Is it a GoogleThreat...and Broader Industry Implications,摩根士丹利