文|腦極體
我們都知道,大模型必須誕生應(yīng)用才有價(jià)值。那么,哪種應(yīng)用才能最快發(fā)揮出AI大模型的價(jià)值潛力,成為大模型落地的第一站?提起這個(gè)問(wèn)題,很多人會(huì)首先回答:搜索。
這一方面是因?yàn)?,在ChatGPT爆火之后,“大股東”微軟首先就將其能力融入到Bing搜索中,并且一度宣布要憑借大模型優(yōu)勢(shì),把行業(yè)老大哥谷歌挑落馬下。那么在中國(guó)AI圈大規(guī)模復(fù)刻大模型的背景下,在應(yīng)用側(cè)也自然會(huì)想到首先推進(jìn)搜索+大模型。
另一方面,搜索引擎天然有著與AI深度結(jié)合的優(yōu)勢(shì)。早在2014、2015年,百度和谷歌這些傳統(tǒng)搜索引擎巨頭就開(kāi)始將深度學(xué)習(xí)、知識(shí)圖譜等AI技術(shù)融入搜索當(dāng)中,以此提升搜索引擎對(duì)用戶指令的理解能力,增強(qiáng)搜索結(jié)果的內(nèi)在關(guān)聯(lián)性。
由此可見(jiàn),大模型+搜索,可謂是天時(shí)地利人和。經(jīng)過(guò)近一年時(shí)間的探索,中國(guó)AI行業(yè)的大模型+搜索應(yīng)用也逐漸豐富了起來(lái)。雖然大模型帶給搜索的改變并沒(méi)有徹底浮現(xiàn)出來(lái),但已經(jīng)形成了較為多樣化的探索思路。
為了能讓大家更生動(dòng)了解大模型+搜索的目前進(jìn)展,理解不同思路的差異化。我們想了一個(gè)比喻:大模型+搜索,就像一盤跳棋。各位選手手里的棋子都是一樣的,即大模型技術(shù)與搜索技術(shù)。而他們的最終目標(biāo)是一致的,即孵化大模型時(shí)代的第一個(gè)爆款應(yīng)用。
但在下棋的過(guò)程中,各自的棋路卻有不同。目前來(lái)看,它們分為三個(gè)流派。
選手一、大模型作為搜索引擎的增強(qiáng)插件
搜索,是互聯(lián)網(wǎng)時(shí)代人與信息之間最為頻繁的接觸場(chǎng)景。搜索引擎既需要理解用戶意圖,也需要理解海量信息。作為信息與人之間的樞紐,搜索引擎提升智能水平的需求是永無(wú)止境的。
而大模型為搜索引擎帶來(lái)的差異在于,它不僅能夠加強(qiáng)傳統(tǒng)搜索引擎的體驗(yàn),還能夠通過(guò)AIGC模式帶來(lái)各種對(duì)用戶意圖與搜索結(jié)果的內(nèi)容生成能力。
舉個(gè)例子,大模型不僅能夠提高搜索精準(zhǔn)度,還可以把搜索出的多個(gè)結(jié)果合并生成到一個(gè)內(nèi)容框里,節(jié)省用戶時(shí)間。這相當(dāng)于在傳統(tǒng)的搜索框架外,給用戶了一些額外的搜索工具。
基于這種思路,業(yè)界開(kāi)始探索大模型+搜索的第一種模式:把大模型能力,當(dāng)做搜索引擎的增強(qiáng)插件。在國(guó)內(nèi)市場(chǎng)上,這個(gè)流派的代表是百度。
搜索業(yè)務(wù),可以說(shuō)是百度通過(guò)文心大模型能力進(jìn)行產(chǎn)品改造的第一站。目前階段,百度已經(jīng)在搜索引擎中添加了兩種基于AIGC能力的“增強(qiáng)插件”。
首先,是在首條回答中進(jìn)行信息聚合。
在AI技術(shù)與搜索結(jié)合的過(guò)程中,百度非常強(qiáng)調(diào)“首條搜索結(jié)果即滿足用戶需求”的理念。而大模型能力,可以將搜索結(jié)果進(jìn)行關(guān)鍵信息的聚合,從而生成內(nèi)容摘要?;谶@種模式,百度在搜索引擎中更新了首條回答能力,其覆蓋范圍不僅是文字信息,還可以通過(guò)大模型對(duì)視頻進(jìn)行理解從而歸納摘要。在這種模式下,加入用戶想要搜索的結(jié)果在視頻內(nèi)容中,用戶就可以不再去觀看視頻,而是通過(guò)首條回答直接得到視頻內(nèi)容的總結(jié)歸納。
百度公布的數(shù)據(jù)顯示,過(guò)去首條搜索滿足率只有40%左右,而在加入大模型能力后,這一比率達(dá)到了70%??梢?jiàn)大模型能力作為搜索引擎插件,是收獲正向反饋的。
另一種“增強(qiáng)插件”式的大模型結(jié)合搜索,是在搜索欄之外專門提供一個(gè)AI對(duì)話欄,也就是百度搜索在今年5月移動(dòng)生態(tài)大會(huì)上推出的“AI伙伴”能力。
AI伙伴可以與用戶進(jìn)行AIGC問(wèn)答,幫助用戶在使用搜索引擎時(shí)完成諸如答案標(biāo)記、提供信息來(lái)源、總結(jié)文檔概要等能力,同時(shí)還支持其他工具和服務(wù)的調(diào)用。
也就是說(shuō),百度在搜索引擎界面內(nèi),以及搜索引擎之外,都提供了基于大模型能力的AIGC插件,從而讓搜索引擎獲得多個(gè)角度的大模型重構(gòu)。無(wú)獨(dú)有偶,這一思路與谷歌將Bard聊天機(jī)器人整合到搜索引擎中非常相似
可見(jiàn)具有搜索引擎?zhèn)鹘y(tǒng)優(yōu)勢(shì)的廠商,更傾向于將大模型作為增強(qiáng)插件,多角度融入傳統(tǒng)搜索引擎這種“1+1大于2”的思路。
選手二、類ChatGPT的搜索應(yīng)用
在增強(qiáng)傳統(tǒng)搜索引擎能力之外,大模型還帶來(lái)了另一個(gè)問(wèn)題:是否有可能繞開(kāi)傳統(tǒng)搜索形態(tài),直接基于AIGC能力產(chǎn)生新的搜索產(chǎn)品?
在這種可能性上也出現(xiàn)了一些探索。ChatGPT本身即具備語(yǔ)義理解、多輪問(wèn)答、內(nèi)容生成等能力,從某種程度上看,這也可以看作是一種“搜索”。只不過(guò)搜索的內(nèi)容從關(guān)鍵詞變成了提問(wèn)和需求,搜索結(jié)果從網(wǎng)頁(yè)變成了直接生成文字內(nèi)容。
于是,中國(guó)AI行業(yè)中出現(xiàn)的一種新型搜索產(chǎn)品,可以被稱為類ChatGPT搜索。其中具有代表性的“參賽選手”,是昆侖萬(wàn)維推出的天工AI搜索。
這種搜索引擎完全以AIGC作為產(chǎn)品核心邏輯。用戶通過(guò)自然語(yǔ)言來(lái)表達(dá)需求意圖,隨后搜索界面反饋出相關(guān)答案,而不再像傳統(tǒng)搜索引擎一樣展現(xiàn)大量網(wǎng)頁(yè)鏈接。
相對(duì)來(lái)看,天工AI搜索的一個(gè)創(chuàng)新點(diǎn)在于信源索引。在使用ChatGPT等AIGC平臺(tái)時(shí),我們經(jīng)常會(huì)面臨一個(gè)問(wèn)題,就是AI回答內(nèi)容的不確定性。極多問(wèn)題大模型都無(wú)法給出正確答案,甚至?xí)鷣y編造論據(jù)、文獻(xiàn)出處、新聞源等,也就是廣受吐槽的“AI一本正經(jīng)地胡說(shuō)八道”。
而天工AI搜索則強(qiáng)調(diào)了生成答案的同時(shí)給出參考信息源,從而確保用戶能夠追溯信息的可參考性,極大規(guī)避了AIGC平臺(tái)的信任難題。并且其參考信息源也相對(duì)豐富,包含了新聞網(wǎng)站、知識(shí)問(wèn)答平臺(tái)、視頻等。
但在目前階段,類ChatGPT搜索與AIGC平臺(tái)的界限還難以區(qū)分,用戶對(duì)其認(rèn)知還不明確。這種模式有待于進(jìn)一步的市場(chǎng)普及與用戶檢驗(yàn)。
選手三、大模型落地垂類搜索
在搜索引擎格局相對(duì)穩(wěn)定之后,曾經(jīng)出現(xiàn)過(guò)這樣一種產(chǎn)業(yè)思路:通用搜索機(jī)會(huì)不大之后,搜索引擎可以在垂直搜索領(lǐng)域發(fā)力,從而夯實(shí)對(duì)該領(lǐng)域有持續(xù)搜索需求的用戶群。搜狗搜索、夸克,都曾經(jīng)在垂直搜索領(lǐng)域發(fā)力。其中夸克憑借垂直搜索能力,在年輕用戶群中獲得了不錯(cuò)的成績(jī)。
大模型+搜索的第三種思路,是將大模型率先落地在垂直搜索當(dāng)中。以此強(qiáng)化具體搜索領(lǐng)域的自然語(yǔ)言理解能力與信息檢索體驗(yàn)。在這個(gè)領(lǐng)域,目前的代表選手是夸克。11月14日,阿里巴巴智能信息事業(yè)群發(fā)布了夸克大模型。立足于自身的差異化定位,夸克大模型應(yīng)用會(huì)優(yōu)先落地在專業(yè)搜索等信息服務(wù)領(lǐng)域。而除了基礎(chǔ)的大語(yǔ)言模型之外,夸克大模型還將衍生出醫(yī)療、教育等垂類模型,可見(jiàn)夸克對(duì)專用知識(shí)領(lǐng)域的重視程度。
目前來(lái)看,醫(yī)療、教育、人文社科,是大模型落地垂直搜索的幾個(gè)主要方向。這幾個(gè)方向都對(duì)信息源有著極強(qiáng)的要求,并且存在關(guān)鍵詞模糊、有效信息較少、邏輯性較強(qiáng)等特點(diǎn),相比于通用類搜索來(lái)說(shuō),更加適合大模型發(fā)揮出自己的特性。同時(shí),優(yōu)先將大模型與垂直搜索進(jìn)行結(jié)合,也可以很好地降低產(chǎn)品成本,提升大模型的應(yīng)用于搜索領(lǐng)域的整體效率。
事實(shí)上,還有一種垂類搜索與大模型結(jié)合的變體,就是各家網(wǎng)盤目前都在上線具備自然語(yǔ)言理解能力的搜索功能??梢酝ㄟ^(guò)模糊描述、形容詞等關(guān)鍵信息來(lái)檢索網(wǎng)盤資料,尤其是對(duì)圖片、視頻等內(nèi)容進(jìn)行搜索。
都是超級(jí)應(yīng)用的跳板
那么問(wèn)題來(lái)了,到底哪種模式才是大模型+搜索的正確解答呢?
不好意思,答案只能是虛席以待。
大模型+搜索,是一個(gè)在邏輯上非常具有前景的大模型落地場(chǎng)景。因此在ChatGPT剛剛開(kāi)始爆火后,微軟就將大模型能力打造為BingChat,并對(duì)谷歌搜索放出了諸多狠話。但時(shí)間過(guò)去了快一年,微軟已經(jīng)將很多AI能力剝離出了搜索業(yè)務(wù),而谷歌的市場(chǎng)霸主地位也沒(méi)有受到什么影響??梢?jiàn)這一場(chǎng)景從理論到實(shí)踐,還有不斷的路要走。
回望國(guó)內(nèi)市場(chǎng),會(huì)發(fā)現(xiàn)三種探索模式還各自為戰(zhàn),并沒(méi)有產(chǎn)生太多交鋒,在用戶側(cè)也沒(méi)有掀起對(duì)大模型+搜索的普遍認(rèn)知,甚至其落地程度遠(yuǎn)不如類ChatGPT的對(duì)話應(yīng)用本身。究其原因,可以發(fā)現(xiàn)三點(diǎn):
1.這三種大模型+搜索的嘗試,都沒(méi)有完成產(chǎn)品形態(tài)從0到1的突破。而生在此前的搜索引擎、AI對(duì)話產(chǎn)品上進(jìn)行加強(qiáng)和補(bǔ)完,因此不具備非常引人關(guān)注的產(chǎn)品爆發(fā)點(diǎn)。
2.目前階段,大模型對(duì)搜索體驗(yàn)的提升在大眾用戶端體驗(yàn)感不強(qiáng)。其更多只能作為學(xué)術(shù)、IT等領(lǐng)域的專業(yè)工具。
3.除此之外,大模型+搜索的商業(yè)化空間并不明晰。加入大模型技術(shù)之后,搜索產(chǎn)品的商業(yè)模式與商業(yè)化水平都沒(méi)有發(fā)生較大的變化,因此受到資本市場(chǎng)的關(guān)注不足。
長(zhǎng)遠(yuǎn)來(lái)看,大模型+搜索的最終目標(biāo),一定是形成大模型時(shí)代的超級(jí)應(yīng)用。如同互聯(lián)網(wǎng)時(shí)代搜索引擎的出現(xiàn)一樣,徹底改變?nèi)藗兊男畔@取與交互模式。
而如果以此為目標(biāo),今天的大模型+搜索探索必然還是棋子行進(jìn)路上的跳板。也只有讓棋子持續(xù)跳下去,未來(lái)某個(gè)節(jié)點(diǎn)才可能發(fā)生質(zhì)變。
只要能讓大模型和搜索互為動(dòng)力,持續(xù)跳向前方,那么前景中的光明依然遠(yuǎn)大于黑暗。