文|數(shù)智界 祝彰
編輯|嘉辛
1950年,英國(guó)科學(xué)家圖靈在一篇論文中預(yù)言,人類有可能創(chuàng)造出具有真正智能的機(jī)器。
著名的「圖靈測(cè)試」就此誕生:如果一臺(tái)機(jī)器能夠與人類展開對(duì)話,而不被辨別出其機(jī)器身份,那么稱這臺(tái)機(jī)器具有智能。
也是從那時(shí)開始,人類世界開始了對(duì)人工智能長(zhǎng)達(dá)半個(gè)多世紀(jì)的探索,但至少在2000年以前,困難總比驚喜多,人工智能還經(jīng)歷了兩次發(fā)展寒冬:
一次是在1974-1980年,受限于計(jì)算器計(jì)算能力,AI技術(shù)研究遇冷,研究資助被大規(guī)??s減甚至取消;另一次是在1987-1993年,期間人工智能計(jì)算機(jī)DARPA的失敗為AI潑了一盆冷水。
失敗也不全是壞事。跌跌撞撞盛衰起伏的過程中,AI的發(fā)展在2006年以后邁進(jìn)了新的階段——由機(jī)器學(xué)習(xí)邁入了深度學(xué)習(xí)階段,離真正的人工智能更近。
自此之后,人類對(duì)AI的探索之旅明顯加快,一些重要的里程碑時(shí)刻相繼出現(xiàn)了。比如2014年,第一臺(tái)通過圖靈測(cè)試的計(jì)算機(jī)誕生,它讓人類相信它是一個(gè)13歲的男孩;比如2016年,ALphaGo戰(zhàn)勝圍棋世界冠軍李世石。
再到2022年底,ChatGPT一夜爆火。
不過,縱觀AI的曲折進(jìn)程,技術(shù)與實(shí)驗(yàn)成功之間隔著一道墻,實(shí)驗(yàn)成功與大規(guī)模應(yīng)用之間又隔著一道墻,應(yīng)用落地與最終的商業(yè)化之間,也隔著一道墻。
這導(dǎo)致,我們依然無法對(duì)AI的進(jìn)程抱有太高的期待,包括當(dāng)下火熱的ChatGPT。
一、ChatGPT為什么能爆火?
2022年下半年,科技界最受矚目的大事件,莫過于美國(guó)的人工智能研究公司OpenAI發(fā)布了ChatGPT。
ChatGPT是一個(gè)智能對(duì)話系統(tǒng),用戶在注冊(cè)后,能夠?qū)@個(gè)系統(tǒng)發(fā)出各種各樣的提問,系統(tǒng)自動(dòng)生成答案。
最開始,沒有人會(huì)想到,這樣一個(gè)只是提供人機(jī)交談的系統(tǒng),卻成了2022年全球最后一個(gè)爆款產(chǎn)品。
OpenAI 11月30日發(fā)布了它,短短一周后,全球范圍內(nèi)已經(jīng)至少有100萬人在使用它。
OpenAI的公司估值也水漲船高。根據(jù)媒體1月10日的相關(guān)報(bào)道,微軟計(jì)劃向OpenAI投資100億美元(合人民幣677.51億元)以收購(gòu)其49%的股權(quán),目前雙方正在談判,預(yù)計(jì)OpenAI投后估值將達(dá)到290億美元。
再到1月12日凌晨,OpenAI在社交平臺(tái)上表示,其開始考慮對(duì)ChatGPT進(jìn)行收費(fèi),以實(shí)現(xiàn)商業(yè)化,可能包括ChatGPT Professional(專業(yè)版)、每月訂閱付費(fèi)等方式。
短短半個(gè)月的時(shí)間,ChatGPT實(shí)現(xiàn)了一定程度的規(guī)?;②A得了高估值、還將商業(yè)化提上日程,它的成長(zhǎng)速度足以令人咂舌。
ChatGPT能短時(shí)間內(nèi)爆火的原因,數(shù)智界認(rèn)為有兩點(diǎn):
第一,從表層來看,ChatGPT表現(xiàn)得更聰明了。
ChatGPT不只能回答簡(jiǎn)單的知識(shí)性問題,還能夠回答開放式問題,并且能與用戶進(jìn)行多輪對(duì)話。比如用戶此前在社交媒體上分享的問題中,就包括了讓ChatGPT寫代碼、與ChatGPT聊人生哲學(xué)、讓ChatGPT寫詩等等。
在很多問題場(chǎng)景下,ChatGPT都給出了出乎意料的回答。比如下面這段,ChatGPT用魯迅的文筆描述網(wǎng)友的心情:
“在疫情的蔓延中,我困了門里,困了心里。屋外一片荒涼,想起一頓火鍋的香味,瞬間讓我心慌。這時(shí)候我才知道,疫情來臨,它讓人生無聊而悲涼,也讓我們看到自己的無助與弱點(diǎn)。然而我們又豈能放棄對(duì)美好的追求,豈能把欲望壓抑到不想吃火鍋的地步?”
第二,ChatGPT的走紅背后,AI大模型正在成為行業(yè)趨勢(shì)。
人工智能中,NLP(自然語言理解)是一個(gè)核心概念,被稱作是人工智能皇冠上的明珠。
在NLP中,之前往往需要對(duì)單個(gè)小任務(wù)進(jìn)行訓(xùn)。比如要讓AI掌握對(duì)話的能力,需要一個(gè)小模型、要讓AI學(xué)會(huì)協(xié)作,需要另一個(gè)小模型、要讓AI能閱讀能理解,又需要另一個(gè)小模型。
但是人工智能從機(jī)器學(xué)習(xí)階段邁入到深度學(xué)習(xí)階段之后,現(xiàn)在單個(gè)大模型就可以完成各種類型的任務(wù)訓(xùn)練,也就是對(duì)不同問題在同一個(gè)模型上進(jìn)行預(yù)訓(xùn)練。
深度學(xué)習(xí)里有個(gè)Double Descent現(xiàn)象:隨著模型參數(shù)變多,測(cè)試錯(cuò)誤率會(huì)先下降、再上升,然后第二次下降。原則上,在成本可接受的情況下,模型越大,準(zhǔn)確率越好。
具體到ChatGPT的發(fā)展來看:
2018年第一代GPT面世時(shí),OpenAI還只是用它來做語言理解方面的任務(wù);
2019年GPT-2,得益于更高的數(shù)據(jù)質(zhì)量和更大數(shù)據(jù)規(guī)模,其生成的故事在流暢度和邏輯性上更加完善;
2020年的GPT-3,更加完善成了一個(gè)大型語言預(yù)測(cè)和生成模型,能夠生成長(zhǎng)序列的原始文本,語言處理更強(qiáng)大、更快,甚至無需任何特殊的調(diào)優(yōu);
再到當(dāng)前的GPT-3.5,則是一個(gè)多模態(tài)大模型,比起之前的版本更加成熟、準(zhǔn)確率越高。
二、ChatGPT的商業(yè)化前景如何?
僅當(dāng)前來看,ChatGPT的表現(xiàn)已經(jīng)帶給了人類驚喜,但必須要知道,它現(xiàn)在依然面臨著一些缺陷。
比如在回答某些問題時(shí),它可能給出看似合理、實(shí)則是錯(cuò)誤乃至荒謬的回答;比如你反復(fù)問同一個(gè)問題,但是用不同的話術(shù),很可能會(huì)得到前后不一的答案;比如它的很多回復(fù)過于冗長(zhǎng);比如它現(xiàn)在還無法完全拒絕一些不合理、不道德的請(qǐng)求;
但這些問題的存在并不會(huì)完全阻斷ChatGPT的商業(yè)化路徑,OpenAI考慮通過專業(yè)版和每月訂閱付費(fèi)開始商業(yè)化,就說明了這一點(diǎn)。
國(guó)海證券在一份研報(bào)中指出,隨著ChatGPT的不斷調(diào)優(yōu),其有望在醫(yī)療、客服機(jī)器人、虛擬人、翻譯、營(yíng)銷、游戲、社交、教育、家庭陪護(hù)等多個(gè)領(lǐng)域被應(yīng)用,潛在的商業(yè)模式存在以下幾種:
云服務(wù)——客戶使用ChatGPT的云服務(wù)來支持他們的聊天機(jī)器人應(yīng)用程序;
內(nèi)容營(yíng)銷——ChatGPT根據(jù)用戶的興趣和喜好向用戶推送廣告;
數(shù)據(jù)盈利——ChatGPT生成的大量數(shù)據(jù),包括會(huì)話日志和客戶反饋,這些數(shù)據(jù)可以通過出售給第三方或用于改進(jìn)ChatGPT的功能來變現(xiàn);
咨詢服務(wù)——ChatGPT可以分析客戶對(duì)話并提供見解和建議,以改善客戶體驗(yàn);
版權(quán)授權(quán)——ChatGPT可以授權(quán)給希望在自己的聊天機(jī)器人應(yīng)用程序中使用其功能的客戶。
當(dāng)然,以上這些潛在的商業(yè)模式,實(shí)際上是整個(gè)對(duì)話式AI都面臨的巨大空間。ChatGPT只是作為其中最具代表性的AIGC文字內(nèi)容生產(chǎn)工具之一,優(yōu)勢(shì)更明顯。
我們也看到,基于ChatGPT的商業(yè)潛力,很多科技巨頭都在加快布局。反應(yīng)最快也最激烈的,是微軟。
早在2019年,微軟就向OpenAI投資了10億美元,前段時(shí)間ChatGPT爆火后,微軟又傳出欲以100億美元收購(gòu)OpenAI的消息——如若交易達(dá)成,這將成為微軟迄今為止最大的一筆投資。
最新的消息是,微軟CEO納德拉表示,微軟計(jì)劃將ChatGPT等OpenAI的人工智能工具整合進(jìn)公司所有產(chǎn)品,并將其作為平臺(tái)供其他企業(yè)使用。
一個(gè)有趣的細(xì)節(jié)是,此前微軟盡管多年來連續(xù)投資OpenAI,但比爾·蓋茨并不喜歡這項(xiàng)投資,他對(duì)OpenAI的技術(shù)持懷疑態(tài)度,認(rèn)為其部分側(cè)重于計(jì)算機(jī)掌握人類語言含義的能力。
但是在1月12日的一次活動(dòng)中,當(dāng)被問及如何看待ChatGPT時(shí),他表示,“這讓我能一窺未來,整個(gè)平臺(tái)的方法和創(chuàng)新速度都令我印象深刻。”態(tài)度已然轉(zhuǎn)變。
三、ChatGPT會(huì)取代搜索引擎嗎?
ChatGPT爆紅之后,其在編程、文本生成等NLP領(lǐng)域強(qiáng)大的能力已經(jīng)引發(fā)了部分行業(yè)的擔(dān)憂。
比如由于ChatGPT擁有基于對(duì)話形式接收輸入指令并輸出結(jié)果的能力,與傳統(tǒng)的搜索引擎功能具有一定的重合。
我們也看到,最近搜索引擎巨頭谷歌動(dòng)作頻頻,顯然感受到了ChatGPT帶來的壓力。
據(jù)媒體報(bào)道,谷歌CEO Sundar Pichai參與了一系列探討谷歌AI戰(zhàn)略的會(huì)議,同時(shí)公司的研究、信任與安全等部門和團(tuán)隊(duì),將被組織重整,旨在幫助開發(fā)和發(fā)布新的AI原型和產(chǎn)品。
谷歌還要求員工開發(fā)能夠創(chuàng)建藝術(shù)品和其他圖像的AI產(chǎn)品,對(duì)標(biāo)的正是OpenAI的另一項(xiàng)產(chǎn)品DALL-E,一個(gè)可以根據(jù)書面文字生成圖像的人工智能系統(tǒng),目前已經(jīng)吸引到超過300萬用戶。
報(bào)道還指出,谷歌管理層已經(jīng)發(fā)布了“紅色代碼”警報(bào)。在硅谷,這就意味著拉響了“火警”。
谷歌擺出積極防御姿態(tài)的同時(shí),關(guān)于ChatGPT會(huì)不會(huì)取代搜索引擎的討論,也一再升溫。
去年12月,摩根士丹利投行的首席分析師Brian Nowak在一份研報(bào)中提到,語言模型可能會(huì)占據(jù)市場(chǎng)份額,并破壞谷歌作為互聯(lián)網(wǎng)用戶入口的地位。
專欄作家Parmy Olson也撰文指出,相比谷歌搜索抓取十億個(gè)網(wǎng)頁內(nèi)容編制索引,然后按照最相關(guān)的答案對(duì)其進(jìn)行排名,包含鏈接列表來讓你點(diǎn)擊,ChatGPT可以直接基于它自己的搜索和信息綜合的單一答案,回復(fù)流程更加簡(jiǎn)便。
不過就目前階段而言,說ChatGPT可以直接取代搜索引擎,恐怕還為時(shí)尚早。
參考中國(guó)銀河證券的觀點(diǎn),其認(rèn)為有兩點(diǎn)原因不能忽略:
第一,ChatGPT與傳統(tǒng)搜索引擎的功能和優(yōu)勢(shì)并不相同。
搜索引擎是幫助人們做信息檢索的,人們的檢索行為會(huì)返回多條查詢結(jié)果、準(zhǔn)確率也較高,并且搜索引擎不會(huì)對(duì)信息做出判斷,完全呈現(xiàn)結(jié)果供用戶進(jìn)一步篩選;
ChatGPT則是一個(gè)自然語言處理模型,用戶輸入單一指令,只能得到單一結(jié)果,以此來確保與用戶對(duì)話過程的流暢性。
第二,二者的應(yīng)用領(lǐng)域不同。
搜索引擎的信息庫(kù)抓取信息快、信息庫(kù)更新頻率高、存量大,主要用于幫助用戶快速查找匹配信息、找到感興趣的信息,嘗嘗應(yīng)用在文獻(xiàn)檢索、互聯(lián)網(wǎng)搜索等領(lǐng)域;
而ChatGPT的語料庫(kù)來源于離線數(shù)據(jù),輸出的文本存在虛假信息的可能,且吸納新的知識(shí)需要對(duì)模型進(jìn)行再訓(xùn)練和微調(diào),這會(huì)導(dǎo)致訓(xùn)練成本和甄別成本上升,因此主要應(yīng)用在人機(jī)對(duì)話、智能客服、智能問答等強(qiáng)邏輯性的自然語言交互領(lǐng)域。
除了這兩點(diǎn)原因之外,ChatGPT還面臨著信息老舊的問題。它并不會(huì)在網(wǎng)絡(luò)上抓取實(shí)時(shí)信息,知識(shí)僅限于2021年之前學(xué)到的東西。
基于以上幾點(diǎn),短期之內(nèi),ChatGPT無法取代搜索引擎,但它可以作為當(dāng)前搜索引擎服務(wù)的一種補(bǔ)充,也會(huì)對(duì)現(xiàn)有的搜索引擎公司產(chǎn)生一定的沖擊,促進(jìn)巨頭間競(jìng)爭(zhēng)。