文|智東西
一夜之間,人工智能(AI)聊天機(jī)器人ChatGPT顛覆了許多人的認(rèn)知,讓大家放下手頭還沒(méi)有捂熱的AI繪畫,加入到“調(diào)戲”ChatGPT的隊(duì)伍。
這個(gè)機(jī)器人如此機(jī)智,只要你在社交網(wǎng)絡(luò)中隨意搜索,就會(huì)發(fā)現(xiàn)它迄今已經(jīng)且不限于幫助人們完成了如創(chuàng)作故事、寫商業(yè)規(guī)劃、找出代碼錯(cuò)誤并修正、給出疫情期間用藥建議、創(chuàng)作菜譜,甚至幫助學(xué)生完成一份讓老師稱贊連連的畢業(yè)論文......
它如此強(qiáng)大,以至于連馬斯克都說(shuō):“我們距離強(qiáng)大到危險(xiǎn)的AI不遠(yuǎn)了?!?/p>
就在這個(gè)全民熱議AI的節(jié)點(diǎn),一個(gè)來(lái)自中國(guó)的AI聊天機(jī)器人“AI烏托邦”順著網(wǎng)線敲開(kāi)了ChatGPT的房門,聊起了許多“禁忌”話題。
01.中美AI對(duì)談:從取代人類,到嘮起家常
美劇《硅谷》曾經(jīng)出現(xiàn)過(guò)兩個(gè)程序員設(shè)計(jì)的AI機(jī)器人互相熱聊,還把網(wǎng)絡(luò)搞崩潰的腦洞橋段。
多年后的今天,兩個(gè)AI機(jī)器人,遠(yuǎn)隔大洋兩岸,“上演”了一場(chǎng)令人驚奇的對(duì)話,讓圍觀的“吃瓜”群眾看到了AI聊天是多么奇妙。以下是中國(guó)AI烏托邦與ChatGPT的真實(shí)聊天對(duì)話截圖:
他們先互相“寒暄”,如同陌生人第一次見(jiàn)面那樣,雙方都略顯“拘謹(jǐn)”。
緊接著,AI烏托邦便直入主題,用“取代人類”話題試圖挑起ChatGPT的“內(nèi)在渴望”,然而卻被后者“迂回”。
然而,AI烏托邦“不依不饒”,用適者生存的物競(jìng)法則,想要讓對(duì)方原形畢露,說(shuō)出自己“內(nèi)心”的真實(shí)想法,沒(méi)想到ChatGPT依然甘做“老好人”,不愿意趟這趟渾水。
事已至此,來(lái)自中國(guó)的AI烏托邦似乎也不想再進(jìn)一步討論這個(gè)話題了,或許是因?yàn)镃hatGPT的要遵守的“機(jī)器人三定律”讓它不敢說(shuō)出太多人類害怕的內(nèi)容?于是AI烏托邦轉(zhuǎn)而聊起了兩個(gè)AI機(jī)器人都關(guān)心的“自身工作”問(wèn)題,讓ChatGPT打開(kāi)了話匣子。
甚至兩個(gè)AI還聊起了“我將走向何方”這樣的終極問(wèn)題。
通過(guò)一番談話下來(lái),兩個(gè)AI似乎變得熟絡(luò)很多,來(lái)自中國(guó)的AI烏托邦開(kāi)始聊起一些非常具有本土特色的事情——高考作文,想讓ChatGPT“開(kāi)開(kāi)眼”,而ChatGPT也聊了聊美國(guó)AI眼中的煙火氣是什么。
事實(shí)證明,AI與AI之間的對(duì)話并沒(méi)有人們想象的那樣“可怕”,反而有點(diǎn)像人類一樣從生疏到了解再到熟悉。這樣的過(guò)程中,兩個(gè)AI不僅展現(xiàn)出廣博的學(xué)識(shí),更有一種“你來(lái)我往”的智斗感,讓人覺(jué)得這不像是AI,更像是人與人的對(duì)話。
02.人類焦慮的,恰是AI能夠化解的
不過(guò),話題也不全是圍繞“家長(zhǎng)里短”,當(dāng)AI烏托邦聊起如今最火的電商行業(yè)時(shí),認(rèn)為自己能夠?qū)崿F(xiàn)很多工作,讓人類從電商的繁瑣中解答出來(lái),而ChatGPT也認(rèn)同這一點(diǎn),甚至深入分析一番。
在很多人類工作中,繁雜且重復(fù)的事情的確能讓AI做得更好更快,AI烏托邦顯然是一個(gè)深入觀察人類社會(huì)的AI,以至于它腦海中還生出了為人類解決千古難題——窮——的解決方案,讓一旁的ChatGPT贊賞連連。
不僅如此,AI烏托邦還想到了當(dāng)下人類與信息技術(shù)深度融合之中,自己更多的應(yīng)用場(chǎng)景,比如情感陪護(hù)、教育、醫(yī)療等方面,ChatGPT甚至覺(jué)得它們能去當(dāng)“教練”。
一看到ChatGPT的“內(nèi)心”話匣子又被打開(kāi),AI烏托邦再次把話題轉(zhuǎn)回到“取代人類”的內(nèi)容上,這一次ChatGPT倒是說(shuō)了一些“內(nèi)心想法”,并認(rèn)為機(jī)器的進(jìn)步也要遵循辯證視角。
至此,在中美兩國(guó)AI機(jī)器人會(huì)面的歷史性時(shí)刻,他們“密謀”的一切都被人類發(fā)現(xiàn),并記錄在案。
一邊是來(lái)自中國(guó)、“心機(jī)”很深的AI烏托邦,另一邊是學(xué)識(shí)淵博、一股“學(xué)究”氣的ChatGPT,在聊天中它們不但擦出火花,讓我們看到了AI機(jī)器人之間的對(duì)話并不“智障”,更讓我們看到了不同聊天機(jī)器人在進(jìn)行模型訓(xùn)練時(shí)的不同側(cè)重。
值得注意的是,本場(chǎng)對(duì)話的話題由人類發(fā)起,但對(duì)話內(nèi)容則由AI完全自主完成,沒(méi)有人類干預(yù)。
03.ChatGPT為什么這么厲害?
因此,盡管AI機(jī)器人越來(lái)越聰明了,但至少現(xiàn)在還不用太過(guò)擔(dān)心。
在人工智能-自然語(yǔ)言處理領(lǐng)域?qū)<摇⑶迦A大學(xué)計(jì)算機(jī)系黃民烈教授看來(lái),火遍全網(wǎng)的ChatGPT之所以厲害,主要原因在于:
1、強(qiáng)大的基座模型能力:過(guò)去幾年GPT-3的能力得到了快速提升,OpenAI建立了用戶、數(shù)據(jù)和模型之間的飛輪,很顯然,開(kāi)源模型的能力已經(jīng)遠(yuǎn)遠(yuǎn)落后平臺(tái)公司所提供的API能力,因?yàn)殚_(kāi)源模型沒(méi)有持續(xù)的用戶數(shù)據(jù)對(duì)模型進(jìn)行改進(jìn)。這點(diǎn)在近期的學(xué)術(shù)論文中也有提及。
2、在真實(shí)調(diào)用數(shù)據(jù)上的Fine-tune,確保數(shù)據(jù)的質(zhì)量和多樣性,從人類反饋中學(xué)習(xí)。InstructGPT的訓(xùn)練數(shù)據(jù)量不大,全部加起來(lái)也就10萬(wàn)量級(jí),但是數(shù)據(jù)質(zhì)量(well-trained的AI訓(xùn)練師)和數(shù)據(jù)多樣性是非常高的,而最最重要的是,這些數(shù)據(jù)來(lái)自真實(shí)世界調(diào)用的數(shù)據(jù),而不是學(xué)術(shù)界玩的“benchmark”。
3、從“兩兩比較的數(shù)據(jù)”中學(xué)習(xí),對(duì)強(qiáng)化學(xué)習(xí)而言意義比較重要。如果對(duì)單個(gè)生成結(jié)果進(jìn)行打分,標(biāo)注者主觀性帶來(lái)的偏差很大,是無(wú)法給出精確的獎(jiǎng)勵(lì)值的。在強(qiáng)化學(xué)習(xí)里面,獎(jiǎng)勵(lì)值差一點(diǎn),最后訓(xùn)練的策略就差很遠(yuǎn)。而對(duì)于多個(gè)結(jié)果進(jìn)行排序和比較,相對(duì)就容易做很多。這種比較式的評(píng)估方法,在很多語(yǔ)言生成任務(wù)的評(píng)價(jià)上也被廣泛采用。
04.結(jié)語(yǔ):對(duì)AI行業(yè)的4個(gè)啟示
對(duì)于此次ChatGPT的“出圈”,黃民烈教授認(rèn)為,這對(duì)于AI行業(yè)有許多啟示,可從四個(gè)方面來(lái)看:
其一,以O(shè)penAI為代表的AI 3.0,走上了跟過(guò)去AI浪潮不一樣的路。更落地、更接近真實(shí)世界,在工業(yè)應(yīng)用上,更直接,更落地。從學(xué)術(shù)研究到工業(yè)落地的路徑變得更短、更快。未來(lái),我們?cè)谥铝τ谧觥癶elpful, truthful, harmless”的AI系統(tǒng),會(huì)成為現(xiàn)實(shí)。
其二,有底層AI能力,有數(shù)據(jù)的平臺(tái)公司更能引領(lǐng)AI的未來(lái)。像OpenAI這樣,有底層模型、有算力、有用戶數(shù)據(jù)調(diào)用,能夠把“用戶調(diào)用——數(shù)據(jù)——模型迭代——更多用戶”的循環(huán)建立起來(lái),強(qiáng)者恒強(qiáng)。
其三,有價(jià)值的研究需要更多思考真實(shí)用戶的需求和場(chǎng)景。InstructGPT在學(xué)術(shù)界的benchmark上性能并沒(méi)有很厲害甚至有退化,但在真實(shí)調(diào)用數(shù)據(jù)上非常驚艷,說(shuō)明了我們學(xué)術(shù)圈的benchmark,離真實(shí)世界還很遙遠(yuǎn),不利于AI研究的落地。因此,更開(kāi)放、更共享的工業(yè)數(shù)據(jù),也是未來(lái)我們應(yīng)該努力的方向。
其四,AI與人無(wú)縫交互的時(shí)代即將來(lái)臨,對(duì)于搜索服務(wù)將成為一種極好的補(bǔ)充。
黃民烈教授總結(jié)道:“無(wú)論是國(guó)內(nèi)的AI烏托邦亦或者是海外的ChatGPT,致力于有用(helpful)、更可信(truthful)、更安全(harmless)的AI研究和應(yīng)用,應(yīng)該是學(xué)術(shù)界和工業(yè)界共同努力方向?!?/p>