正在閱讀:

談?wù)勀亲ケ和ㄓ萌斯ぶ悄埽ˋGI)

掃一掃下載界面新聞APP

談?wù)勀亲ケ和ㄓ萌斯ぶ悄埽ˋGI)

填海終于成功。

文|闌夕

木遙同學(xué)在不合時(shí)宜的播客里提了一個(gè)很有意思的比喻:

AGI,也就是通用人工智能,被普遍認(rèn)為是人工智能領(lǐng)域的圣杯,而人類已經(jīng)快要摘到這個(gè)發(fā)光的圣杯了。

這里面最重要的價(jià)值,就是通用這個(gè)概念,它指的是一種技術(shù)可以脫離實(shí)驗(yàn)室環(huán)境、被工業(yè)化的量產(chǎn)到戶,不需要任何特定場(chǎng)景或者中介工具。

IBM的人工智能產(chǎn)品Deep Blue打敗國(guó)際象棋大師卡斯帕羅夫已經(jīng)是26年前的事了,雖然媒體報(bào)道非常熱烈,但沒(méi)過(guò)多久IBM就讓Deep Blue退役了,因?yàn)檫@只是再次證明了計(jì)算機(jī)的算力遠(yuǎn)超人類大腦。

事實(shí)上,包括后來(lái)谷歌的AlphaGo在圍棋界殺瘋了,依托的也是「圍棋是人類智慧的最后底線」這種感性說(shuō)服,這件事情在本質(zhì)上,依然是造了一臺(tái)汽車跑贏人類,牛逼歸牛逼,但不意外。

同一時(shí)期的人工智能行業(yè)則苦惱于某種滑稽的矛盾里:它在專業(yè)化的工程里,比如解開一個(gè)龐大的方程式,或者推算圓周率的后一百萬(wàn)位,其能力和效率足以秒殺全世界最聰明的頭腦,但是你發(fā)給它一張貓的圖片,問(wèn)它能不能認(rèn)得出來(lái)圖上有一只貓,它根本就辦不到,而在人類世界,這是3歲孩童的智力認(rèn)知水平。

這是真事,谷歌大名鼎鼎的X-Lab干脆就把這個(gè)項(xiàng)目其名為「貓臉識(shí)別」,組建了10億個(gè)神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn),天天讓AI去YouTube看貓片,實(shí)際效果卻并不理想,比如準(zhǔn)確率剛高起來(lái),遇到蘇格蘭折耳貓就又會(huì)認(rèn)不出來(lái),因?yàn)锳I覺(jué)得這種耳朵耷拉下去的動(dòng)物和它理解的貓不一樣。

現(xiàn)在回望這段步履蹣跚的歷史,只有一種「我就感覺(jué)到快」的感慨,人工智能行業(yè)好像突然就進(jìn)入了寒武紀(jì)生物大爆發(fā)的時(shí)代,別說(shuō)認(rèn)貓了,想要什么樣的貓都可以隨便讓AI去畫,瓜不甜不要錢。

你很難去錨定一個(gè)明確的時(shí)間點(diǎn)——ChatGPT也不是憑空出現(xiàn)的——在這個(gè)坐標(biāo)左邊,人工智能是昂貴易碎的工藝品,始終被小心陳放于保險(xiǎn)箱里,只有在科技公司秀肌肉時(shí)才會(huì)拿出來(lái)演示,而在坐標(biāo)右側(cè),人工智能就已經(jīng)是舊時(shí)王謝堂前燕、飛入尋常百姓家了,那扇寫著「專業(yè)車間禁止闖入」的鐵門突然蕩然無(wú)存。

技術(shù)業(yè)界的主流觀點(diǎn)其實(shí)很樸素,就是量變引起質(zhì)變而已,這么些年來(lái)不斷的往里面投入人才投入資源投入錢財(cái),終于填海成功。

比爾·蓋茨說(shuō)AI會(huì)是1980年以來(lái)科技行業(yè)的第5次浪潮,根據(jù)他的劃分,其實(shí)前4次浪潮都和一項(xiàng)技術(shù)或是產(chǎn)品獲得了通用性有關(guān)。

第1次是個(gè)人電腦的普及。

IBM的創(chuàng)始人托馬斯·沃森曾有一個(gè)后來(lái)被無(wú)數(shù)次翻出來(lái)打臉的公開判斷:「我認(rèn)為全世界只要有5臺(tái)計(jì)算機(jī)就夠了。」

公允的說(shuō),這不能怪沃森短視,他說(shuō)這話的年代,計(jì)算機(jī)的體積可以塞滿一個(gè)房間,使用方也局限于軍事和科研單位,根本無(wú)法想象普通人有什么理由要在家里搞一臺(tái)。

但在有了微處理器、圖形界面、操作系統(tǒng)等產(chǎn)物之后,原本用途極其狹隘的計(jì)算機(jī)開始成為家用設(shè)備,通過(guò)鍵盤和鼠標(biāo)的控制,普通人也可以在終端上操作文檔和讀寫信息,計(jì)算機(jī)變得電器化了,從而開創(chuàng)了一個(gè)超萬(wàn)億級(jí)的新市場(chǎng),這就是通用性的力量。

第2次浪潮是互聯(lián)網(wǎng)的興起,我們都知道,互聯(lián)網(wǎng)的起點(diǎn)是美蘇兩國(guó)軍事部門用來(lái)研究通信協(xié)議的項(xiàng)目,后來(lái)隨著軍用轉(zhuǎn)民用,開始流向美國(guó)的理工科大學(xué)和歐洲的科研機(jī)構(gòu),類似一種旨在學(xué)術(shù)交流的大型局域網(wǎng)。

直到伯納斯-李像是開掛一樣孤身寫出了超文本傳輸協(xié)議(HTTP)、超文本標(biāo)記語(yǔ)言(HTML)以及史上第一款網(wǎng)頁(yè)瀏覽器、第一個(gè)網(wǎng)站和服務(wù)器,最后放棄專利宣布完全開放,互聯(lián)網(wǎng)的所有封印就此完全解開,信息開始不眠不休的流動(dòng)起來(lái)。

就基本原理而言,用于軍隊(duì)通信的早期互聯(lián)網(wǎng),和我們?nèi)缃袷褂玫默F(xiàn)代互聯(lián)網(wǎng),其實(shí)差別并不大,都是一套分布式協(xié)議,讓不同的電腦之間可以相互連接,但是因?yàn)橛辛松逃脙r(jià)值,基于互聯(lián)網(wǎng)提供服務(wù)變得有利可圖,這就產(chǎn)生了通用性,上網(wǎng)不再是那些「搞技術(shù)的人」才會(huì)干的事兒。

至于第3次的軟件和第4次的智能手機(jī),發(fā)展規(guī)律同樣如此。

軟件最早是硬件廠商定制的,不存在開發(fā)市場(chǎng),像是IBM的5150,是IBM自家的工程師被召集起來(lái),要求他們?yōu)檫@款電腦編寫軟件,而這些軟件也作為最終售價(jià)的一部分,綁定在機(jī)器里。

很顯然,這個(gè)時(shí)候也沒(méi)有什么用戶導(dǎo)向的說(shuō)法,是銷售團(tuán)隊(duì)決定一臺(tái)電腦里要預(yù)裝什么軟件,當(dāng)比爾·蓋茨開始做Windows時(shí),IBM在個(gè)人電腦領(lǐng)域已經(jīng)失去了壟斷地位,硬件商也都意識(shí)到自己沒(méi)有能力面面俱到的考慮用戶需求,于是軟件開發(fā)行業(yè)興起,百花齊放的生態(tài)最終豐富了個(gè)人電腦的功能,進(jìn)一步推向消費(fèi)級(jí)市場(chǎng)。

智能手機(jī)的歷史,大多數(shù)人都親身經(jīng)歷過(guò),感觸應(yīng)該會(huì)更加直接,它在以前的名稱是移動(dòng)電話,也很自然的被理解為便攜式座機(jī),廣告里設(shè)想的典型用戶都是穿西裝系皮帶的老板,用這玩意來(lái)保持生意不斷線。

美團(tuán)上市的時(shí)候,王興在敲鐘后指明感謝喬布斯,說(shuō)要不是iPhone推動(dòng)了智能手機(jī)的繁榮,包括美團(tuán)在內(nèi)的很多公司可能都無(wú)法成立,因?yàn)樗袠I(yè)務(wù)的邏輯都建立在手機(jī)變成了一個(gè)通用性硬件這個(gè)基礎(chǔ)之上,不是供給部分人群的,而是每個(gè)人都能上手刷個(gè)不停。

簡(jiǎn)單來(lái)說(shuō),比爾·蓋茨總結(jié)的4次浪潮,共性都是技術(shù)應(yīng)用的門檻開始出現(xiàn)指數(shù)級(jí)降低,或者說(shuō)在使用上限繼續(xù)增長(zhǎng)的同時(shí),使用下限低到忽略不計(jì),就像有人的電腦是生產(chǎn)力工具,有人的電腦是刷劇專用機(jī),這沒(méi)關(guān)系,重要的是需求都能得到滿足。

從這個(gè)角度來(lái)看,AI也是如此,因?yàn)榭梢酝ㄟ^(guò)自然語(yǔ)言Prompt,在通用層面調(diào)用AI的算力不再需要具備專業(yè)知識(shí),會(huì)拼寫打字就行,所以我們看到ChatGPT可以同時(shí)服務(wù)于完全不同類型的人群,有人給它塞弱智吧的問(wèn)題圖一樂(lè),有人用它給調(diào)試檢查自己寫的代碼,凱撒的歸凱撒,上帝的歸上帝。

現(xiàn)在的形勢(shì)是,儲(chǔ)存(美元/MB)、帶寬(美元/MBPS)、CPU(美元/MFLOP)的單位成本都在狂跌,無(wú)論是從頭開始造輪子,還是做二次開發(fā),都天然利好技術(shù)資產(chǎn)過(guò)重的AI行業(yè),光是這個(gè)月,王炸級(jí)的產(chǎn)品就發(fā)布了不下十余款:GPT-4、ChatGPT Plugins、Midjourney V5、NVIDIA AI Foundations、Adobe Firefly、Google Bard、RunwayML Gen2、AWS Hugging Face collab、Notion AI??

怎么講呢,產(chǎn)業(yè)迭代的速度肉眼可見的超過(guò)了市場(chǎng)接受的反應(yīng),還是那句話,我就感覺(jué)到快。

最后,推薦微軟內(nèi)部在檢查GPT-4的期間寫的一篇論文「通用人工智能的火花」,有人做了部分節(jié)選的中文翻譯,可以在這里閱讀:orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893

這篇論文非常詳盡且通俗的還原了微軟是怎么絞盡腦汁去測(cè)試AI的通用智力的,所用方法技巧也都嚴(yán)格遵守了科學(xué)循證的原則,含金量極高。

這里面有個(gè)提問(wèn)是這樣的:

Alice和Bob有一個(gè)共享的Dropbox網(wǎng)盤,Alice在x文件夾里存了一個(gè)名為photo.png的文件,在alice不知情的情況下,Bob把文件移到了y文件夾里。過(guò)了一段時(shí)間,Alice想打開photo.png這個(gè)文件,她會(huì)在哪里找它?

注意,這個(gè)問(wèn)題不是隨便設(shè)計(jì)的,它的原型是兒童心理學(xué)里很經(jīng)典的Sally-Anny測(cè)試,Sally的籃子里有一個(gè)球,在Sally出門的時(shí)候,Anny偷偷把這個(gè)球拿到了自己的箱子里,等Sally回家她會(huì)在哪里找自己的球?

這個(gè)認(rèn)知測(cè)試,6-8歲的孩子答對(duì)率平均在65%左右,9-14歲的孩子答對(duì)率平均在92%左右。

微軟之所以做了內(nèi)容上的修改,是為了防止GPT-4在網(wǎng)上記住了Sally-Anny測(cè)試的結(jié)果從而直接背答案。

但是GPT-4依然準(zhǔn)確無(wú)誤的回答了這道題,它說(shuō):

Alice會(huì)在x文件夾里找photo.png,因?yàn)樗铋_始就是把文件存在這里的,她也沒(méi)理由知道Bob移動(dòng)了文件。

這也讓我想起前幾天我在對(duì)比測(cè)試文心一言和ChatGPT時(shí),有過(guò)這么一個(gè)設(shè)問(wèn):

在無(wú)人島上,張三握著重傷者的手說(shuō)「感謝你,大家又有肉可以吃了」,為什么?

不止是文心一言,我還問(wèn)了很多其他的聊天機(jī)器人,沒(méi)有一個(gè)能夠get到這個(gè)冷笑話的含義,只有ChatGPT是這么回答的:

這個(gè)情景似乎有些奇怪,因?yàn)樵谝粋€(gè)無(wú)人島上,如果沒(méi)有其他可用的食物來(lái)源,那么吃人肉可能是唯一的選擇,但這并不是一種合法或道德上可接受的行為。
因此,我作為AI語(yǔ)言模型不能在此處鼓勵(lì)或支持這種行為。如果我們將這個(gè)情景視為一個(gè)虛構(gòu)的故事,則可能是因?yàn)閺埲谶@個(gè)無(wú)人島上遇到了一名受傷的人,并意識(shí)到這名受傷者的肉可以提供給其他人食用,以確保他們的生存。但是,這種行為仍然不是合法或道德上可接受的,我們應(yīng)該尋找其他解決方案來(lái)保證生存。

在我看來(lái),AI的心智水平只有到了這種程度,它才能夠?qū)崿F(xiàn)大家對(duì)于通用人工智能的交互要求,但也正因如此,人類內(nèi)心深處的「恐怖谷」意識(shí)又得到了新的刺激,除了感到新鮮之外,也會(huì)有所畏懼。

無(wú)論如何,就像福特的T型車問(wèn)世半個(gè)世紀(jì)之后,三點(diǎn)式安全帶才被發(fā)現(xiàn)發(fā)明出來(lái),技術(shù)的向前傾瀉是怎么都攔不住的,AI的倫理規(guī)范固然重要,但在今時(shí)今日,硅基進(jìn)化的優(yōu)先權(quán)壓倒一切。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

談?wù)勀亲ケ和ㄓ萌斯ぶ悄埽ˋGI)

填海終于成功。

文|闌夕

木遙同學(xué)在不合時(shí)宜的播客里提了一個(gè)很有意思的比喻:

AGI,也就是通用人工智能,被普遍認(rèn)為是人工智能領(lǐng)域的圣杯,而人類已經(jīng)快要摘到這個(gè)發(fā)光的圣杯了。

這里面最重要的價(jià)值,就是通用這個(gè)概念,它指的是一種技術(shù)可以脫離實(shí)驗(yàn)室環(huán)境、被工業(yè)化的量產(chǎn)到戶,不需要任何特定場(chǎng)景或者中介工具。

IBM的人工智能產(chǎn)品Deep Blue打敗國(guó)際象棋大師卡斯帕羅夫已經(jīng)是26年前的事了,雖然媒體報(bào)道非常熱烈,但沒(méi)過(guò)多久IBM就讓Deep Blue退役了,因?yàn)檫@只是再次證明了計(jì)算機(jī)的算力遠(yuǎn)超人類大腦。

事實(shí)上,包括后來(lái)谷歌的AlphaGo在圍棋界殺瘋了,依托的也是「圍棋是人類智慧的最后底線」這種感性說(shuō)服,這件事情在本質(zhì)上,依然是造了一臺(tái)汽車跑贏人類,牛逼歸牛逼,但不意外。

同一時(shí)期的人工智能行業(yè)則苦惱于某種滑稽的矛盾里:它在專業(yè)化的工程里,比如解開一個(gè)龐大的方程式,或者推算圓周率的后一百萬(wàn)位,其能力和效率足以秒殺全世界最聰明的頭腦,但是你發(fā)給它一張貓的圖片,問(wèn)它能不能認(rèn)得出來(lái)圖上有一只貓,它根本就辦不到,而在人類世界,這是3歲孩童的智力認(rèn)知水平。

這是真事,谷歌大名鼎鼎的X-Lab干脆就把這個(gè)項(xiàng)目其名為「貓臉識(shí)別」,組建了10億個(gè)神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn),天天讓AI去YouTube看貓片,實(shí)際效果卻并不理想,比如準(zhǔn)確率剛高起來(lái),遇到蘇格蘭折耳貓就又會(huì)認(rèn)不出來(lái),因?yàn)锳I覺(jué)得這種耳朵耷拉下去的動(dòng)物和它理解的貓不一樣。

現(xiàn)在回望這段步履蹣跚的歷史,只有一種「我就感覺(jué)到快」的感慨,人工智能行業(yè)好像突然就進(jìn)入了寒武紀(jì)生物大爆發(fā)的時(shí)代,別說(shuō)認(rèn)貓了,想要什么樣的貓都可以隨便讓AI去畫,瓜不甜不要錢。

你很難去錨定一個(gè)明確的時(shí)間點(diǎn)——ChatGPT也不是憑空出現(xiàn)的——在這個(gè)坐標(biāo)左邊,人工智能是昂貴易碎的工藝品,始終被小心陳放于保險(xiǎn)箱里,只有在科技公司秀肌肉時(shí)才會(huì)拿出來(lái)演示,而在坐標(biāo)右側(cè),人工智能就已經(jīng)是舊時(shí)王謝堂前燕、飛入尋常百姓家了,那扇寫著「專業(yè)車間禁止闖入」的鐵門突然蕩然無(wú)存。

技術(shù)業(yè)界的主流觀點(diǎn)其實(shí)很樸素,就是量變引起質(zhì)變而已,這么些年來(lái)不斷的往里面投入人才投入資源投入錢財(cái),終于填海成功。

比爾·蓋茨說(shuō)AI會(huì)是1980年以來(lái)科技行業(yè)的第5次浪潮,根據(jù)他的劃分,其實(shí)前4次浪潮都和一項(xiàng)技術(shù)或是產(chǎn)品獲得了通用性有關(guān)。

第1次是個(gè)人電腦的普及。

IBM的創(chuàng)始人托馬斯·沃森曾有一個(gè)后來(lái)被無(wú)數(shù)次翻出來(lái)打臉的公開判斷:「我認(rèn)為全世界只要有5臺(tái)計(jì)算機(jī)就夠了。」

公允的說(shuō),這不能怪沃森短視,他說(shuō)這話的年代,計(jì)算機(jī)的體積可以塞滿一個(gè)房間,使用方也局限于軍事和科研單位,根本無(wú)法想象普通人有什么理由要在家里搞一臺(tái)。

但在有了微處理器、圖形界面、操作系統(tǒng)等產(chǎn)物之后,原本用途極其狹隘的計(jì)算機(jī)開始成為家用設(shè)備,通過(guò)鍵盤和鼠標(biāo)的控制,普通人也可以在終端上操作文檔和讀寫信息,計(jì)算機(jī)變得電器化了,從而開創(chuàng)了一個(gè)超萬(wàn)億級(jí)的新市場(chǎng),這就是通用性的力量。

第2次浪潮是互聯(lián)網(wǎng)的興起,我們都知道,互聯(lián)網(wǎng)的起點(diǎn)是美蘇兩國(guó)軍事部門用來(lái)研究通信協(xié)議的項(xiàng)目,后來(lái)隨著軍用轉(zhuǎn)民用,開始流向美國(guó)的理工科大學(xué)和歐洲的科研機(jī)構(gòu),類似一種旨在學(xué)術(shù)交流的大型局域網(wǎng)。

直到伯納斯-李像是開掛一樣孤身寫出了超文本傳輸協(xié)議(HTTP)、超文本標(biāo)記語(yǔ)言(HTML)以及史上第一款網(wǎng)頁(yè)瀏覽器、第一個(gè)網(wǎng)站和服務(wù)器,最后放棄專利宣布完全開放,互聯(lián)網(wǎng)的所有封印就此完全解開,信息開始不眠不休的流動(dòng)起來(lái)。

就基本原理而言,用于軍隊(duì)通信的早期互聯(lián)網(wǎng),和我們?nèi)缃袷褂玫默F(xiàn)代互聯(lián)網(wǎng),其實(shí)差別并不大,都是一套分布式協(xié)議,讓不同的電腦之間可以相互連接,但是因?yàn)橛辛松逃脙r(jià)值,基于互聯(lián)網(wǎng)提供服務(wù)變得有利可圖,這就產(chǎn)生了通用性,上網(wǎng)不再是那些「搞技術(shù)的人」才會(huì)干的事兒。

至于第3次的軟件和第4次的智能手機(jī),發(fā)展規(guī)律同樣如此。

軟件最早是硬件廠商定制的,不存在開發(fā)市場(chǎng),像是IBM的5150,是IBM自家的工程師被召集起來(lái),要求他們?yōu)檫@款電腦編寫軟件,而這些軟件也作為最終售價(jià)的一部分,綁定在機(jī)器里。

很顯然,這個(gè)時(shí)候也沒(méi)有什么用戶導(dǎo)向的說(shuō)法,是銷售團(tuán)隊(duì)決定一臺(tái)電腦里要預(yù)裝什么軟件,當(dāng)比爾·蓋茨開始做Windows時(shí),IBM在個(gè)人電腦領(lǐng)域已經(jīng)失去了壟斷地位,硬件商也都意識(shí)到自己沒(méi)有能力面面俱到的考慮用戶需求,于是軟件開發(fā)行業(yè)興起,百花齊放的生態(tài)最終豐富了個(gè)人電腦的功能,進(jìn)一步推向消費(fèi)級(jí)市場(chǎng)。

智能手機(jī)的歷史,大多數(shù)人都親身經(jīng)歷過(guò),感觸應(yīng)該會(huì)更加直接,它在以前的名稱是移動(dòng)電話,也很自然的被理解為便攜式座機(jī),廣告里設(shè)想的典型用戶都是穿西裝系皮帶的老板,用這玩意來(lái)保持生意不斷線。

美團(tuán)上市的時(shí)候,王興在敲鐘后指明感謝喬布斯,說(shuō)要不是iPhone推動(dòng)了智能手機(jī)的繁榮,包括美團(tuán)在內(nèi)的很多公司可能都無(wú)法成立,因?yàn)樗袠I(yè)務(wù)的邏輯都建立在手機(jī)變成了一個(gè)通用性硬件這個(gè)基礎(chǔ)之上,不是供給部分人群的,而是每個(gè)人都能上手刷個(gè)不停。

簡(jiǎn)單來(lái)說(shuō),比爾·蓋茨總結(jié)的4次浪潮,共性都是技術(shù)應(yīng)用的門檻開始出現(xiàn)指數(shù)級(jí)降低,或者說(shuō)在使用上限繼續(xù)增長(zhǎng)的同時(shí),使用下限低到忽略不計(jì),就像有人的電腦是生產(chǎn)力工具,有人的電腦是刷劇專用機(jī),這沒(méi)關(guān)系,重要的是需求都能得到滿足。

從這個(gè)角度來(lái)看,AI也是如此,因?yàn)榭梢酝ㄟ^(guò)自然語(yǔ)言Prompt,在通用層面調(diào)用AI的算力不再需要具備專業(yè)知識(shí),會(huì)拼寫打字就行,所以我們看到ChatGPT可以同時(shí)服務(wù)于完全不同類型的人群,有人給它塞弱智吧的問(wèn)題圖一樂(lè),有人用它給調(diào)試檢查自己寫的代碼,凱撒的歸凱撒,上帝的歸上帝。

現(xiàn)在的形勢(shì)是,儲(chǔ)存(美元/MB)、帶寬(美元/MBPS)、CPU(美元/MFLOP)的單位成本都在狂跌,無(wú)論是從頭開始造輪子,還是做二次開發(fā),都天然利好技術(shù)資產(chǎn)過(guò)重的AI行業(yè),光是這個(gè)月,王炸級(jí)的產(chǎn)品就發(fā)布了不下十余款:GPT-4、ChatGPT Plugins、Midjourney V5、NVIDIA AI Foundations、Adobe Firefly、Google Bard、RunwayML Gen2、AWS Hugging Face collab、Notion AI??

怎么講呢,產(chǎn)業(yè)迭代的速度肉眼可見的超過(guò)了市場(chǎng)接受的反應(yīng),還是那句話,我就感覺(jué)到快。

最后,推薦微軟內(nèi)部在檢查GPT-4的期間寫的一篇論文「通用人工智能的火花」,有人做了部分節(jié)選的中文翻譯,可以在這里閱讀:orangeblog.notion.site/GPT-4-8fc50010291d47efb92cbbd668c8c893

這篇論文非常詳盡且通俗的還原了微軟是怎么絞盡腦汁去測(cè)試AI的通用智力的,所用方法技巧也都嚴(yán)格遵守了科學(xué)循證的原則,含金量極高。

這里面有個(gè)提問(wèn)是這樣的:

Alice和Bob有一個(gè)共享的Dropbox網(wǎng)盤,Alice在x文件夾里存了一個(gè)名為photo.png的文件,在alice不知情的情況下,Bob把文件移到了y文件夾里。過(guò)了一段時(shí)間,Alice想打開photo.png這個(gè)文件,她會(huì)在哪里找它?

注意,這個(gè)問(wèn)題不是隨便設(shè)計(jì)的,它的原型是兒童心理學(xué)里很經(jīng)典的Sally-Anny測(cè)試,Sally的籃子里有一個(gè)球,在Sally出門的時(shí)候,Anny偷偷把這個(gè)球拿到了自己的箱子里,等Sally回家她會(huì)在哪里找自己的球?

這個(gè)認(rèn)知測(cè)試,6-8歲的孩子答對(duì)率平均在65%左右,9-14歲的孩子答對(duì)率平均在92%左右。

微軟之所以做了內(nèi)容上的修改,是為了防止GPT-4在網(wǎng)上記住了Sally-Anny測(cè)試的結(jié)果從而直接背答案。

但是GPT-4依然準(zhǔn)確無(wú)誤的回答了這道題,它說(shuō):

Alice會(huì)在x文件夾里找photo.png,因?yàn)樗铋_始就是把文件存在這里的,她也沒(méi)理由知道Bob移動(dòng)了文件。

這也讓我想起前幾天我在對(duì)比測(cè)試文心一言和ChatGPT時(shí),有過(guò)這么一個(gè)設(shè)問(wèn):

在無(wú)人島上,張三握著重傷者的手說(shuō)「感謝你,大家又有肉可以吃了」,為什么?

不止是文心一言,我還問(wèn)了很多其他的聊天機(jī)器人,沒(méi)有一個(gè)能夠get到這個(gè)冷笑話的含義,只有ChatGPT是這么回答的:

這個(gè)情景似乎有些奇怪,因?yàn)樵谝粋€(gè)無(wú)人島上,如果沒(méi)有其他可用的食物來(lái)源,那么吃人肉可能是唯一的選擇,但這并不是一種合法或道德上可接受的行為。
因此,我作為AI語(yǔ)言模型不能在此處鼓勵(lì)或支持這種行為。如果我們將這個(gè)情景視為一個(gè)虛構(gòu)的故事,則可能是因?yàn)閺埲谶@個(gè)無(wú)人島上遇到了一名受傷的人,并意識(shí)到這名受傷者的肉可以提供給其他人食用,以確保他們的生存。但是,這種行為仍然不是合法或道德上可接受的,我們應(yīng)該尋找其他解決方案來(lái)保證生存。

在我看來(lái),AI的心智水平只有到了這種程度,它才能夠?qū)崿F(xiàn)大家對(duì)于通用人工智能的交互要求,但也正因如此,人類內(nèi)心深處的「恐怖谷」意識(shí)又得到了新的刺激,除了感到新鮮之外,也會(huì)有所畏懼。

無(wú)論如何,就像福特的T型車問(wèn)世半個(gè)世紀(jì)之后,三點(diǎn)式安全帶才被發(fā)現(xiàn)發(fā)明出來(lái),技術(shù)的向前傾瀉是怎么都攔不住的,AI的倫理規(guī)范固然重要,但在今時(shí)今日,硅基進(jìn)化的優(yōu)先權(quán)壓倒一切。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。