文|奇偶工作室
今天剛睡醒,基哥發(fā)現(xiàn)GPT-4,它來了!性能相當(dāng)炸裂,更聰明、且更有“感情”。
3月15日,#GPT4做一個網(wǎng)站只要十秒#登上熱搜。
OpenAI的老板山姆·阿爾特曼,直接在推特上表示:
這是我們迄今為止功能最強大的模型!
有多強呢?
考試擊敗90%的人類、15秒一鍵生成網(wǎng)站、還能識圖玩梗等。
性能大幅提升學(xué)會識圖玩梗
給GPT-4 一張iPhone充電器的圖片,問為什么好笑。
回答,VGA 線充 iPhone。(GPT4:這張圖片中的幽默來自將過時的大型 VGA 連接器插入小型現(xiàn)代智能手機充電端口的荒謬做法。)
現(xiàn)在GPT4已經(jīng)可以理解幽默,還能識別圖片了。
手套掉下去會怎樣?
GPT-4:它會掉到木板上,并且球會被彈飛。
連做飯都行:輸入牛奶、雞蛋、面粉等食材的圖片,GPT-4可以識別圖片元素并輸出食材用途參考。
一夜之間,全球所有驗證碼都失效了,因為AI已經(jīng)能讀懂圖片了。
GPT-4不再限于聊天,幾乎所有辦公室案頭工作,它無所不能。
GPT-4還能處理更復(fù)雜的圖像信息,包括表格、考試題目截圖、論文截圖、漫畫等,例如根據(jù)專業(yè)論文直接給出論文摘要和要點。
可以量子速讀看論文,如果你給它 InstructGPT 的論文,讓它總結(jié)摘要,就會變成這樣:
再比如,10秒鐘就能做出一個網(wǎng)站。程序員們也該失業(yè)了?
OpenAI做了個演示:
1. 在草稿本上用紙筆畫出一個非常粗糙的草圖
2. 拍照告訴 GPT 我要做一個網(wǎng)站長這樣,給我生成網(wǎng)站代碼
3. 網(wǎng)站做完,總共歷時十秒鐘左右
一系列操作下來,驚呆眾人。在上手體驗之后,不少網(wǎng)友現(xiàn)身說法:
我不在乎它不是 AGI,GPT-4 是一項令人難以置信的變革性技術(shù)。我在 60 秒內(nèi)重新創(chuàng)建了 Pong 游戲。這是我的第一次嘗試。
未來,讓GPT-4自己開發(fā)GPT-5如何?
獵豹移動董事長兼CEO傅盛,第一時間分享了體驗視頻,他表示:“GPT-4發(fā)布 世界要變了!每個人都要關(guān)心。”
OpenAI官網(wǎng)上,用GPT-3.5和GPT-4做了示范,效果貌似已經(jīng)顯著拉開了。
誰更智能一目了然…
問:
Andrew:上午11點-下午3點有空
Joanne:中午-下午2點有空、下午3點半-下午5點有空
Hannah:中午有半小時的時間,下午4-6點有空
給這仨人安排個30分鐘的會議,有哪些選擇?
答:
ChatGPT:會議可以在下午4點開始
GPT-4:會議可以在中午12點開始
在性能表現(xiàn)上,OpenAI直接甩出一句話:
在各種專業(yè)和學(xué)術(shù)基準上和人類相當(dāng)!
不服跑個分,考試小能手
就像手機愛跑分,GPT-4也去考了個試。
SAT(美國高考):1410/1600(前 6%)。
美國統(tǒng)一律師資格考試(MBE+MEE+MPT):298/400(前 10%)。
AP(美國大學(xué)預(yù)科考試):生物學(xué)、微積分、宏觀經(jīng)濟學(xué)、心理學(xué)、統(tǒng)計學(xué)和歷史的大學(xué)預(yù)修高中考試:100% (5/5)。
GPT-4在大多數(shù)專業(yè)和學(xué)術(shù)考試中都有與人類水平相當(dāng)?shù)谋憩F(xiàn)。值得注意的是,它通過了統(tǒng)一律師考試的模擬版本,分數(shù)在應(yīng)試者中排名前10%。
總體來看,GPT-4在考試上,擊敗了90%的人類。
英偉達AI科學(xué)家Jim Fan點評道:“GPT-4最強的其實就是推理能力。它在GRE、SAT、法學(xué)院考試上的得分,幾乎和人類考生沒有區(qū)別。也就是說,GPT-4可以全靠自己考進斯坦福了?!?/p>
這個考試水準,你說我們?nèi)祟愡€學(xué)什么呢,他一個人工智能模型,就能考出這樣的分數(shù)。而且,這才是剛剛開始。
今天就能用上
GPT-4能夠?qū)崿F(xiàn)以下幾個方面的飛躍式提升:
1、更創(chuàng)造性的寫作能力,包括編歌曲、寫劇本。
2、可以接受圖片輸入,但目前只限內(nèi)部測試。
3、文字輸入限制提升至2.5萬字。
4、智能程度大幅躍遷,做題水平越來越好。生物奧林匹克競賽從GPT3.5的31%水平分位,直接飆升到99%水平分位,國際奧賽金獎水準。
5、更安全,有害信息更少。
目前有兩種辦法可以體驗GPT-4。
GPT-4 發(fā)布后,OpenAI 直接升級了 ChatGPT Plus,但有數(shù)量限制。
由于僅限于Plus訂閱用戶使用,當(dāng)晚,大批新訂用戶涌入,以至于OpenAI的付款系統(tǒng)被擠爆了。
圖片模式還不能使用,OpenAI創(chuàng)始人山姆阿爾特曼,當(dāng)晚也在推特上表示:他們正在預(yù)覽GPT-4的圖片輸入模式,以防止可能出現(xiàn)的安全倫理問題。
ChatGPT Plus 訂閱者可以在 chat.openai.com 上直接獲得GPT-4的訪問權(quán)限。不過,ChatGPT Plus只能用美國信用卡開通。
如果你是開發(fā)者,想訪問 GPT-4 API,那就得排隊了,OpenAI 會邀請部分開發(fā)者體驗。
OpenAI也公布了定價策略——每1000個prompt tokens 0.03美元,每1000個completion tokens 0.06美元。默認速率限制為每分鐘4萬個token和每分鐘200個請求。
結(jié)語
以前查資料先去搜索引擎,現(xiàn)在先去問ChatGPT。
就在GPT-4發(fā)布前幾個小時,谷歌為了迎戰(zhàn)微軟,宣布將一系列即將推出的生成式人工智能(AIGC)功能與模型應(yīng)用到自家產(chǎn)品中。包括Google Docs(文檔)、Gmail、Sheets(表格)和 Slides(幻燈片)等。
在中國市場,也有一些大語言模型可以期待,比如百度的文心一言,將會在明天發(fā)布。
據(jù)不完全統(tǒng)計,截至今年3月初,A股已有近20家上市公司宣布相關(guān)業(yè)務(wù)已經(jīng)接入類似ChatGPT技術(shù),或正在研究相關(guān)技術(shù)與數(shù)字人結(jié)合的應(yīng)用場景。
原美團聯(lián)合創(chuàng)始人王慧文的創(chuàng)業(yè)公司:“光年之外”,也是如火如荼。
GPT-4將大模型推向了一個新的高度,現(xiàn)在甚至是“斷崖式”領(lǐng)先。
谷歌、百度在內(nèi)的科技公司,都不可避免地面臨產(chǎn)品,“發(fā)布即落后”的尷尬局面。
科學(xué)技術(shù)部部長王志剛3月5日表示,ChatGPT證明了 AI 是大方向,而 OpenAI 在 AI 對話實時效果方面有明顯優(yōu)勢。
“比如發(fā)動機,大家都能做出發(fā)動機,但質(zhì)量是有不同的。踢足球都是盤帶、射門,但是要做到梅西那么好也不容易?!蓖踔緞偙硎?。
而微軟則躺在OpenAI背后“賺麻了”。
微軟營銷主管在 GPT-4 發(fā)布后第一時間表示:“如果你在過去六周內(nèi)的任何時候使用過新的 Bing 預(yù)覽版,你就已經(jīng)提前了解了 OpenAI 最新模型的強大功能?!?/p>
是的,微軟的新必應(yīng)早就已經(jīng)用上了GPT-4。
處于同賽道的其他玩家可能得連夜加班了,基哥也期待國內(nèi)的AI產(chǎn)品。
3月16日14點,百度將在北京總部召開新聞發(fā)布會,主題圍繞百度自家的類GPT產(chǎn)品:文心一言。百度創(chuàng)始人李彥宏,百度首席技術(shù)官王海峰將出席。
基哥最樂觀的預(yù)期,文心一言對于中文語言的“智能化”,能努力超越ChatGPT。如果能在中文領(lǐng)域接近GPT3.5 的水平,基哥認為就是超預(yù)期。