文 | 另鏡 劉雨婷
編輯 | 陳彥旭
海內(nèi)外互聯(lián)網(wǎng)大廠與創(chuàng)業(yè)者,正陷入一場(chǎng)有關(guān)ChatGPT的競(jìng)賽中。
3月15日凌晨,OpenAI推出GPT-4多模態(tài)預(yù)訓(xùn)練大模型,除語(yǔ)言文本外,還支持圖像識(shí)別輸入,以文本形式輸出。
在發(fā)布會(huì)上,官方人員演示GPT-4可以識(shí)別手繪網(wǎng)頁(yè)草圖,并僅用十秒鐘左右,就根據(jù)草圖寫出網(wǎng)站代碼。
在OpenAI發(fā)布會(huì)前幾個(gè)小時(shí),谷歌剛剛宣布推出一系列生成式AI功能,用于其各種辦公軟件中,包括谷歌Gmail、Docs(文檔)、Sheets(表格)和 Slides(幻燈片)。
在外界看來(lái),這是谷歌意圖搶在微軟3月16日預(yù)期官宣GPT接入Office之前,展現(xiàn)自己的成果。
作為直接競(jìng)爭(zhēng)對(duì)手,谷歌已走在“對(duì)抗”微軟與OpenAI的最前列。但隨著OpenAI空降官宣GPT-4,谷歌又陷入下一場(chǎng)追逐戰(zhàn)中。
ChatGPT是AIGC領(lǐng)域的顛覆性產(chǎn)品,在上線后吸引了全球關(guān)注。將ChatGPT嵌入微軟Bing搜索引擎后,Bing日活首次突破1億,直接影響到谷歌的用戶基礎(chǔ)。
面對(duì)微軟的步步緊逼,蘋果、Meta和亞馬遜等公司也正計(jì)劃重新評(píng)估其人工智能的開發(fā)策略。
3月16日,百度將率先發(fā)布“中國(guó)版ChatGPT”文心一言。國(guó)內(nèi)創(chuàng)業(yè)公司和互聯(lián)網(wǎng)大廠,都迅速跟進(jìn),不愿成為新技術(shù)掉隊(duì)者。在王興、王慧文再度攜手、開啟AI領(lǐng)域創(chuàng)業(yè)的同時(shí),快手前AI核心人物李巖也投身“多模態(tài)大模型”創(chuàng)業(yè)。
隨著OpenAI發(fā)布GPT-4,多模態(tài)大模型已成為最新的技術(shù)變革方向,人工智能正邁入“iPhone 時(shí)刻”。正如iPhone帶來(lái)的智能手機(jī)變革,GPT模型的出現(xiàn)又將影響未來(lái)AI領(lǐng)域的發(fā)展方向。
如今,微軟與谷歌競(jìng)爭(zhēng)的不只是當(dāng)前的市場(chǎng),還有未來(lái)AI時(shí)代的定義標(biāo)準(zhǔn)與話語(yǔ)權(quán)。
GPT-4:多模態(tài)變革
面對(duì)ChatGPT的步步緊逼,海外大廠都在追趕和阻擊微軟,以動(dòng)搖其目前在人工智能領(lǐng)域的領(lǐng)先地位。
在“對(duì)抗”微軟與Open AI方面,谷歌已經(jīng)走在前列。知情人士透露,谷歌高級(jí)管理層已經(jīng)宣布“紅色指令”,其中要求在幾個(gè)月時(shí)間里將“生成式人工智能”技術(shù)集成到谷歌的所有重要產(chǎn)品中。
去年12月,谷歌母公司Alphabet就曾發(fā)布“紅色警告”,已處于半退休狀態(tài)的創(chuàng)始人拉里·佩奇和謝爾蓋·布林重新回到公司,商討制定了人工智能后續(xù)戰(zhàn)略,并決定將聊天機(jī)器人納入搜索引擎,以應(yīng)對(duì)ChatGPT的威脅。
但從微軟和OpenAI近期舉動(dòng)來(lái)看,單純的文本交互已無(wú)法滿足其在生成式AI方向的野望,包含文本、圖像、視頻處理等在內(nèi)的多模態(tài)大模型已成為其最新的技術(shù)變革發(fā)力點(diǎn)。
在GPT4.0發(fā)布前,今年3月初,微軟發(fā)布了多模態(tài)AI大模型Kosmos-1。微軟AI技術(shù)專家Holger Kenn表示,多模態(tài)AI不僅能夠?qū)⑽谋巨D(zhuǎn)變成圖像,還可以轉(zhuǎn)變成音樂和視頻,尤其在編程領(lǐng)域,AI模型能夠更輕松的生成樣板代碼。
在微軟發(fā)布Kosmos-1后,3月7日,谷歌和柏林工業(yè)大學(xué)的團(tuán)隊(duì)推出了PaLM-E視覺語(yǔ)言模型,參數(shù)量高達(dá)5620億,約為GPT-3參數(shù)量的三倍。
據(jù)悉,PaLM-E大模型是在語(yǔ)言類模型PaLM(5400億參數(shù))和視覺類模型ViT(220億參數(shù))的基礎(chǔ)上開發(fā)的。其不僅可以理解圖像,還能理解、生成語(yǔ)言,以及將兩者結(jié)合,處理復(fù)雜的機(jī)器人指令。
谷歌與微軟的較量不僅體現(xiàn)在生成式AI的場(chǎng)景應(yīng)用層面,也聚焦于大模型底層實(shí)力。但隨著GPT4.0的發(fā)布,多模態(tài)大模型的能力得到進(jìn)一步展現(xiàn),谷歌的聲量又再度落于下風(fēng)。
今天凌晨,OpenAI發(fā)布最新GPT4.0多模態(tài)大模型,引爆全網(wǎng)討論。與前一代相比,最新的GPT4.0可以識(shí)別圖片輸入;文字輸入上限提升至2.5萬(wàn)字;回答深度和專業(yè)性、推理和風(fēng)格變化能力也顯著提高。
OpenAI稱,GPT-4在各種專業(yè)學(xué)術(shù)基準(zhǔn)上有著人類水平表現(xiàn)。在最新測(cè)試中,GPT-4通過了模擬律師考試,得分約為前10%,而GPT-3.5得分約為倒數(shù)10%。GRE、SAT數(shù)學(xué)考試成績(jī)也有大幅提升,擊敗了80%以上的人類答題水平。
GPT-4也擁有更高級(jí)的推理能力。用戶在GPT上傳了一張梗圖,問這張圖為什么會(huì)引人發(fā)笑:
GPT4.0一一給出回答:
在官方的示例中,GPT-4.0可以10秒鐘編寫網(wǎng)站代碼,可以編寫劇本、計(jì)算物理題、速讀專業(yè)論文、分析數(shù)據(jù)圖表,甚至可以解讀搞笑圖片與漫畫。
在業(yè)內(nèi)人士看來(lái),生成式AI的產(chǎn)生本質(zhì)上是一種生產(chǎn)力革命,其不僅是工具,而是直接成為生產(chǎn)要素的重要部分。以文本、音頻、圖像和視頻為處理對(duì)象的多模態(tài)大模型和生成式AI,勢(shì)必會(huì)對(duì)未來(lái)的內(nèi)容創(chuàng)作、數(shù)據(jù)處理等相關(guān)行業(yè)帶來(lái)巨大沖擊。
AI對(duì)傳統(tǒng)工作方式的革命和顛覆或許即將到來(lái),未來(lái)最核心的競(jìng)爭(zhēng)力和技能可能不再是編程,計(jì)算,甚至分析能力,而是和大模型的對(duì)話能力。
現(xiàn)在人工智能正處于一個(gè)決定性的時(shí)刻,就像90年代的互聯(lián)網(wǎng)以及iPhone帶來(lái)的手機(jī)變革,人工智能正朝著大規(guī)模采用的方向發(fā)展,ChatGPT類的大模型正推動(dòng)數(shù)據(jù)革命。
美國(guó)銀行戰(zhàn)略分析師預(yù)測(cè),人工智能正邁入“iPhone 時(shí)刻”,預(yù)估到2030年會(huì)為全球經(jīng)濟(jì)帶來(lái)15.7萬(wàn)億美元的增長(zhǎng)。
在過去,蘋果曾經(jīng)兩次定義硬件工具的交互方式:PC時(shí)代的Apple Lisa電腦,是首次采用圖形用戶界面(GUI)和鼠標(biāo)的個(gè)人電腦;到智能手機(jī)時(shí)代,iPhone定義了觸控交互。
如今,ChatGPT已經(jīng)改變了人與文字、知識(shí)的交互方式,而下一步,ChatGPT類的大模型又將影響未來(lái)AI的發(fā)展方向和人類的工作方式。
ChatGPT開放端口是創(chuàng)業(yè)機(jī)會(huì)嗎?
作為OpenAI背后的投資者,微軟的相關(guān)產(chǎn)品已經(jīng)取得了初步成果。
微軟在GPT-4發(fā)布后第一時(shí)間表示,新的Bing已經(jīng)基于GPT-4技術(shù)運(yùn)行,這是為搜索產(chǎn)品量身定制的模型產(chǎn)品。
在集成ChatGPT的Bing搜索引擎推出一個(gè)月后,微軟宣布Bing每日活躍用戶首次突破1億,每天大約有1/3的必應(yīng)用戶與BingChat進(jìn)行交互。此外,Bing在移動(dòng)設(shè)備上的使用率也有所增長(zhǎng),BingChat應(yīng)用使得每日活躍用戶增加了6倍。
此外,微軟宣布,將于3月16日召開“工作的AI未來(lái)”發(fā)布會(huì),預(yù)計(jì)將展示其類似ChatGPT的人工智能,如何在Teams、Word和Outlook等Office生產(chǎn)力套件中發(fā)揮作用。
從Bing瀏覽器到Office辦公套件,微軟正籌劃將AI賦能更多C端、甚至B端用戶。據(jù)悉,微軟計(jì)劃將ChatGPT背后的技術(shù)整合到其Power Platform平臺(tái)上,允許用戶在幾乎不需要編碼的情況下,就能開發(fā)自己的應(yīng)用程序。
“我們不想把它打造成定制產(chǎn)品,它一開始是一個(gè)定制產(chǎn)品,但我們總是想辦法把它打造成通用型產(chǎn)品,這樣任何想訓(xùn)練大型語(yǔ)言模型的人都可以利用同樣的改進(jìn),”微軟負(fù)責(zé)云計(jì)算和人工智能的執(zhí)行副總裁斯科特 格思里曾對(duì)外表示,“這真的能夠幫助我們成為使用更廣泛的人工智能云?!?/p>
對(duì)旗下平臺(tái)進(jìn)行AI賦能是互聯(lián)網(wǎng)大廠的優(yōu)勢(shì),微軟、谷歌、BAT等互聯(lián)網(wǎng)大廠具備充足的資金和技術(shù)支持,同時(shí)具備龐大的C端流量入口。對(duì)于他們來(lái)說(shuō),開發(fā)自有大模型一方面可以探索更多的場(chǎng)景和商業(yè)模式,另一方面也是為了保證自身對(duì)于用戶的競(jìng)爭(zhēng)力和行業(yè)話語(yǔ)權(quán)。
但對(duì)于資金和技術(shù)實(shí)力欠缺的企業(yè)或創(chuàng)業(yè)者來(lái)說(shuō),利用大廠開源模型,優(yōu)先采用接口模式,結(jié)合自身產(chǎn)品,將重心放在更具體的需求場(chǎng)景上,或許才是最優(yōu)的選擇。
ChatGPT之父、OpenAI創(chuàng)始人山姆·阿爾特曼在3月10日的摩根士丹利大會(huì)上透露,OpenAI將重點(diǎn)開發(fā)一個(gè)平臺(tái),向開發(fā)者開放API接口,并創(chuàng)建類似ChatGPT的應(yīng)用程序,第三方開發(fā)者被允許通過API將ChatGPT集成到他們的應(yīng)用程序和服務(wù)中。
OpenAI將推出一系列工具,讓用戶可以更好地控制這套生成式人工智能系統(tǒng),并針對(duì)通用用戶用例和具體用戶用例進(jìn)行改進(jìn)。
最新GPT-4發(fā)布后,OpenAI把ChatGPT直接升級(jí)為GPT-4最新版本。同時(shí),OpenAI開放了GPT-4的API。
ChatGPT Plus付費(fèi)訂閱用戶可以獲得具有使用上限的GPT-4訪問權(quán)限(每4小時(shí)100條消息),可以向GPT-4模型發(fā)出純文本請(qǐng)求,圖像輸入處于研究預(yù)覽階段,仍不完全公開。
用戶可以申請(qǐng)使用GPT-4的API,OpenAI會(huì)邀請(qǐng)部分開發(fā)者體驗(yàn),并逐漸擴(kuò)大邀請(qǐng)范圍。該API的定價(jià)為每輸入1000個(gè)字符(約合750個(gè)單詞),價(jià)格為0.03美元;GPT-4每生成1000個(gè)字符,價(jià)格為0.06美元。
與前一代模型相比,新推出的GPT-4 API價(jià)格提高不少。3月2日,OpenAI剛剛放出ChatGPT API,比之前的GPT-3.5模型便宜10倍,每生成1000字符,價(jià)格為0.002美元,即2.7美元就可輸出100萬(wàn)個(gè)字符。
自去年12月以來(lái),ChatGPT對(duì)于處理查詢的方式進(jìn)行了優(yōu)化,使成本降低90%,最終帶來(lái)了面向用戶的大幅降價(jià),GPT-4或許也能在將來(lái)重復(fù)這一過程,這將大大降低開發(fā)人員利用ChatGPT賦能自身產(chǎn)品的難度。
當(dāng)調(diào)用ChatGPT模型的能力不再是門檻,對(duì)于場(chǎng)景賽道的理解、商業(yè)模式的構(gòu)建能力就成為企業(yè)的核心競(jìng)爭(zhēng)優(yōu)勢(shì)。
北極光創(chuàng)投合伙人張朋在一場(chǎng)直播中向創(chuàng)業(yè)者提出建議,產(chǎn)品和服務(wù)不能僅依靠調(diào)用大模型的能力,還要實(shí)現(xiàn)差異化,比如工具層+應(yīng)用層結(jié)合在客戶的場(chǎng)景落地,讓客戶買的是場(chǎng)景的價(jià)值。
張朋認(rèn)為,從變現(xiàn)角度,最好從應(yīng)用層下手,“以Pass為例的中間層的很難盈利,大多客戶難以從通用模型框架自我研究出解決方案,還需要提供細(xì)化到應(yīng)用的服務(wù),B端客戶需要的不是工具,是解決方案?!?/p>
千萬(wàn)美元入場(chǎng)券
美團(tuán)聯(lián)合創(chuàng)始人王慧文對(duì)于AI的態(tài)度很明確,“關(guān)于人工智能,到現(xiàn)在為止,我只有一個(gè)判斷,必須參與?!?/p>
今年2月,王慧文在朋友圈發(fā)布“組隊(duì)帖”,要帶資5000萬(wàn)美元進(jìn)入AI賽道,設(shè)立光年之外科技有限公司,資金占股25%,其余75%的股份用于邀請(qǐng)頂級(jí)研發(fā)人員,打造中國(guó)Open AI。
據(jù)王慧文透露,光年之外估值達(dá)2億美元,下輪融資已有頂級(jí)VC認(rèn)購(gòu)2.3億美元。3月8日,美團(tuán)創(chuàng)始人王興在朋友圈回應(yīng)王慧文的宣言,宣布將以個(gè)人身份參與王慧文的創(chuàng)業(yè)公司“光年之外”的A輪投資,并出任董事。
在“雙王”三度攜手、進(jìn)場(chǎng)AI賽道的同時(shí),眾多互聯(lián)網(wǎng)大佬紛紛開始招兵買馬,爭(zhēng)相搶奪人才:原京東集團(tuán)高級(jí)副總裁、集團(tuán)技術(shù)委員會(huì)主席周伯文同樣在朋友圈發(fā)布招募研發(fā)、產(chǎn)品及算法人員,原搜狗CEO王小川對(duì)媒體回應(yīng)正快速籌備AI大模型,快手前AI核心人物李巖也投身“大模型”賽道創(chuàng)業(yè),成立AI公司元石科技,進(jìn)行多模態(tài)大模型的研發(fā)。
百度、騰訊、阿里、字節(jié)跳動(dòng)等互聯(lián)網(wǎng)大廠也在“爭(zhēng)分奪秒”開發(fā)自有大模型,百度宣布將于3月16日推出類似產(chǎn)品“文心一言”,騰訊針對(duì)類ChatGPT產(chǎn)品已成立“混元助手”項(xiàng)目組,阿里巴巴則表示其聊天機(jī)器人正處于研發(fā)內(nèi)測(cè)階段。
在OpenAI發(fā)布GPT4.0后,即將發(fā)布文心一言的百度壓力再度增加。ChatGPT的背后離不開大模型、大數(shù)據(jù)、大算力,大廠想要追趕Open AI,也需要面臨多方面的挑戰(zhàn)。
在算力要求方面,市場(chǎng)調(diào)查機(jī)構(gòu)TrendForce集邦咨詢公布的最新報(bào)告指出,如果以英偉達(dá)A100顯卡的處理能力計(jì)算,運(yùn)行ChatGPT將需要使用到3萬(wàn)塊英偉達(dá)GPU,目前英偉達(dá)A100顯卡的售價(jià)在1萬(wàn)-1.5萬(wàn)美元之間,3萬(wàn)塊售價(jià)超過3億美金。
除算力要求高外,需要大量的數(shù)據(jù)集得到ChatGPT訓(xùn)練成本非常高昂。其使用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),訓(xùn)練數(shù)據(jù)來(lái)自包括維基百科,以及真實(shí)對(duì)話在內(nèi)的龐大語(yǔ)料庫(kù),有著多達(dá)1750億個(gè)模型參數(shù)。
根據(jù)中信研報(bào)測(cè)算,ChatGPT生成一條信息的成本在1.3美分左右,是目前傳統(tǒng)搜索引擎的3-4倍,成本問題中短期內(nèi)或只能等待硬件成本的繼續(xù)下降。
盡管目前技術(shù)上還在追趕Open AI,但在這條新興賽道上,BAT并不想缺席。
如今,現(xiàn)在生成式AI的商業(yè)模式還有待探索,但人的想象力是無(wú)窮的。ChatGPT可以寫詩(shī),可以優(yōu)化搜索,可以回復(fù)郵件,可以整理數(shù)據(jù),也可以編寫代碼……
ChatGPT只是更偉大事物的開始,英偉達(dá)CEO黃仁勛表示,“你知道你今天做不到,但是當(dāng)然,它總有一天會(huì)做到的”。
無(wú)論現(xiàn)在的微軟、谷歌、百度等旗下的聊天機(jī)器人表現(xiàn)如何,這也只是新時(shí)代AI技術(shù)迭代的最開始,未來(lái)的AI產(chǎn)業(yè)勢(shì)必會(huì)更精彩。
運(yùn)營(yíng)|陳小妍
策劃|晨曦 丁玨汭(澎湃新聞高級(jí)編輯)