文|另鏡 劉雨婷 謝涵
編輯|陳彥旭
科技技術(shù)在改變?nèi)伺c工具的交互方式。PC時代的Apple Lisa電腦,是首次采用圖形用戶界面和鼠標(biāo)的個人電腦;到智能手機(jī)時代,iPhone定義了觸控交互。下一步,ChatGPT類的多模態(tài)大模型又將影響未來AI的發(fā)展方向和人類的工作方式。
未來科技產(chǎn)業(yè)注定是變革和顛覆的一年,新時代屬于造夢者、勇闖者,甚至是孤獨者。在外界看來,新的科技也許在不久的將來會打破現(xiàn)有的商業(yè)格局。大浪淘沙,敢為者先。
新浪潮下,另鏡推出「Tech潮向」專題系列報道,洞察當(dāng)下前沿科技新變革和發(fā)展趨勢,報道前沿科技企業(yè)新戰(zhàn)略、新思維,提供更多具有前瞻思考的價值信息。此篇為該系列報道第五篇,聚焦新一輪新科技ChatGPT開啟。
4月11日上午,在2023年阿里云峰會上,阿里董事會主席兼CEO、阿里云智能集團(tuán)CEO張勇正式宣布,阿里所有產(chǎn)品未來將接入“通義千問”大模型,進(jìn)行全面升級。
在他看來,智能化時代,大家都站在同一條起跑線上。面向AI大模型時代,所有的應(yīng)用、軟件以及服務(wù)都值得“重做一遍”。
阿里發(fā)布的通義千問是達(dá)摩院自主研發(fā)的超大規(guī)模語言模型,可以回答問題、創(chuàng)作文字,以及表達(dá)觀點、撰寫代碼。
在登陸“通義千問”后,其主頁頁面主要突出了四個功能:職場助理、撰寫短文、寫封郵件和電影腳本。另鏡拿到“通義千問”首批邀測資格,并進(jìn)行測試。
從OpenAI發(fā)布GPT-4,到百度發(fā)布文心一言、微軟將GPT-4接入自己全套辦公軟件Microsoft 365 Copilot、谷歌開放 Bard,再到最近一周阿里、華為、商湯紛紛發(fā)布AI大模型、更新最新進(jìn)展,互聯(lián)網(wǎng)大廠都在“爭分奪秒”進(jìn)軍未來。
在前一日,搜狗創(chuàng)始人王小川宣布成立人工智能公司百川智能,旨在打造中國版的OpenAI,研發(fā)并提供通用AI服務(wù)、基礎(chǔ)大模型及上層應(yīng)用。
作為在ChatGPT背后提供最底層GPU支持的硬件銷售公司,英偉達(dá)今年股價隨著AI行情一路水漲船高,開年至今,股價已大漲超90%。
英偉達(dá)CEO黃仁勛在今年3月的GTC開發(fā)者大會上發(fā)表了主題演講,“我們正處于AI的iPhone時刻,”黃仁勛興奮地表示,“初創(chuàng)公司正在競相打造顛覆性產(chǎn)品和商業(yè)模式,科技巨頭也在尋求突破。”
面向AI大模型時代,各行各業(yè)將迎來顛覆性的改變。在ChatGPT引領(lǐng)的AI賽道上,科技公司將面對的是全方位競爭:從技術(shù)研究、底層算力、AI算法、數(shù)據(jù)處理訓(xùn)練,最終推進(jìn)至大模型迭代的速度與質(zhì)量。
阿里全線產(chǎn)品接入大模型
4月11日,2023阿里云峰會現(xiàn)場,阿里詳細(xì)展現(xiàn)了通義千問大語言模型(LLM),該模型支持多輪交互及復(fù)雜指令理解、多模態(tài)融合、外部增強 API 等功能;同時,阿里云推出企業(yè)專屬大模型產(chǎn)品,國內(nèi)云大廠大模型之戰(zhàn)正式打響。
從2019年開始,阿里就在嘗試訓(xùn)練各式大模型,StructBERT、M6,再到PLUG、Composer等等。去年9月2日,達(dá)摩院副院長周靖人就在“2022世界人工智能大會”上發(fā)布阿里巴巴最新“通義”大模型,并宣布相關(guān)核心模型向全球開發(fā)者開源開放。
近期發(fā)布的通義千問是基于“通義”這一系列,展現(xiàn)其“千問”的對話形態(tài)。
阿里董事會主席兼首席執(zhí)行官、阿里云智能集團(tuán)CEO張勇表示,目前阿里云已形成了全棧的技術(shù)服務(wù),搭建了模型即服務(wù)(MaaS)、平臺即服務(wù)(PaaS)、基礎(chǔ)設(shè)施即服務(wù)(IaaS)三層架構(gòu)。
同時他透露,阿里內(nèi)部已明確提出,未來天貓、淘寶、盒馬、飛豬等阿里所有產(chǎn)品都要接入阿里大模型進(jìn)行全面升級。
據(jù)張勇介紹,阿里云的模型即服務(wù)包括API服務(wù)、基礎(chǔ)大模型/通義大模型、企業(yè)專屬大模型、魔搭社區(qū),平臺即服務(wù)包括模型開發(fā)、模型推理與部署、模型訓(xùn)練、大數(shù)據(jù)平臺等;基礎(chǔ)設(shè)施即服務(wù)包括靈駿智能計算集群、彈性計算ECS集群等。通過這三層架構(gòu),能夠讓阿里云全身心擁抱智能化時代。
張勇強調(diào),不論是現(xiàn)在數(shù)智化時代還是未來的智能化時代,阿里云追求的基本目標(biāo)和價值,總結(jié)概括就是兩句話:讓算力更普惠、讓AI更普及。在算力普惠方面,阿里云已經(jīng)覆蓋1000萬開發(fā)者,且跟十年前比,目前的單位算力成本降了80%、存儲成本降了90%。
在AI普及方面,阿里云致力于做基礎(chǔ)大模型,核心是支撐各行業(yè)開發(fā)者,讓屬于各行業(yè)、各企業(yè)的模型能夠做得更好、門檻更低,這不僅包括阿里的通義千問,還包括阿里和其他企業(yè)及高校合作的大模型。
商湯發(fā)布B2B大模型
4月10日,商湯科技發(fā)布自研大模型體系“日日新SenseNova”,以及自研的中文語言大模型應(yīng)用平臺“商量”(SenseChat),參數(shù)量達(dá)千億。日日新大模型并未對外開放測試,主要對to B端的政企客戶開放。
在商湯技術(shù)交流日活動上,商湯科技董事長兼首席執(zhí)行官徐立介紹,“商湯日日新大模型”包括自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能,并在現(xiàn)場展示了語言大模型應(yīng)用平臺“商量”的多輪對話和超長文本的理解能力,以及在編程、健康咨詢等領(lǐng)域應(yīng)用。
商湯科技聯(lián)合創(chuàng)始人、首席科學(xué)家王曉剛表示,目前已經(jīng)有一些合作伙伴和客戶開始內(nèi)測其產(chǎn)品。
未來,商湯版的GPT主要面向企業(yè)端(B2B)業(yè)務(wù)?!叭杖招耂enseNova”為政企客戶提供多種API接口和服務(wù),包括圖片生成,自然語言生成,視覺感知通用任務(wù)與標(biāo)注服務(wù)??蛻艨筛鶕?jù)實際應(yīng)用需求,調(diào)用“日日新SenseNova”大模型的各項AI技術(shù)能力,低門檻、低成本、高效率地實現(xiàn)各類AI應(yīng)用。
例如在智能駕駛領(lǐng)域,基于視覺大模型,商湯實現(xiàn)了可識別3000類物體的BEV環(huán)視通用感知算法的實車量產(chǎn),也構(gòu)建了感知決策一體化的自動駕駛多模態(tài)模型,帶來更強的環(huán)境、行為、動機(jī)解碼能力。
商湯還展示了“日日新SenseNova”的各種AI文生圖創(chuàng)作、2D/3D數(shù)字人生成、大場景/小物體生成等一系列生成式AI模型及應(yīng)用:
——“秒畫SenseMirage”文生圖創(chuàng)作平臺,展現(xiàn)了光影真實、細(xì)節(jié)豐富、風(fēng)格多變的強大的文生圖能力,可支持6K高清圖的生成;客戶還可根據(jù)自身需求訓(xùn)練生成模型。
——“如影SenseAvatar”AI數(shù)字人視頻生成平臺,僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型準(zhǔn)確、多語種精通的數(shù)字人分身。
——“瓊宇SenseSpace”和“格物SenseThings”3D內(nèi)容生成平臺,可以高效低成本生成大規(guī)模三維場景和精細(xì)化的物件,為元宇宙、虛實融合應(yīng)用打開新的想象空間。
AI面臨安全危機(jī)
隨著ChatGPT的廣泛應(yīng)用,圍繞人工智能語言模型的技術(shù)迭代一直在持續(xù)發(fā)展。
近期,來自加州大學(xué)圣迭戈分校、中山大學(xué)和微軟亞研的研究者提出了“白澤(Baize)模型”,讓ChatGPT通過自我對話生成多輪對話的“數(shù)據(jù)集”,最終用于訓(xùn)練模型;
Meta發(fā)布史上首個圖像分割基礎(chǔ)模型SAM,能從照片和視頻中實現(xiàn)“一鍵摳圖”,即能夠根據(jù)文本指令即分離出想要的圖像內(nèi)容;
谷歌計劃計劃在搜索引擎中添加對話式人工智能功能,以應(yīng)對來自ChatGPT等聊天機(jī)器人的競爭以及更廣泛的商業(yè)壓力;
AI繪畫神器MidJourney推出圖生文功能,可以讓用戶上傳任意圖片,MidJourney通過分析圖片內(nèi)容生成4條適合的Prompt,用戶可根據(jù)這些Promp生成更多圖片;
谷歌助手團(tuán)隊和哥倫比亞大學(xué)教授合作推出PRESTO 多語言大數(shù)據(jù)集,該數(shù)據(jù)集涉及6種語言,涵蓋了用戶與虛擬助理的日常對話中的各種真實痛點,可以有效解決一些虛擬助理對話的難題。
在AI技術(shù)如火如荼的發(fā)展時,ChatGPT卻因隱私保護(hù)問題遭遇抵制。
今年3月29日,埃隆·馬斯克(Elon Musk)等千名業(yè)界和學(xué)界人士聯(lián)署公開信,呼吁所有AI實驗室立即暫停訓(xùn)練比GPT-4更強大的AI系統(tǒng),暫停至少6個月,以便制定和實施安全協(xié)議。
美國參議院Lindsey Graham接受媒體采訪時表示,ChatGPT被濫用的可能性很高,需要指導(dǎo)和監(jiān)督。就在3月31日,意大利個人數(shù)據(jù)保護(hù)局宣布禁止使用聊天機(jī)器人ChatGPT,并開始立案調(diào)查,德國、加拿大相關(guān)機(jī)構(gòu)也紛紛表示對于數(shù)據(jù)隱私的擔(dān)憂。
據(jù)媒體最新報道,拜登政府已開始研究是否需要對ChatGPT等人工智能工具進(jìn)行審查。
面對外界對于AI數(shù)據(jù)安全的質(zhì)疑,4月12日,OpenAI、微軟、谷歌、蘋果、英偉達(dá)、Stability AI、Hugging Face、Anthropic等公司的高管與政策代表將出席該會議,討論如何負(fù)責(zé)任地開發(fā)AI、分享最好的實踐案例,并商討相關(guān)的公共政策框架和標(biāo)準(zhǔn)。
寫在最后
在OpenAI、微軟、谷歌開啟AI軍備賽后,百度、阿里、華為、商湯大模型已顯露雛形,更多參與者還在路上。
4月17日,昆侖萬維將發(fā)布“天工”大模型,并啟動邀請測試。
搜狗創(chuàng)始人、前CEO王小川也在4月10日宣布,與COO茹立云聯(lián)合成立公司“百川智能”,開啟AI大模型領(lǐng)域創(chuàng)業(yè)。
根據(jù)公開信,百川智能早前已獲得5000萬美元啟動資金,初步搭建起包括搜狗、百度等技術(shù)骨干在內(nèi)的團(tuán)隊。王小川表示,面向機(jī)構(gòu)的融資會在近期啟動,該公司將會在年底發(fā)布面向ToB(企業(yè)端)領(lǐng)域的大模型產(chǎn)品。
“追上ChatGPT水平,我覺得今年內(nèi)可能就能夠?qū)崿F(xiàn),但對于GPT-4或者GPT-5,我認(rèn)為可能需要3年左右的時間,應(yīng)該不會低于兩年?!蓖跣〈ū硎尽?/p>
雖然承受著監(jiān)管壓力與輿論質(zhì)疑,但人工智能已經(jīng)成為當(dāng)今社會的一個重要趨勢,并已經(jīng)開始廣泛應(yīng)用于各個行業(yè),這已是可預(yù)見的未來。