界面新聞記者 | 崔鵬
界面新聞編輯 | 文姝琪
7月7日消息,在剛閉幕的2024世界人工智能大會(WAIC)上,騰訊公布了混元大模型(以下簡稱為“混元”)的最新進展,相關負責人還談到了大模型技術趨勢、價格戰(zhàn)以及應用落地等多個話題。
騰訊集團副總裁蔣杰在會上公開表示,騰訊將人工智能視為公司長期戰(zhàn)略,目前騰訊圍繞混元組建了一套產(chǎn)品矩陣,包括底層基礎設施、自研大模型、模型開發(fā)平臺以及智能體開發(fā)平臺。
根據(jù)騰訊官方提供的信息,混元大模型在國內(nèi)率先采用MoE架構,參數(shù)量已達到萬億,tokens數(shù)量超過7萬億,位居國內(nèi)大模型第一梯隊。
在本屆WAIC上,推動人工智能技術落地的話題備受關注。大模型行業(yè)經(jīng)過一年多發(fā)展,技術層面取得諸多突破,產(chǎn)業(yè)重心正在向應用落地轉移。
騰訊云副總裁、優(yōu)圖實驗室負責人吳運聲在現(xiàn)場采訪中對界面新聞等媒體表示,技術一定要在產(chǎn)業(yè)落地并產(chǎn)生價值,這才是AI發(fā)展的方向。
但要讓AI落地,“只靠(優(yōu)圖)幾百號人肯定不行”,必須降低門檻,吸引產(chǎn)業(yè)鏈上的更多企業(yè)進入。
在大會上,騰訊還聯(lián)合上海交大等研究機構推出了對大模型行業(yè)十大趨勢的報告,預測具身智能和人機對齊等方向將成為未來幾年大模型行業(yè)的熱門領域,人工智能也正在成為人類的“機器外腦”。
不愿意看到價格戰(zhàn),更關注能力提升
雖然外界有很多大模型落地進展緩慢的觀點,但吳運聲并不認同。
“對于大模型好像沒怎么落地的看法,我覺得并不是這樣”,他認為最主要的原因是目前大模型的需求實在太多。
比如面臨1萬個大模型的需求場景或者問題,如果其中有100個已經(jīng)落地,“你覺得這是多還是不多呢?”
今天的大模型技術正在往多模態(tài)、零樣本學習、3D和視頻生成等方向快速演進,同時大模型產(chǎn)品的落地門檻也在逐步降低。
為了推動AI技術落地應用,今年5月騰訊云一口氣發(fā)布大模型知識引擎、圖像創(chuàng)作引擎和視頻創(chuàng)作引擎三款PaaS工具,將AI能力和RAG進行封裝,開發(fā)者在工具上進行簡單調(diào)用甚至點選就能搭建應用產(chǎn)品。
也是在同一個月,字節(jié)、百度、阿里和騰訊等多家頭部大模型企業(yè)開始打起了價格戰(zhàn),先后降低自家模型產(chǎn)品的使用費。
“站在從業(yè)者的角度,我們不太愿意看見價格戰(zhàn)發(fā)生,或者說我不太關注”,吳運聲告訴界面新聞,騰訊更關注能力提升,重點解決模型落地過程中的問題。
“但是作為一個商業(yè)組織,看到市場上的降價動作,我們肯定也會有所響應”,吳運聲表示。
實際上,價格也確實是阻礙大模型廣泛落地的重要因素之一,在給大模型降價的同時,騰訊也對旗下模型產(chǎn)品進行了區(qū)分,根據(jù)企業(yè)的實際需求提供不同尺寸的模型。
因為模型的大小不同,提供的能力也有所區(qū)別,推理成本更不一樣。
目前混元大模型提供混元-pro、混元-standard和混元-lite三個版本,吳運聲透露稱混元后續(xù)還將上線vision版本。
走向“機器外腦”時代
在WAIC大會現(xiàn)場,上海交通大學、騰訊研究院和騰訊云智能等單位還發(fā)布了2024年AI大模型的十大趨勢報告。
這十大趨勢包括目前熱門的具身智能、算力底座、情緒智能和開源共享等技術,也包括推理分析、智能制造、游戲環(huán)境、移動革新、人機對齊和創(chuàng)意生成等新趨勢。
報告認為,海量GPU和新一代大模型組合后,使人工智能在推理分析、創(chuàng)意生成和情緒智能三個方向上取得突破進展,意味著AI將擁有類人的交互能力,新一代AI正在成為人類的“機器外腦”。
此外,在GTP-4o出現(xiàn)后,行業(yè)正在探索多模態(tài)甚至端到端的技術演進。這也給數(shù)字人這個當下熱門的行業(yè)帶來更多新機會。
吳運聲解釋稱,現(xiàn)在的數(shù)字人產(chǎn)品,即便有知識引擎和大模型支持,也不是完全的端到端產(chǎn)品,而是分步驟的:首先是語音或者視頻輸入進去,進行處理之后再吐出來反饋,這個人機交互有一進一出的過程。
但在真人交流過程中,隨時會有一方打斷另一方的情況出現(xiàn)。大模型產(chǎn)品想要達到這個效果,需要更好的技術和工程化處理手段。
而今年火爆的另一個領域是智能體(AI Agent),對于它未來的技術趨勢,吳運聲認為它會回到大語言模型的初衷,也就是用樸素的自然語言幫用戶解決問題。因為大語言模型與傳統(tǒng)AI的很大區(qū)別在于,用戶對模型的輸入是一種自然表達的方式。
比如對于“我要做一個俄羅斯方塊游戲”這種樸素的需求描述,傳統(tǒng)的工程做法要經(jīng)過很多步驟:第一步做產(chǎn)品分析,第二步寫產(chǎn)品需求說明書,第三步做總體架構設計,第四步做詳細設計,第五步做代碼,第六步做測試等。這是一種受約束的解決方式。
“但能不能通過大模型直接做出來”,吳運聲表示,希望未來可以形成一個能解決廣泛問題的技術路線,用自然語言的方式來直接解決問題。