日韩免费1000部拍拍拍,欧美一极XXXXX

界面新聞?dòng)浾?| 崔鵬
界面新聞編輯 | 宋佳楠

11月5日，騰訊混元宣布開源兩款最新的大模型產(chǎn)品，分別是MoE架構(gòu)的大語言模型“Hunyuan-Large（混元Large）”，以及3D生成大模型“Hunyuan3D-1.0”，兩者都支持企業(yè)開發(fā)者精調(diào)和部署，同時(shí)上線HuggingFace和Github等技術(shù)社區(qū)，供開發(fā)者免費(fèi)商用。

在騰訊口中，混元Large是目前開源領(lǐng)域參數(shù)規(guī)模最大、效果最好的MoE模型，而混元3D生成大模型則是業(yè)界首個(gè)同時(shí)支持文字、圖像生成3D的開源大模型，這兩個(gè)模型均為騰訊自研，在架構(gòu)、算法、數(shù)據(jù)等方面有所創(chuàng)新。

談及外界關(guān)注的開閉源之爭，騰訊機(jī)器學(xué)習(xí)平臺(tái)總監(jiān)康戰(zhàn)輝表示，騰訊不急于為了開源而開源，本次開源的模型都是自己內(nèi)部業(yè)務(wù)已經(jīng)在用的模型。

但騰訊方面也強(qiáng)調(diào)，未來將繼續(xù)加大開源力度，堅(jiān)持自主可控，同時(shí)還將開源部分大模型工程框架（AnglePTM和AngleHCF），試圖讓行業(yè)開發(fā)者和企業(yè)能以更低成本使用這些開源大模型。

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

據(jù)騰訊介紹，混元Large模型總參數(shù)量為389B，激活參數(shù)量52B。它采用的MoE（Mixture of Experts）混合專家模型是目前國內(nèi)外主流的大模型結(jié)構(gòu)。

今年年初，混元大模型在國內(nèi)率先采用MoE架構(gòu)，性能比上一代Dense模型提升50%。隨后騰訊連續(xù)推出基于MoE架構(gòu)的多模態(tài)理解大模型以及基礎(chǔ)模型“混元turbo”。

在模型訓(xùn)練層面，騰訊混元Large構(gòu)建了覆蓋數(shù)十個(gè)類目的中英文合成數(shù)據(jù)。合成數(shù)據(jù)也是今年行業(yè)比較流行的概念，主要解決自然數(shù)據(jù)越來越不夠用的問題。

康戰(zhàn)輝表示，全球目前擁有的自然數(shù)據(jù)可能會(huì)在2026年被全部用完，在未來的大模型訓(xùn)練過程中，合成數(shù)據(jù)的占比會(huì)越來越高，所以高質(zhì)量的合成數(shù)據(jù)非常關(guān)鍵，騰訊混元在這方面有一定優(yōu)勢。

混元Large模型想要對外展現(xiàn)的另一個(gè)重點(diǎn)是它的長文能力。其基于公開數(shù)據(jù)構(gòu)建了一套覆蓋長文閱讀理解、多文檔摘要總結(jié)和長文邏輯推理領(lǐng)域的數(shù)據(jù)集企鵝卷軸（PenguinScrolls），用來解決長文領(lǐng)域測評數(shù)據(jù)集缺乏、方法不夠客觀等問題。這套企鵝卷軸評測集也將同步對外開放。

目前，混元Large模型的長文能力已經(jīng)在“騰訊元寶”上應(yīng)用，最大支持256K上下文，相當(dāng)于一本《三國演義》的內(nèi)容長度。

本次騰訊推出的另一款開源模型——Hunyuan3D-1.0則瞄準(zhǔn)現(xiàn)有的3D生成模型在生成速度和泛化能力上存在不足的問題，強(qiáng)調(diào)泛化能力和可控性，能重建大到建筑、小到工具、花草的各類尺度物體，幫助開發(fā)者自動(dòng)化生產(chǎn)3D資產(chǎn)。

騰訊混元3D生成大模型的首批開源模型包含輕量版和標(biāo)準(zhǔn)版，其中輕量版據(jù)稱10秒就能生成高質(zhì)量3D資產(chǎn)，包含模型權(quán)重、推理代碼、模型算法等完整模型，可供開發(fā)者、研究者等各類用戶免費(fèi)使用。

目前，3D生成相關(guān)技術(shù)已經(jīng)在騰訊內(nèi)部大量業(yè)務(wù)中應(yīng)用，包括UGC 3D創(chuàng)作、商品素材合成、游戲3D資產(chǎn)生成等場景。

持續(xù)不斷的開閉源之爭

今年4月份，百度創(chuàng)始人李彥宏在公開場合表示，開源模型會(huì)越來越落后。沒多久，阿里云首席技術(shù)官周靖人隔空回應(yīng)稱，開源對全球技術(shù)和生態(tài)的貢獻(xiàn)毋庸置疑，已經(jīng)沒有再討論的必要。

這番針鋒相對的言論引發(fā)了國內(nèi)大模型行業(yè)關(guān)于開源和閉源孰優(yōu)孰劣的激烈討論。

從國內(nèi)現(xiàn)狀來看，阿里和騰訊等云大廠更傾向于開源模型路線，而月之暗面和智譜AI等創(chuàng)業(yè)公司選擇的是閉源路線。

開閉源之爭，看似是技術(shù)路線存在分歧，背后更重要的是對商業(yè)價(jià)值的考量。

對于頭部大廠而言，大模型的訓(xùn)練成本投入在可接受范圍之內(nèi)，商業(yè)模式的重心放在云服務(wù)層面，希望通過拓展大模型客戶的方式，來提升自家云服務(wù)的訂單量和市場份額。創(chuàng)業(yè)公司絕大部分研發(fā)投入來自于外部融資，自然對大模型本身的盈利能力有較高的需求。

閉源大模型目前主要依靠API（應(yīng)用程序編程接口）調(diào)用來向開發(fā)者收費(fèi)，在C端（消費(fèi)級業(yè)務(wù)）則主要依靠會(huì)員費(fèi)來變現(xiàn)，Kimi和豆包都是如此。

雖然業(yè)內(nèi)關(guān)于開閉源的討論持續(xù)不斷，但從目前市面上的產(chǎn)品表現(xiàn)來看，李彥宏當(dāng)初預(yù)言的那句“開源模型會(huì)越來越落后”尚未成真。康戰(zhàn)輝更是宣稱，Hunyuan-Large大模型要比目前業(yè)內(nèi)所有同行的開源模型效果更好。

根據(jù)騰訊方面給出的公開測評結(jié)果，混元Large在CMMLU、MMLU、CEval、MATH等多學(xué)科綜合評測集以及中英文NLP任務(wù)、代碼和數(shù)學(xué)等維度，都超過了Llama3.1、Mixtral等主流開源大模型。

康戰(zhàn)輝還表示，騰訊的開源大模型不但要在中文領(lǐng)域領(lǐng)先，希望在英文領(lǐng)域也能保持領(lǐng)先，未來還將發(fā)布更多開源模型產(chǎn)品。

騰訊是否能實(shí)現(xiàn)上述目標(biāo)仍是一個(gè)問號(hào)，但可以預(yù)見的是，在未來很長一段時(shí)間內(nèi)，國產(chǎn)大模型行業(yè)都將處于開源和閉源共存的模式，彼此之間的競爭只會(huì)越來越激烈。

界面新聞?dòng)浾?| 崔鵬
界面新聞編輯 | 宋佳楠

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

目前，混元Large模型的長文能力已經(jīng)在“騰訊元寶”上應(yīng)用，最大支持256K上下文，相當(dāng)于一本《三國演義》的內(nèi)容長度。

持續(xù)不斷的開閉源之爭

這番針鋒相對的言論引發(fā)了國內(nèi)大模型行業(yè)關(guān)于開源和閉源孰優(yōu)孰劣的激烈討論。

從國內(nèi)現(xiàn)狀來看，阿里和騰訊等云大廠更傾向于開源模型路線，而月之暗面和智譜AI等創(chuàng)業(yè)公司選擇的是閉源路線。

開閉源之爭，看似是技術(shù)路線存在分歧，背后更重要的是對商業(yè)價(jià)值的考量。

歷史搜索全部刪除

熱門搜索

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

持續(xù)不斷的開閉源之爭

評論

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

持續(xù)不斷的開閉源之爭

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

持續(xù)不斷的開閉源之爭

評論

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

持續(xù)不斷的開閉源之爭

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)

騰訊再開源兩款最新大模型，開閉源之爭又起波瀾

堅(jiān)持MoE架構(gòu)，押寶合成數(shù)據(jù)