中出人妻中文字幕无码,日韩毛片在线免费观看,欧美日韩一区二区精品国产

文|真探Alphaseeker 吳鴻鍵

“最近大模型的涌現(xiàn)，比大模型能力的「涌現(xiàn)」都要快?！?/p>

「涌現(xiàn)」是一個專業(yè)概念，放在大模型的語境里，指的是模型在突破某個規(guī)模時，出現(xiàn)了意想不到的能力。這話雖然是調(diào)侃，但也高度概括了行業(yè)現(xiàn)狀。

ChatGPT在全球掀起熱潮以來，國內(nèi)已有多家公司發(fā)布或?qū)l(fā)布自己的大模型，這些公司中既有阿里巴巴、百度、京東、華為等互聯(lián)網(wǎng)或科技大廠，也有以商湯為代表的AI公司，以及備受矚目的初創(chuàng)企業(yè)（例如王慧文的光年之外，王小川的百川智能）。

如果再把科研院所算上，據(jù)民生證券的統(tǒng)計，國內(nèi)目前已有超30個大模型亮相。行業(yè)儼然有大模型“軍備競賽”的意思。

“混戰(zhàn)”本身說明了不少事情，比如各家都已認識到大模型的價值，試圖通過大模型升級已有業(yè)務和打開新增長空間。即使人們普遍認為大模型門檻高，但“百花齊放”也折射出業(yè)界認為大模型的發(fā)展尚處早期，且并不是只有極少數(shù)大玩家才能參與的游戲。

機會看上去很多，但撥開冗雜的信息，我們需要判斷，大模型的“涌現(xiàn)”是不是曇花一現(xiàn)？以下四點值得關注。

產(chǎn)業(yè)融合成共識

相比ChatGPT在用戶端的熱潮，國內(nèi)廠商更愿意談大模型和產(chǎn)業(yè)的結(jié)合。“客戶”是高頻詞，“接入我們的大模型”是共同目標。

以阿里巴巴的通義大模型為例，近期，阿里云官宣自研大模型“通義千問”并面向企業(yè)開始邀請測試，在阿里云峰會上，包括張勇在內(nèi)的阿里云高管頻頻強調(diào)大模型能為各行業(yè)企業(yè)帶來的價值。據(jù)阿里云智能CTO周靖人介紹，未來企業(yè)在阿里云上既可以調(diào)用通義千問的全部能力，也可以結(jié)合企業(yè)自己的行業(yè)知識和應用場景，訓練自己的企業(yè)大模型。

早些時候發(fā)布“文心一言”的百度，也是將B端“生態(tài)圈”作為宣傳和業(yè)務重點。華為云盤古大模型提出了“AI for Industries”理念。推出大模型“日日新”體系的商湯，更是只面向政企客戶開放API。

大環(huán)境對于生成式人工智能服務相對謹慎的態(tài)度、企業(yè)各自的資源和能力稟賦、以及在C端體驗上和ChatGPT的差距，都可能是造成差異的原因。上述案例的共性是，大模型對于各家企業(yè)并非一個“另起爐灶”式的新業(yè)務，而是對已有業(yè)務方向的延伸和突破，對大模型的理解依然要放在公司已有的業(yè)務發(fā)展框架里來看。

依然以阿里云為例，云計算公司容易陷入“低毛利集成商”困境，難以在標準化和定制化之間找到平衡。預訓練大模型帶來了新的可能——在阿里云方面的設想中，企業(yè)只需將數(shù)據(jù)放在專屬數(shù)據(jù)空間，用于大模型自動學習，然后就能生成企業(yè)專屬的大模型。相比原本“什么都要從頭做”的業(yè)務模式，大模型提供了效率更高的選擇。

揚長避短，各秀肌肉

目前，國內(nèi)的大模型廠商并不諱言和OpenAI、ChatGPT的差距，只是各家對于“差距有多大”有一些不同的判斷。

相比OpenAI，國內(nèi)互聯(lián)網(wǎng)大廠有成熟的業(yè)務矩陣，多元的能力架構，以及在多年實戰(zhàn)中鍛煉出來的差異化能力，因此大公司們愿意強調(diào)的能力和方向也有所不同。

例如張勇在云峰會上表示，阿里巴巴所有產(chǎn)品未來都將接入“通義千問”大模型。此舉意在利用大模型升級甚至改造現(xiàn)有業(yè)務體系，阿里云方面將這種融合視為未來發(fā)展的關鍵，稱“阿里巴巴和所有企業(yè)都在同一起跑線上”。

除了拿自家業(yè)務當試煉場，阿里云還在峰會上提及其他優(yōu)勢，比如指出大模型的研發(fā)不是簡單的“堆疊算力”問題，強調(diào)阿里云在低碳低能耗方面的能力積累。這也是阿里云提出為企業(yè)打造專屬大模型的重要原因。

百度的優(yōu)勢來自其在中文搜索引擎的領導地位，因此公司在發(fā)布文心一言時，著重強調(diào)了其“更懂中文”的特性。商湯則更多強調(diào)其在參數(shù)和算力上的優(yōu)勢?！叭杖招隆斌w系包含自然語言處理模型“商量”（SenseChat）、文生圖模型“秒畫”和數(shù)字人視頻生成平臺“如影”（SenseAvatar），其中“商量”參數(shù)約1800億。商湯方面還強調(diào)，SenseCore大裝置已完成2.7萬塊GPU的部署，并實現(xiàn)了5.0 exaFLOPS的算力輸出能力，最高可支持萬億參數(shù)超大模型的訓練。

除了應用，在和大模型相關的芯片和框架方面，國內(nèi)大公司也有現(xiàn)成的積累。百度有昆侖芯、深度學習框架飛槳，華為有昇騰310和910芯片，ModelArts平臺。這些同樣是大廠在發(fā)展大模型時著重利用的對象。

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

大模型“混戰(zhàn)”還反映了一個信息：至少從表面上看，大模型不再稀缺。

民生證券在研報中指出，因為有開源基礎以及大公司自本身的算力儲備和資金實力，“單純發(fā)布一個大模型的門檻沒有市場想象中的那么高”。

“有大模型”不難，難的是“有一個能持續(xù)迭代，性能不斷提升的優(yōu)質(zhì)大模型”。一些觀點也提到，決定大模型發(fā)展的關鍵要素是高質(zhì)量數(shù)據(jù)，尤其是在大模型“百花齊放”的背景下，數(shù)據(jù)是“勝負手”。

數(shù)據(jù)、算法、算力是AI能力三要素。

高質(zhì)量的數(shù)據(jù)是助力AI訓練與調(diào)優(yōu)的關鍵，在和數(shù)據(jù)相關的流程中，數(shù)據(jù)采集、數(shù)據(jù)標注和數(shù)據(jù)質(zhì)檢又是較為重要的三個環(huán)節(jié)。但相比大模型的熱鬧，目前國內(nèi)的數(shù)據(jù)相關產(chǎn)業(yè)鏈還有不小的提升空間。

據(jù)“自象限”的觀察，目前數(shù)據(jù)質(zhì)量在國內(nèi)尚未受到足夠重視，缺乏專門做數(shù)據(jù)質(zhì)量的企業(yè)，這類企業(yè)更多是以大公司附庸品的形態(tài)出現(xiàn)。

而在海外，數(shù)據(jù)質(zhì)量形成了垂直賽道，其中的公司會幫助AI企業(yè)最大限度地減少劣質(zhì)數(shù)據(jù)帶來的影響，這類公司產(chǎn)品通常包括數(shù)據(jù)可觀察性平臺、數(shù)據(jù)整理和偏見檢測工具，以及數(shù)據(jù)標簽錯誤的識別工具等等。

到底需不需要這么多大模型？

最后是一個靈魂之問：行業(yè)需不需要這么多大模型？或者說，在大廠相繼發(fā)布大模型的背景下，新玩家還有沒有加入混戰(zhàn)的必要？

大佬們對此有不同的看法。早些時候李彥宏在接受采訪時表示，現(xiàn)在國內(nèi)大廠都看好AI大模型，創(chuàng)業(yè)公司重新做沒有多大意義。相較而言，“基于大語言模型開發(fā)應用機會很大，沒有必要再重新發(fā)明一遍輪子”。

并不是所有人都認同這一觀點。根據(jù)“品玩”的采訪，王小川認為“大模型就是需要時間長一點，認真一點，而錢也不是唯一重要的”，“有些公司雖然有大模型這個底子，但沒碰好就練歪了，上戰(zhàn)場更難受?！?/p>

由于大模型的門檻和不確定性，留給中小廠商以及創(chuàng)業(yè)公司的難題還有很多——規(guī)模跟不上大公司的節(jié)奏，中模型或小模型難以找到競爭點，也難以獲得“涌現(xiàn)”機會。如果選擇垂直場景切入，又有可能遭遇來自通用大模型的“碾壓”，一如ChatGPT對Jasper.AI的沖擊。

大部分關于這類問題的討論，比如要不要做大模型，要做什么樣的大模型，要選擇什么樣的場景來落地等等，目前都還處于“混沌”狀態(tài)。不少人在表達觀點時還會特意強調(diào)“就目前的情況看”，并表示自己未來可能會在觀點上有搖擺。但行業(yè)普遍認為，大模型代表著大機會，最后只有少數(shù)玩家能留下。

文|真探Alphaseeker 吳鴻鍵

“最近大模型的涌現(xiàn)，比大模型能力的「涌現(xiàn)」都要快?！?/p>

如果再把科研院所算上，據(jù)民生證券的統(tǒng)計，國內(nèi)目前已有超30個大模型亮相。行業(yè)儼然有大模型“軍備競賽”的意思。

機會看上去很多，但撥開冗雜的信息，我們需要判斷，大模型的“涌現(xiàn)”是不是曇花一現(xiàn)？以下四點值得關注。

產(chǎn)業(yè)融合成共識

相比ChatGPT在用戶端的熱潮，國內(nèi)廠商更愿意談大模型和產(chǎn)業(yè)的結(jié)合。“客戶”是高頻詞，“接入我們的大模型”是共同目標。

揚長避短，各秀肌肉

目前，國內(nèi)的大模型廠商并不諱言和OpenAI、ChatGPT的差距，只是各家對于“差距有多大”有一些不同的判斷。

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

大模型“混戰(zhàn)”還反映了一個信息：至少從表面上看，大模型不再稀缺。

民生證券在研報中指出，因為有開源基礎以及大公司自本身的算力儲備和資金實力，“單純發(fā)布一個大模型的門檻沒有市場想象中的那么高”。

數(shù)據(jù)、算法、算力是AI能力三要素。

到底需不需要這么多大模型？

最后是一個靈魂之問：行業(yè)需不需要這么多大模型？或者說，在大廠相繼發(fā)布大模型的背景下，新玩家還有沒有加入混戰(zhàn)的必要？

并不是所有人都認同這一觀點。根據(jù)“品玩”的采訪，王小川認為“大模型就是需要時間長一點，認真一點，而錢也不是唯一重要的”，“有些公司雖然有大模型這個底子，但沒碰好就練歪了，上戰(zhàn)場更難受。”

歷史搜索全部刪除

熱門搜索

大模型“涌現(xiàn)”的四個關鍵

產(chǎn)業(yè)融合成共識

揚長避短，各秀肌肉

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

到底需不需要這么多大模型？

評論

大模型“涌現(xiàn)”的四個關鍵

產(chǎn)業(yè)融合成共識

揚長避短，各秀肌肉

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

到底需不需要這么多大模型？

大模型“涌現(xiàn)”的四個關鍵

產(chǎn)業(yè)融合成共識

揚長避短，各秀肌肉

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

到底需不需要這么多大模型？

評論

大模型“涌現(xiàn)”的四個關鍵

產(chǎn)業(yè)融合成共識

揚長避短，各秀肌肉

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

到底需不需要這么多大模型？

揚長避短，各秀肌肉

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺

到底需不需要這么多大模型？

大模型不稀缺，高質(zhì)量數(shù)據(jù)才稀缺