精品国产自在精品国产,精品无码日韩AV免费的,日韩影院在线观看

文 | 財經(jīng)無忌山核桃

熱火烹油的大模型賽道打起了“嘴仗”。

搜狗前CEO王小川評價百度創(chuàng)始人李彥宏的采訪發(fā)言稱：“你們采訪的可能是平行世界的他，不是我們這個世界里的?！?/p>

而針對王小川的評論，百度集團副總裁、搜索平臺負責人肖陽又回應道：“王小川脫離一線太久，確實跟我們不在一個宇宙，自然對國內人工智能技術的發(fā)展缺乏了解?！?/p>

意外的是，王小川在14日凌晨又“嘲諷”了一把，稱對方是“脫離一線15年的人，去懟離開1.5年的人”。

這場爭論也暴露出創(chuàng)業(yè)派與大廠間微妙的競爭關系。

毋庸置疑，大模型技術徹底點燃了科技圈的熱情，創(chuàng)業(yè)者忙著招兵買馬，生怕錯過了新風口；一級市場關于大模型的投融資熱度攀升，不少FA們甚至跑去B站開始惡補AI知識。

政策端也在吹來暖風，北京市經(jīng)濟和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》顯示，今年，北京將支持頭部企業(yè)打造對標ChatGPT的大模型。

熱鬧只是硬幣的A面。

無論是忙著官宣大模型的科技大廠，還是廣發(fā)英雄帖的創(chuàng)業(yè)公司，身處這股浪潮之中的人們都在思考一些關鍵問題：率先做出第一個中國版GPT的是誰？還有多久才能做出來？市場格局又會是發(fā)生怎樣的變化？

這些問題都難以給出正確的答案，事實上，也沒有人能給出準確的回答。畢竟，人們總是高估一項科技所帶來的短期效益，卻又低估它的長期影響。

本文將圍繞當下中國的大模型競爭現(xiàn)狀，基于行業(yè)資料與研究，主要回答三個問題：

1. 為什么國內科技公司要紛紛競逐大模型？

2. 火熱背后，中國科技公司究竟缺什么？

3. 中國科技公司“大模型之戰(zhàn)”的走向會是什么？

為什么極客們都愛大模型？

理解中國科技巨頭們的“大模型焦慮”，一張產(chǎn)品發(fā)布時刻表就夠了。

在OpenAI發(fā)布GPT-4大模型后，百度用“Demo演示”的形式正式發(fā)布文心一言。同樣在3月，53歲的周鴻祎決定“把剛出生的孩子抱出來給大家看看”，他推出360的大模型產(chǎn)品，甚至倉促到名字都要現(xiàn)場取。

隨后的一個多月里，科技巨頭、創(chuàng)業(yè)公司與高校研究院們展開了一輪關于“大模型”的軍備競賽，整個4月可以被稱為“大模型的發(fā)布月”，繼百度之后，華為、商湯、阿里已在4月亮出自己的大模型產(chǎn)品。

最新的消息是，京東計劃在今年發(fā)布新一代產(chǎn)業(yè)大模型“言犀”，被視為“京東版”ChatGPT。

大模型也成為了互聯(lián)網(wǎng)大佬扎堆二次創(chuàng)業(yè)的熱門賽道。

原美團聯(lián)合創(chuàng)始人王惠文、創(chuàng)新工場CEO李開復、前京東AI掌門人周伯文、前阿里技術副總裁賈揚清等均入局創(chuàng)業(yè)。前搜狗CEO王小川的百川智能已完成了5000萬美元融資，王小川給了自己一個DDL：“今年年底做到國內最好的”。

一位業(yè)內人士這樣形容當下百花齊放的圖景：“（這波創(chuàng)業(yè)）很像2000年左右的互聯(lián)網(wǎng)創(chuàng)業(yè)潮?！?/p>

普通讀者們很難理解科技圈對大模型的擁躉，畢竟類似的創(chuàng)業(yè)潮在元宇宙、XR行業(yè)也都復現(xiàn)過。但如果深入理解人工智能的發(fā)展歷史與傳統(tǒng)AI時代的困境，就能理解為何這群極客們如此熱愛大模型。

關于大模型的定義，OpenAI創(chuàng)始人Altman與李開復更愿意將大模型定義為“一種新技術平臺”，而學界則將“大模型”對比“小模型”，定義為一種“基于大量數(shù)據(jù)訓練的、擁有巨量參數(shù)的模型”，這種模型能適應廣泛的下游任務。

在AI1.0時代，比起創(chuàng)業(yè)者對AI智能化的疾呼，大多數(shù)人對人工智能只停留在一些單一場景產(chǎn)品端的理解。

例如人工智能客服、人工智能質檢等，上述場景都是針對一項任務具體開發(fā)一個專用小模型，并不具備“理解能力”。就像周鴻祎將此前的人工智能產(chǎn)品形容為“人工智障”，在他看來：“在GPT之前，從來沒有一個人工智能的產(chǎn)品能真正的理解我們這個世界?！?/p>

從人工智障到人工智能的進化，大模型的出現(xiàn)意味著人們正式進入到AI2.0時代，這背后是大模型的涌現(xiàn)性使然。

涌現(xiàn)是人工智能領域經(jīng)常會被提及到的概念，代表一種從量變到質變的過程，當數(shù)據(jù)規(guī)模足夠大，參數(shù)達到千億級，即使在沒有專門訓練過的領域，AI也能涌現(xiàn)出知識理解和邏輯推理能力，華東政法大學人工智能與大數(shù)據(jù)指數(shù)研究院將“涌現(xiàn)性”定義為一個“多種技術融合的結果”：“（大模型）有效集成自然語言處理等多個人工智能核心研究領域的多項技術，實現(xiàn)1+1>2的融合式涌現(xiàn)。”

換言之，大模型有望解決“人工智能如何理解世界”的問題，實則提供了一條可能邁向AGI（通用人工智能）的可能性。

另一方面，大模型的通用性也在激發(fā)更多的商業(yè)圖景，解決了AI1.0時代的諸多問題。

在上一波AI創(chuàng)業(yè)潮中，總結AI企業(yè)所面臨的問題主要兩點：一是成本問題，清洗與標注海量的數(shù)據(jù)需要耗費巨大的成本，商湯科技聯(lián)合創(chuàng)始人、副總裁楊帆曾表示，對于每一個新場景，公司都要重新收集新數(shù)據(jù)，搭建定制化模型。

這種開發(fā)模式很像“小作坊”，不但解決問題的成本極高，開發(fā)模式也十分低效。

在實際落地過程中，應用場景的復雜性導致AI應用的“孤島化”，李開復曾提到一個例子：“如果今天一家銀行想做AI應用，但沒有任何數(shù)據(jù)可以用來冷啟動，還要收集、清洗、標注數(shù)據(jù)，再去做模型，整個過程代價都很大?！?/p>

而當大模型已成為上層應用的技術底座，可以實現(xiàn)在AI1.0時代無法實現(xiàn)的跨領域部署，支撐終端、平臺、系統(tǒng)等產(chǎn)品應用落地。這種像搭積木一樣“組合創(chuàng)新”的可能性，以及商業(yè)化的能力就像ChatGPT一樣，人們不僅發(fā)現(xiàn)，它可以深夜聊天，撫慰人心，還會寫程序和講故事。

成本問題之外，并不具備通用能力的小模型，由于無法向行業(yè)進行推廣與復用，難以形成規(guī)模效應，也就更難言盈利。

這種“通用性”激發(fā)出諸多新的商業(yè)圖景，可以將其理解為AI時代的“操作系統(tǒng)”，在降低開發(fā)成本的同時，人人都可以是開發(fā)者，由此發(fā)現(xiàn)與生產(chǎn)出新的產(chǎn)品與應用場景。

找錢、找人、找應用場景

大模型競賽的槍響之后，創(chuàng)投行業(yè)又復現(xiàn)“元宇宙”的熱潮。

有大模型企業(yè)1個月見的投資人相當于去年一整年。一級市場關于大模型的投融資熱度攀升，不少FA們甚至跑去B站開始惡補AI知識，生怕錯過一個好項目。

但搶到這張通往新世界的“船票”并非容易，區(qū)別于AI1.0時代，找錢、找人與找應用場景的焦慮，在這一波競逐中，體現(xiàn)的尤為明顯。

首先是找錢。參考多位創(chuàng)業(yè)者的觀點，2億美元是行業(yè)普遍認為的啟動資金。拆解來看，以硬件成本為例，研究機構TrendForce在一份報告中指出，要處理1800億參數(shù)的GPT-3.5大型模型，需要的GPU芯片數(shù)量高達2萬顆，未來GPT大模型商業(yè)化所需的GPU芯片數(shù)量甚至會超過3萬顆。

僅在算力門檻上，很多創(chuàng)業(yè)企業(yè)便無力與大廠抗衡。

因此，表面上熱火朝天的大模型賽道，風大“魚”貴，但實際投資人們心里也知道，僅靠幾張PPT創(chuàng)新的時代過去了，投資既是要投靠譜的人，也要考慮賽道與具體的商業(yè)路徑，畢竟，錢也一定要投在刀刃上。

云啟資本合伙人陳昱在接受《甲子光年》采訪時就表示：“做大模型創(chuàng)業(yè)的公司要融到大錢不容易了?！?/p>

英諾天使基金合伙人王晟曾表示，“我們也經(jīng)?！⒄撐摹?，看到AI領域里很棒的論文，直接就去找作者了，看他是一個學霸，還是有創(chuàng)業(yè)潛質、業(yè)務沒有商業(yè)化的潛力，如果合適，我們也會建議他創(chuàng)業(yè)并考慮投資?！?/p>

比起AI1.0時代的純科學家創(chuàng)業(yè)，AI2.0時代更像是一場互聯(lián)網(wǎng)大佬與科學家們的“集體二次創(chuàng)業(yè)”。

能夠融到“大錢”的要么是有創(chuàng)始人經(jīng)歷或個人魅力背書，要么就是此前長期跟蹤孵化，雙方一直保持著良好的合作關系。

比如，目前融資總額已達數(shù)億元的瀾舟科技是創(chuàng)新工場從0到1孵化出的企業(yè)，而由前京東技術委員會主席周伯文創(chuàng)立的銜遠科技，背后的參投方啟明創(chuàng)投等均是AI領域的長期捕手。

其次，找到合適的人也并不容易，在這一點上，科技巨頭與創(chuàng)業(yè)公司面臨相同的處境。在一檔播客節(jié)目中，已宣布加入光年之外的北京智源人工智能研究院副院長劉江曾發(fā)出呼吁：“所有的同學，如果你是AI的頂級人才，或者有這樣的人，歡迎來到光年之外?！?/p>

“大數(shù)據(jù)+強算法+大算力”被視為支撐大模型落地的重要公式，大廠有算力，也有數(shù)據(jù)，能夠提供標準化的產(chǎn)品，但算法背后對應的則是人才。大廠很難留住強算法人才的原因在于，大模型投入是一件長期主義的事，必定會面臨與既有業(yè)務之間的沖突，從大廠出走的諸多大模型創(chuàng)業(yè)者的經(jīng)歷已然說明了這一點。

而對創(chuàng)業(yè)公司而言，即便有首席科學家的支撐，找到合適的人也并不容易。

聆心智能創(chuàng)始人、清華大學計算機科學與技術系長聘副教授黃民烈認為，如OpenAI這種技術見長的公司需要很多特別牛的工程技術人才。

對創(chuàng)業(yè)企業(yè)而言，回到前述的融資環(huán)境下，無論是基于創(chuàng)始人的背景背書，抑或是資源合作，都需要長期積淀。

同時，在強調生態(tài)的大模型賽道，創(chuàng)業(yè)型企業(yè)勢必要面臨來自投資方、合作方乃至競對間的博弈，一個合適的伙伴不僅要在自己的細分領域內做到頂尖（懂技術+懂產(chǎn)品），還有隨時保持戰(zhàn)略的獨立性，不輕易站隊。

最后，能否找到合適的應用場景，另辟賽道，并迅速建立護城河壁壘，這一問題也同樣拷問著入局者。

百度李彥宏將當前的大模型生態(tài)分為三類，他最看好應用層的市場機遇。

第一類是新型云計算公司，云計算主流商業(yè)模式將會從IaaS變?yōu)镸aaS（模型即服務）。

第二類是進行行業(yè)模型精調的公司，介于通用大模型和企業(yè)之間的中間，這類企業(yè)可以基于對行業(yè)的洞察，調用通用大模型能力，為行業(yè)客戶提供解決方案。

第三類是應用層的企業(yè)，基于通用大語言模型開發(fā)應用服務，這可能才是真正的機會。

區(qū)別于國外專業(yè)化的分工，當前，國內的大模型賽道的創(chuàng)業(yè)模式主要分類是三類：一類是聚焦基礎層，對標OpenAI，發(fā)揮基礎設施的作用。一類是錨定中間層，不需要如OpenAI一樣花大錢做底層，掌握通用化能力，可以通過開源大模型做精調，讓模型具備差異化能力，最終可以形成垂直類模型。還有一類就是調用大模型API的企業(yè)，專注開發(fā)大模型具體場景的應用，如Jasper。

如果將大模型比喻成AI時代的電，那么基礎層與中間層擔任的都是“發(fā)電廠”的角色，需要極高的門檻，對資金、技術以及資源有嚴格的準入壁壘，大多也是大公司間的競逐。

百度、阿里、華為頭部企業(yè)均采取“模型+工具平臺+生態(tài)”三層共建模式的模式，推動業(yè)務的正向循環(huán)。

大廠的競逐中，也涌現(xiàn)出一些創(chuàng)業(yè)公司，既做大模型，又將其能力輸出至垂直行業(yè)，形成定制化模型，雖然避開了與有錢有勢的大廠們的直接競爭，但也面臨三大難題。

一是數(shù)據(jù)如何才能做專做細，很多行業(yè)定制化模型依舊難以形成數(shù)據(jù)飛輪與場景飛輪。二是大廠極容易摘低垂的果實，垂直大模型實現(xiàn)復用的前提是必須要在該行業(yè)建立壁壘與護城河，即“人無我有”的競爭優(yōu)勢。三是通用化往往是歷史的趨勢，因此“未來垂直大模型是否會最終被通用大模型取代”這一問題也值得思考。

大船票or小船票？

人工智能專家侯世達的學生梅拉妮·米歇爾在《AI 3.0時代》里認為，研究人工智能與賽道中的創(chuàng)業(yè)者們都熟悉了一種模式——先是“人工智能的春天”，緊接著是過度的承諾和媒體炒作，接下來便是“人工智能的寒冬”。從某種程度上來說，這種模式以5～10年為周期在不斷上演。

正在興起的“大模型熱”也必定會經(jīng)歷從繁榮到擠去泡沫的過程。

對中國的科技公司而言，“能不能做出一個中國版GPT”“中國創(chuàng)業(yè)公司里是否會出現(xiàn)一個OpenAI”。對上述大模型行業(yè)的叩問，從業(yè)者們看法不一。

李彥宏在被問到“中國創(chuàng)業(yè)公司里會不會再出一個OpenAI？”時，他直接回答“基本不會了”，“沒有必要再重新發(fā)明一遍輪子?！?/p>

但另一種觀點也認為，中國攻堅大模型依舊難以繞開OpenAI，這種危機感越發(fā)強烈。曠視科技聯(lián)合創(chuàng)始人印奇在接受鈦媒體采訪時表示，中國攻堅 AI 大模型要先把GPT-3.5復現(xiàn)出來，但面臨長期技術創(chuàng)新與短周期商業(yè)化兩重壓力：

“未來的一段時間，能不能有一個公司首先把大模型真的做出來，且性能真的是達到GPT-3.5，這是所有事情的起點。就像菜你沒有炒過，不知道鹽和味精怎么放，而且GPT所消耗的資源、門檻都非常高?！?/p>

是崇尚“大算力+大數(shù)據(jù)+強算法”的暴力美學，還是專注將一個垂直模型做透做專？中國企業(yè)的機會又在哪里？又可以在哪些方面深耕與挖掘？

這些問題的答案都亟待解決。

與此同時，人們也關注大模型行業(yè)未來的市場格局演進。未來究竟是兩三家企業(yè)間的競爭，還是百花齊放？“大船票”和“小船票”或牽引企業(yè)走向不一樣的結局。

在關于大模型的這場游戲中，盡管尚未看到終局，但對入局者而言，有兩大方向是確定的：

一個是應用與場景先行的邏輯。國產(chǎn)大模型極為強調產(chǎn)業(yè)側的價值，一方面當前中國智能化浪潮下，產(chǎn)業(yè)側數(shù)字化實踐本就有廣闊的市場需求，另一方面在2B生態(tài)下，基于垂直應用的實踐本身也有利于形成數(shù)據(jù)飛輪與場景飛輪。

以金融業(yè)為例，BloombergGPT的誕生已說明了這一領域既有數(shù)據(jù)基礎，也有多元化場景需求。但在此前的實踐中，存在的問題一是數(shù)據(jù)量龐大，AI專家培養(yǎng)成本高，因此只有頭部銀行機構愿意嘗試。二是金融機構對業(yè)務的連續(xù)性與數(shù)據(jù)的準確性有著嚴苛要求，因此也對大模型廠商對行業(yè)的理解能力提出了高要求。

換言之，回到業(yè)務本質，需要什么就用什么。

通用意味著泛化，這為能夠輸出精準能力的企業(yè)提供了機會窗口。如果能將一個垂直領域做專做透，用高質量的數(shù)據(jù)持續(xù)優(yōu)化模型，將價值鏈做長。對創(chuàng)企而言，金融、醫(yī)療、教育等領域都有市場空間。

二是先行者已提供了路線參照。如周鴻祎所言，差距并非是天壤之別，路線已經(jīng)明確。周鴻祎指出：“發(fā)展大語言模型，別人已經(jīng)指明了技術路線，剩下的就是長期主義指導下的時間問題。”

很難回答，此輪的大模型競逐是否是人工智能競賽浪潮最后的哨聲，但幾乎每個從業(yè)者都害怕自己會成為“最后的一個”?？萍即蠊緜兛謶直活嵏?，創(chuàng)業(yè)公司恐懼被大公司們顛覆，更大的恐懼則來自于大模型超越摩爾定律的技術迭代速度。

而在商業(yè)世界里，危機與恐懼往往是最好的原動力。