文|商業(yè)秀 畢俊
編輯|展洋
自今年2月中旬監(jiān)管出手降溫以來,國內(nèi)關(guān)于ChatGPT的各大社群討論,似乎沉寂了不少。
彼時市場傳言,有關(guān)部門將加強ChatGPT及相似產(chǎn)品的監(jiān)測評估和違規(guī)行為處置工作,要求堅決關(guān)閉從境內(nèi)訪問境外ChatGPT的代理服務(wù)。內(nèi)容包括但不限于關(guān)閉從境內(nèi)訪問境外ChatGPT的代理服務(wù),要求各類網(wǎng)站、應(yīng)用程序、公眾號、小程序等,不得通過代理、插件、用戶自行部署等方式向公眾提供境外ChatGPT產(chǎn)品的訪問服務(wù)。如存在訪問渠道,迅速整改下線。
雖然該消息并未得到有關(guān)部門的證實,但之后部分國內(nèi)訪問境外ChatGPT代理服務(wù),確實已被關(guān)閉。并且,部分通過小程序部署接口為用戶提供ChatGPT服務(wù)的機構(gòu)訪問接口已被停用,以及淘寶上出售Chatgpt賬號的商家們更是迅速消失。
很快,A股ChatGPT的概念板塊遭遇一波快速回落,包括漢王科技、海天瑞聲、云從科技、格靈深瞳等在內(nèi)的多家公司收到了監(jiān)管工作函。而被問及的主要問題集中在相關(guān)公司與ChatGPT有沒有關(guān)系、有多少關(guān)系、是否借機炒作等。
更有意思的是,相比2月初全民爭相體驗ChatGPT的熱火朝天,現(xiàn)在已經(jīng)很難在淘寶等平臺搜索到售賣Chatgpt相關(guān)賬號的商品了。
不過,這些并未影響到一些類ChatGPT創(chuàng)業(yè)者們的熱情。
畢竟,對于沉寂許久的人工智能領(lǐng)域而言,ChatGPT的橫空出世,是NLP技術(shù)的一大進步;同時也意味著通用人工智能的大門就此開啟。
AI的新紀(jì)元已經(jīng)來到,沒有人愿意錯失。
01、創(chuàng)業(yè)公司被質(zhì)疑:大模型自研有幾分?
在社交媒體上,不少國內(nèi)創(chuàng)業(yè)公司都在聲稱,要發(fā)力打造中國ChatGPT。就連原美團聯(lián)合創(chuàng)始人王慧文,也在社交平臺即刻上喊話要“打造中國的OpenAI”。
王慧文甚至放出豪言,要設(shè)立了北京光年之外科技有限公司,出資5千萬美元,估值2億美元,并稱下輪融資已有頂級VC認購2.3億美元。
不久,美團創(chuàng)始人王興也在朋友圈透露,將以個人身份參與王慧文創(chuàng)業(yè)公司“光年之外”的A輪投資,并出任董事。
除了大公司,一些做類ChatGPT的創(chuàng)業(yè)公司也備受關(guān)注,甚至引發(fā)爭議,比如一家叫做MiniMax的公司。
公開資料顯示,MiniMax成立于2021年12月,以大模型為主要研發(fā)方向,擁有三個模態(tài)的基礎(chǔ)大模型,涉及文本到視覺、文本到語音、文本到文本三大模態(tài)?;谧匝械拇竽P?,該公司此前曾推出過一個智能對話機器人生成平臺 Glow,后又推出人工智能助手Inspo。
據(jù)媒體報道,Inspo是由 MiniMax公司自主開發(fā),底層是一個大型語言模型。通過與Inspo的對話可以得知其模型訓(xùn)練數(shù)據(jù)截止于今年2月,是MiniMax的核心技術(shù)之一。該模型基于Transformer架構(gòu)。
而更具體的信息比如模型參數(shù)量以及使用了哪些數(shù)據(jù)庫,則未有具體回答,官方也并未釋放出更多的詳細介紹。
從一些網(wǎng)友的使用截圖看來,Inspo的訓(xùn)練模型已經(jīng)更新到了GPT-3.5-turbo。并且最新版本由OpenAI發(fā)布,在之前GPT-3的基礎(chǔ)上優(yōu)化了模型結(jié)構(gòu)和算法。
不過,也有不少網(wǎng)友質(zhì)疑,這個大模型既然是基于OpenAI發(fā)布的GPT的基礎(chǔ)上推出的,那么它的大模型自研部分究竟有多少?是不是含水分?究竟能不能被稱為真正的“中國版的ChatGPT”?
這類被質(zhì)疑的創(chuàng)業(yè)公司不勝枚舉,比如有業(yè)內(nèi)人士在知乎上表示:國內(nèi)某團隊上線的服務(wù)似乎是直接大量使用了ChatGPT 的問答數(shù)據(jù)來訓(xùn)練自己的網(wǎng)絡(luò),輸入問題和通過ChatGPT得到的回答高度相似。
來源:知乎
該人士同時指出,“國內(nèi)有大量ChatGPT 和GPT3.5 代理,獲得了大量 ChatGPT 的真實用戶問答數(shù)據(jù),是優(yōu)質(zhì)的訓(xùn)練素材。但,這是違反 ChatGPT 協(xié)議的行為,雖然 OpenAI 管不了,但這個有點丟人?!?/p>
甚至有網(wǎng)友評價道,如果說MiniMax這種程度的大模型也稱得上自主研發(fā)的話,那科研的創(chuàng)造性,仿佛是個笑話一般。
對于所有的創(chuàng)業(yè)公司而言,不愿錯過這波AI領(lǐng)域的機會是一回事,但是否有真的有技術(shù)實力承接,則是另一回事。
小冰公司CEO李笛曾在接受《中國企業(yè)家》采訪時表示,“產(chǎn)出ChatGPT的Foundation Model(大模型)在今天這個時代,還不是創(chuàng)業(yè)公司可以玩轉(zhuǎn)的。很多人去計算Foundation Model,主要計算它的GPU。但實際上,GPU這些東西這都是看得見的,看不見的是,如果你這個模型訓(xùn)練出來了,但模型不收斂,你就白訓(xùn)練了,就得推倒重來,這是工程問題,你需要推倒重來很多次?!?/p>
如果按李笛的說法,以如今國內(nèi)這些創(chuàng)業(yè)公司的資金水平和技術(shù)積累,至少還很難搞得出原創(chuàng)版的大模型。
02、一場資金與技術(shù)的持久戰(zhàn)
以人工智能訓(xùn)練為例,它不僅需要消耗大量的算力,還需要投入頂級研究人員薪資等人力成本。
畢竟,AI技術(shù)研發(fā)需要真正有實力的專家。
科技情報分析機構(gòu)AMiner和智譜研究發(fā)布的《ChatGPT團隊背景研究報告》顯示, 在OpenAI的ChatGPT研發(fā)團隊中,有27人為本科學(xué)歷,25人為碩士學(xué)歷,28人為博士研學(xué)歷(注:5人信息缺失),其占比分別為33%、30%、37%。
相比之下,Minimax的團隊似乎有些配置不足,雖然其創(chuàng)始團隊也來自海內(nèi)外AI公司和科技大廠,但核心技術(shù)骨干只有幾名,既要做大模型和數(shù)據(jù)訓(xùn)練,又要做商業(yè)化布局,這樣的團隊還遠遠不夠。
按照Minimax接受媒體采訪時的說法,這家成立于2021年12月的創(chuàng)業(yè)公司,僅僅用了一年半的時間,便“自研”出了三個模態(tài)的基礎(chǔ)大模型,涉及語音、圖像、文本不同內(nèi)容的生成。
而反觀OpenAI,這家成立于2015年12月的公司,其推出ChatGPT也要等到2022年12月,從研發(fā)到產(chǎn)品推出,其間整整花了7年時間。
最初,OpenAI的定位為非營利公司,但創(chuàng)立之初就吸引到10億美元的種子投資。隨后幾年,OpenAI以每年數(shù)百萬美元的速度消耗著融資。
然而,研發(fā)的進展緩慢與資本的逐利相沖突。在董事會發(fā)生變動后,公司從非盈利組織轉(zhuǎn)為可公開融資的追求資本回報的科技企業(yè),迅速獲得了微軟10億美元的投資計劃。
據(jù)《紐約時報》報道,自2019年以來,微軟對OpenAI至少投資了30億美元。今年1月,OpenAI宣布獲得微軟“多年期數(shù)十億美元的投資”。據(jù)Semafor報道稱,投資高達100億美元,包括其他風(fēng)投公司。
至此,OpenAI的估值則將達到290億美元。
可以看到,在強有力的資金支持下,OpenAI的GPT產(chǎn)品才得以迅速迭代,前兩代的開源GPT模型和GPT-3積累了大量數(shù)據(jù),在2022年更是進化出了ChatGPT。
從研發(fā)到產(chǎn)品面世,ChatGPT的商業(yè)化之路需要大量資金投入。據(jù)Business Insider估算,目前ChatGPT一個月的維護成本在300萬美元(一天將近10萬美元),考慮到人力成本,費用估計還要加倍。OpenAI的產(chǎn)品用的是微軟的Azure企業(yè)云服務(wù)器,有投行分析員估算,一年的成本可能從2500萬美元到10億美元。
OpenAI的ChatGPT研發(fā)之路尚且如此艱難,何況一家小小的創(chuàng)業(yè)公司呢!
因此,關(guān)于Minimax的資金來源以及商業(yè)化過程,也難免會引發(fā)外界質(zhì)疑。而且,目前Minimax也并未對外公開其資金情況以及投資團隊。
如此看來,MiniMax需要對外公開回答的問題還不少。
03、技術(shù)的厚積薄發(fā)
自2022年至今,生成式AI是一個很熱門的話題。與之而來的是,今年 ChatGPT瞬間爆火。
對新事物的出現(xiàn),我們國家的監(jiān)管上也并非“一棒子打死”,政策上給予了積極的支持。
2月13日,北京市經(jīng)濟和信息化局發(fā)布的《2022年北京人工智能產(chǎn)業(yè)發(fā)展白皮書》提出,2023年要全面夯實人工智能產(chǎn)業(yè)發(fā)展底座,支持頭部企業(yè)打造對標(biāo) ChatGPT的大模型,著力構(gòu)建開源框架和通用大模型的應(yīng)用生型。
自2月起,百度、阿里、騰訊、京東、字節(jié)跳動等大企業(yè)紛紛發(fā)聲,表示自己在大模型領(lǐng)域已經(jīng)開展了深入研究,且獲得了很多成果。
在這波大模型的追趕賽中,百度是最早開始研發(fā)預(yù)訓(xùn)練模型的企業(yè)。從2019 年開始,百度就深耕預(yù)訓(xùn)練模型研發(fā),先后發(fā)布知識增強文心(ERNIE)系列模型。
文心大模型研發(fā)的帶頭人,百度首席技術(shù)官、深度學(xué)習(xí)技術(shù)及應(yīng)用國家工程研究中心主任王海峰博士,是自然語言處理領(lǐng)域權(quán)威國際學(xué)術(shù)組織ACL(Association for Computational Linguistics)的首位華人主席、ACL亞太分會創(chuàng)始主席、ACL Fellow,還是IEEE Fellow、CAAI Fellow及國際歐亞科學(xué)院院士。
此外,王海峰還兼任中國電子學(xué)會、中國中文信息學(xué)會、中國工程師聯(lián)合體副理事長等。目前,王海峰在國內(nèi)外期刊會議上發(fā)表的學(xué)術(shù)論文有200余篇,獲得已授權(quán)專利170余項。
在業(yè)內(nèi)看來,推出ChatGPT,需要扎實的AI技術(shù)基礎(chǔ),尤其是AI深度學(xué)習(xí)領(lǐng)域的積累。而百度十多年來,已經(jīng)累計投入超過1000億來研究AI技術(shù)。
有分析師表示,ChatGPT相關(guān)技術(shù),百度在中國乃至全球范圍均具有綜合優(yōu)勢。ChatGPT處在技術(shù)架構(gòu)的模型層,而百度在芯片、框架、模型、應(yīng)用四層技術(shù)棧均有布局,其文心系列大模型在行業(yè)已普遍應(yīng)用,而能支撐該訓(xùn)練模型的框架,除百度飛槳外,在中國難出其右。
所有的技術(shù)型產(chǎn)品,尤其是人工智能領(lǐng)域,其底層技術(shù)的研發(fā)都需要經(jīng)歷漫長的時間周期。而一些創(chuàng)業(yè)公司跟風(fēng)入局,利用時間差賺一些快錢,或許能有一時風(fēng)光,但長遠來看,終會被市場淘汰。
通用人工智能的研發(fā)需要持續(xù)的資金與頂級人才投入,就通用人工智能領(lǐng)域而言,受限于算力、數(shù)據(jù)規(guī)格、歷史投入、頂尖人才、資金實力等方面的要求。顯然,大公司比創(chuàng)業(yè)公司更具備優(yōu)勢,比如百度之所以能盡快推出類ChatGPT產(chǎn)品“文心一言”,也是因為百度十年多來累計投入超過1000億來技術(shù)研發(fā)。
而創(chuàng)業(yè)公司顯然更難一些,一方面,它們的前期技術(shù)研發(fā)沉淀甚少;另一方面,它們也還面臨著在應(yīng)用端根據(jù)行業(yè)需求調(diào)整和優(yōu)化耗費的高昂成本,且難度頗高。
但創(chuàng)業(yè)公司因此就完全沒有機會了嗎?有,對創(chuàng)業(yè)公司而言,他們只要腳踏實地做好ChatGPT相關(guān)的一個細分板塊,也依然有機會跑出來。