正在閱讀:

阿里接連“痛失”兩員大將,都去搞大模型了

掃一掃下載界面新聞APP

阿里接連“痛失”兩員大將,都去搞大模型了

每一個(gè)AI科學(xué)家都有一個(gè)做大模型的夢(mèng)想。

文|融中財(cái)經(jīng) 風(fēng)信子

編輯|吾人

要問(wèn)2023年的創(chuàng)投圈什么最熱鬧,那非ChatGPT莫屬。

除了谷歌、微軟、Meta、百度等這些互聯(lián)網(wǎng)大廠積極加碼AI的投資,不少這些大廠走出來(lái)的高管也紛紛加入到創(chuàng)業(yè)的隊(duì)伍中去,大有重現(xiàn)移動(dòng)互聯(lián)網(wǎng)時(shí)代的創(chuàng)業(yè)熱潮,這不又有幾個(gè)互聯(lián)網(wǎng)大廠的高管出來(lái)創(chuàng)業(yè)了。

近日,亞馬遜首席科學(xué)家李沐,被曝已離職創(chuàng)業(yè),其創(chuàng)業(yè)項(xiàng)目,名為Boson.ai,從官網(wǎng)信息來(lái)看,創(chuàng)業(yè)內(nèi)容與大模型應(yīng)用有關(guān)。目前李沐尚未官宣,但在Boson.ai的GitHub項(xiàng)目主頁(yè)中,已經(jīng)能看見(jiàn)他的身影。

就好像王興找上老同學(xué)王慧文開啟大模型創(chuàng)業(yè)一樣,這次李沐是與其導(dǎo)師Alex Smola一起創(chuàng)業(yè)的,Alex Smola曾任亞馬遜副總裁,是位杰出的AI科學(xué)家,目前任Boson.ai的CEO。

有傳聞稱阿里VP賈揚(yáng)清將離職創(chuàng)業(yè),計(jì)劃創(chuàng)業(yè)的方向是AIInfra(AI架構(gòu)),屬于是AI基礎(chǔ)設(shè)施提供商,關(guān)注包括大模型在內(nèi)的AI應(yīng)用。具體而言是要打造一個(gè)統(tǒng)一、多云和可觀察的人工智能平臺(tái)。目標(biāo)是提升人工智能產(chǎn)品化的效率,包括開發(fā)者效率和系統(tǒng)效率兩個(gè)方面。通過(guò)端到端的解決方案,來(lái)幫助企業(yè)和開發(fā)者高效部署人工智能。

僅隔一天,阿里再失一員AI大將。據(jù)悉,阿里M6大模型的前帶頭人楊紅霞已加入字節(jié)AILab(人工智能實(shí)驗(yàn)室),參與語(yǔ)言生成大模型的研發(fā)。

除此之外,據(jù)不完全統(tǒng)計(jì),AI大模型領(lǐng)域已經(jīng)集結(jié)了前美團(tuán)聯(lián)合創(chuàng)始人王慧文,原京東集團(tuán)技術(shù)委員會(huì)主席、云與 AI 總裁,京東人工智能研究院院長(zhǎng)周伯文,前搜狗CEO王小川,快手前AI核心人物李巖等。

3月20日,創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開復(fù),轉(zhuǎn)型投資人多年的他,宣布將籌組名為“AI2.0”的項(xiàng)目。創(chuàng)新工場(chǎng)也將“Project AI 2.0”(AI2.0項(xiàng)目)掛到了官網(wǎng)首頁(yè),并表示將在全球范圍尋找具有 AI 大模型、NLP(語(yǔ)言生成模型)、Multi-modality(多模態(tài))等領(lǐng)域能力的優(yōu)秀技術(shù)人和研究員。這意味著,李開復(fù)要親自帶隊(duì)投入大模型創(chuàng)業(yè)中去了。

看到曾經(jīng)最優(yōu)秀的一批創(chuàng)業(yè)者投身AI大模型創(chuàng)業(yè),無(wú)疑是振奮人心的,然而我們要思考的是為什么ChatGPT沒(méi)有誕生在中國(guó),開發(fā)我們自己的ChatGPT到底需要什么?

01 為什么ChatGPT沒(méi)有誕生在中國(guó)?

ChatGPT的誕生讓世界為之震驚,也讓創(chuàng)投圈為之瘋狂,不少國(guó)人也為ChatGPT沒(méi)有誕生在中國(guó)而感到失落。

近幾個(gè)月,關(guān)于老外在用ChatGPT寫論文,寫工作總結(jié),寫各種報(bào)告等新聞不絕于耳,國(guó)人垂涎已久,盡管百度以最快的速度推出了號(hào)稱中國(guó)版的ChatGPT文心一言,然而無(wú)論是來(lái)自用戶還是投資者的反饋都不是滿意,甚至有人調(diào)侃,百度的文心一言發(fā)布會(huì)硬生生搞成了招商大會(huì)。發(fā)布會(huì)期間,百度股價(jià)一度閃崩,這不禁讓國(guó)內(nèi)再度發(fā)出疑問(wèn),百度做AI也有10年了,為什么它沒(méi)有率先做出ChatGPT,為什么ChatGPT沒(méi)有誕生在中國(guó)?

有不少專家從技術(shù)、法律等角度分析原因,他們認(rèn)為中國(guó)之所以沒(méi)有誕生ChatGPT主要是因?yàn)橐韵聨讉€(gè)原因:

華東政法大學(xué)政治學(xué)研究院院長(zhǎng)、人工智能與大數(shù)據(jù)指數(shù)研究院院長(zhǎng)高奇琦教授認(rèn)為,通用大模型是一個(gè)系統(tǒng)工程,算法、數(shù)據(jù)和算力這三個(gè)因素至關(guān)重要。目前,我們的差距主要集中在數(shù)據(jù)和算力。數(shù)據(jù)方面,英文互聯(lián)網(wǎng)上的數(shù)據(jù)質(zhì)量相對(duì)比較高,也更易于清洗。ChatGPT之所以問(wèn)題回答得好,很重要的原因就在于英文互聯(lián)網(wǎng)上有大量比較準(zhǔn)確的知識(shí)類信息,可以用于模型訓(xùn)練。中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)也很多,但質(zhì)量還有差距,加之國(guó)內(nèi)的數(shù)據(jù)大量?jī)?chǔ)存于移動(dòng)端APP中,數(shù)據(jù)比較難抓取,而互聯(lián)網(wǎng)巨頭之間的數(shù)據(jù)又是相互封閉的,數(shù)據(jù)孤島化的情況也比較嚴(yán)重。算力是另一個(gè)巨大的挑戰(zhàn),ChatGPT需要至少3萬(wàn)張英偉達(dá)A100卡的算力,這是巨大的一筆投入。

除此之外,還有人從政策法規(guī)的角度進(jìn)行了分析,他們認(rèn)為,為了避免人工智能技術(shù)可能帶來(lái)的潛在風(fēng)險(xiǎn)和威脅,中國(guó)國(guó)家和市級(jí)政府都出臺(tái)了一系列的人工智能技術(shù)規(guī)范和管理?xiàng)l例。這些規(guī)定對(duì)于ChatGPT這樣依賴深度學(xué)習(xí)技術(shù),可能涉及到數(shù)據(jù)保護(hù)和隱私保護(hù)等方面的技術(shù)提出了嚴(yán)格要求,需要滿足一系列的審批和認(rèn)證流程。

筆者從創(chuàng)投的角度分析,認(rèn)為中國(guó)之所以沒(méi)率先落地ChatGPT,一方面是國(guó)內(nèi)許多企業(yè)家對(duì)新技術(shù)缺乏敏感性,另一方面是國(guó)內(nèi)的投資人對(duì)底層技術(shù)的長(zhǎng)期不重視。

雖然不少國(guó)人紛紛舉手要進(jìn)行大模型創(chuàng)業(yè),立志要做出中國(guó)版的ChatGPT,然而俞敏洪卻指出了一個(gè)扎心的事實(shí)。近日,他在第23屆亞布力中國(guó)企業(yè)家論壇上說(shuō)道,“ChatGPT已討論兩個(gè)月了,有多少企業(yè)家玩過(guò)ChatGPT?”在他看來(lái),沒(méi)玩過(guò)ChatGPT的企業(yè)家,沒(méi)資格談?wù)摳呖萍己臀磥?lái)企業(yè)的走向,對(duì)于企業(yè)家來(lái)說(shuō),年齡不是問(wèn)題,思想的僵化和行動(dòng)的僵化才是問(wèn)題,不接受新鮮事物才是問(wèn)題。

知名互聯(lián)網(wǎng)學(xué)者劉興亮在一檔節(jié)目中被主持人問(wèn)到,為什么ChatGPT沒(méi)有誕生在中國(guó),他用一句話回答了這個(gè)問(wèn)題,即美國(guó)人在創(chuàng)新、中國(guó)人在應(yīng)用、歐洲人在立法。

俞敏洪與劉興亮分別揭示了國(guó)內(nèi)面對(duì)新技術(shù)不同層面的態(tài)度,俞敏洪指出了,中國(guó)企業(yè)家對(duì)于新興技術(shù)缺乏足夠的熱情,對(duì)于新事物缺乏思想上的接受能力以及相應(yīng)的行動(dòng)力,這也引發(fā)了中國(guó)的ChatGPT到底會(huì)在互聯(lián)網(wǎng)大廠誕生還是在創(chuàng)業(yè)企業(yè)誕生的討論。

劉興亮的回答也反映出一個(gè)問(wèn)題,即我國(guó)的創(chuàng)業(yè)項(xiàng)目有著太強(qiáng)的功利性,凡是不能快速變現(xiàn)或者暫時(shí)落地場(chǎng)景不明朗的項(xiàng)目很難得到投資人的青睞,這也讓我們忽略了許多底層技術(shù)的創(chuàng)業(yè)機(jī)會(huì),而恰恰是底層技術(shù)才是能夠“卡脖子”的地方。

所以,中國(guó)缺的不是能做出ChatGPT的技術(shù)人才,而是能夠孵化ChatGPT的環(huán)境土壤。

02 中國(guó)不缺技術(shù)人才,缺的是優(yōu)秀的企業(yè)家

每一個(gè)AI科學(xué)家都有一個(gè)做大模型的夢(mèng)想,比如李沐、賈揚(yáng)清等,我們要做的是給他們一個(gè)實(shí)現(xiàn)夢(mèng)想的溫床。

李沐,江湖人稱“沐神”,又被稱為深度學(xué)習(xí)界的“米其林”,是硅谷華人技術(shù)大神,深度學(xué)習(xí)框架MXNet創(chuàng)始人之一。

公開資料顯示,李沐2008年畢業(yè)于上海交通大學(xué)計(jì)算機(jī)系,大學(xué)期間,曾在微軟亞洲研究院擔(dān)任實(shí)習(xí)生。2011年4月-2012年8月,李沐在百度擔(dān)任高級(jí)研究員,后進(jìn)入卡耐基梅隆大學(xué)(CMU)讀博,師從Alex Smola和Dave Andersen。2017年CMU博士畢業(yè)后,李沐加入亞馬遜成為資深首席科學(xué)家。

李沐的主要研究興趣集中在大規(guī)模機(jī)器學(xué)習(xí),尤其是大規(guī)模分布式系統(tǒng)和機(jī)器學(xué)習(xí)算法的協(xié)同設(shè)計(jì)。李沐曾以第一作者的身份在計(jì)算機(jī)科學(xué)領(lǐng)域的大會(huì)以及期刊上發(fā)表了多篇論文,包括跨度理論(FOCS)、機(jī)器學(xué)習(xí)(NIPS、ICML)、應(yīng)用層面(CVPR、KDD)、操作系統(tǒng)(OSDI)等方向。

此外,李沐還是B站的一位UP主,注冊(cè)了“跟著李沐學(xué)AI”這一賬號(hào),通過(guò)視頻向大家介紹各種AI知識(shí),制作了幾十篇論文的精讀課程。不少同學(xué)跟著他養(yǎng)成了精讀論文的習(xí)慣。

李沐不僅是一位學(xué)霸,一位不錯(cuò)的老師,他在創(chuàng)業(yè)上也有這一定的經(jīng)驗(yàn)和心得。

李沐在CMU讀博期間,恰逢國(guó)內(nèi)創(chuàng)業(yè)熱潮,他在國(guó)內(nèi)的好友戴文淵、余凱等人紛紛加入創(chuàng)業(yè)大軍,受此影響,大洋彼岸的李沐與導(dǎo)師Alex Smola、同學(xué)等5人也體驗(yàn)了一把創(chuàng)業(yè)。他們創(chuàng)辦了數(shù)據(jù)分析算法公司 Marianas Labs,Alex Smol 教授擔(dān)任 CEO,李沐擔(dān)任 CTO。后來(lái)這家公司被收購(gòu)了。

“在學(xué)術(shù)界,當(dāng)你有一個(gè)想法,馬上就可以開始操作,并且只需要把想法實(shí)現(xiàn),大概完成 90% 的工作就好;而在工業(yè)界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能會(huì)花費(fèi)你 90% 的精力?!薄岸鴦?chuàng)業(yè),需要考慮的事情就更復(fù)雜了,除了要思考如何把想法落地,還需要考慮團(tuán)隊(duì)的合作、人員的調(diào)配,要決定團(tuán)隊(duì)的發(fā)展方向,分析整個(gè)工業(yè)環(huán)境的發(fā)展趨勢(shì)等”,李沐曾談到。

2016年7月,Alex Smola重返工業(yè)界,加入亞馬遜,后來(lái)在AWS 擔(dān)任副總裁級(jí)別的科學(xué)家,李沐也追隨導(dǎo)師,加入亞馬遜,離職前做到了AWS資深高級(jí)科學(xué)家。

還有最新加入大模型的阿里的兩位AI科學(xué)家。賈揚(yáng)清,本科和研究生階段就讀于清華大學(xué)自動(dòng)化專業(yè),后赴加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)博士。他在博士期間創(chuàng)立并開源了如今業(yè)內(nèi)目熟能詳?shù)纳疃葘W(xué)習(xí)框架Caffe,被微軟、雅虎英偉達(dá)、Adobe等公司采用。2019年3月,賈揚(yáng)清正式加入阿里巴巴,擔(dān)任技術(shù)副總裁崗位,領(lǐng)導(dǎo)大數(shù)據(jù)計(jì)算平臺(tái)的研發(fā)工作。

楊紅霞畢業(yè)于南開大學(xué)、杜克大學(xué)統(tǒng)計(jì)科學(xué)系,師從著名統(tǒng)計(jì)學(xué)家David Dunson。她在人工智能領(lǐng)域國(guó)際會(huì)議、頂級(jí)期刊有近百篇頁(yè)級(jí)論文。

楊紅霞曾是阿里達(dá)摩院超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的技術(shù)負(fù)責(zé)人,M6是阿里巴巴達(dá)摩院研發(fā)的超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型。

楊紅霞曾帶領(lǐng)M6大模型從百億級(jí)進(jìn)化到千億、再到萬(wàn)億的參數(shù)量,并且主導(dǎo)認(rèn)知智能技術(shù)的發(fā)展和場(chǎng)景落地。2021年3月,M6大模型首次發(fā)布到2021年底,阿里云發(fā)布M6最新進(jìn)展時(shí),其參數(shù)已至10萬(wàn)億,成為當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。

隨著越來(lái)越多的人加入大模型創(chuàng)業(yè),可以發(fā)現(xiàn),無(wú)論在國(guó)內(nèi)還是在國(guó)外,我們AI技術(shù)方面的人才并不在少數(shù),然而實(shí)際的結(jié)果卻是,我們并沒(méi)有率先做出自己的大模型出來(lái),這再次將我們一直以來(lái)的短板暴露出來(lái),我們是個(gè)很好的追隨者,但是做不了領(lǐng)先者。

如何改變這一局面呢?

03 ChatGPT會(huì)誕生在哪里?巨頭還是創(chuàng)業(yè)公司

想做領(lǐng)先者,不可忽視創(chuàng)業(yè)公司的作用。

在ChatGPT出來(lái)之前,很多國(guó)內(nèi)的投資人都認(rèn)為,這種沒(méi)有落地場(chǎng)景的底層技術(shù)只有巨頭才能玩,創(chuàng)業(yè)公司參與就是自尋死路,在他們看來(lái),巨頭在技術(shù)研發(fā)上的積累遠(yuǎn)超創(chuàng)業(yè)公司,在數(shù)據(jù)和算法資源也是遙遙領(lǐng)先,在資金和人才的儲(chǔ)備上也占盡優(yōu)勢(shì),甚至在管理能力方面都是成熟的,然而現(xiàn)實(shí)卻打臉了。

谷歌作為全球AI領(lǐng)域的領(lǐng)路人,一直被寄予厚望,然而突然殺出一個(gè)OpenAI,這著實(shí)讓它有點(diǎn)措手不及,同時(shí)在美國(guó)的其他巨頭中也沒(méi)有誕生出ChatGPT。

同樣在中國(guó),百度主攻AI多年,據(jù)稱,許多百度內(nèi)部的員工都不信百度能做好文心一言。

這一方面說(shuō)明,一個(gè)龐大的企業(yè)機(jī)器,雖然有著投資人所以為的諸多優(yōu)勢(shì),但由于內(nèi)部人際關(guān)系復(fù)雜,問(wèn)題盤根錯(cuò)節(jié),這造成了人浮于事,效率低下等問(wèn)題;另一方面,相比創(chuàng)業(yè)公司的孤注一擲,巨頭有著穩(wěn)定的現(xiàn)金流業(yè)務(wù),這也會(huì)讓企業(yè)家對(duì)新業(yè)務(wù)的重視程度不夠。此外,巨頭最缺的是創(chuàng)業(yè)團(tuán)隊(duì)對(duì)項(xiàng)目的熱情和成功的渴望,而這也是能否成為領(lǐng)先最關(guān)鍵的因素。

不少人覺(jué)得,高調(diào)進(jìn)入AI大模型創(chuàng)業(yè)就是為了蹭熱點(diǎn)、圈錢,真正踏踏實(shí)實(shí)做事的少之又少,誠(chéng)然,正如清華大學(xué)新聞學(xué)院教授、博士生導(dǎo)師沈陽(yáng)預(yù)測(cè),未來(lái)AI大模型的市場(chǎng)格局是ChatGPT一家,開源一家,中國(guó)一家,三分天下,這個(gè)行業(yè)必然是九死一生的,但是最后誰(shuí)是留下來(lái)的幸運(yùn)兒,誰(shuí)又能知道呢?

從個(gè)人投資者來(lái)說(shuō),不投九死一生的行業(yè)可以理解,但是從全國(guó)整體來(lái)說(shuō),我們需要敢于做夢(mèng)的投資家、企業(yè)家,畢竟OpenAI也是美國(guó)數(shù)位富豪喂出來(lái)的。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

阿里接連“痛失”兩員大將,都去搞大模型了

每一個(gè)AI科學(xué)家都有一個(gè)做大模型的夢(mèng)想。

文|融中財(cái)經(jīng) 風(fēng)信子

編輯|吾人

要問(wèn)2023年的創(chuàng)投圈什么最熱鬧,那非ChatGPT莫屬。

除了谷歌、微軟、Meta、百度等這些互聯(lián)網(wǎng)大廠積極加碼AI的投資,不少這些大廠走出來(lái)的高管也紛紛加入到創(chuàng)業(yè)的隊(duì)伍中去,大有重現(xiàn)移動(dòng)互聯(lián)網(wǎng)時(shí)代的創(chuàng)業(yè)熱潮,這不又有幾個(gè)互聯(lián)網(wǎng)大廠的高管出來(lái)創(chuàng)業(yè)了。

近日,亞馬遜首席科學(xué)家李沐,被曝已離職創(chuàng)業(yè),其創(chuàng)業(yè)項(xiàng)目,名為Boson.ai,從官網(wǎng)信息來(lái)看,創(chuàng)業(yè)內(nèi)容與大模型應(yīng)用有關(guān)。目前李沐尚未官宣,但在Boson.ai的GitHub項(xiàng)目主頁(yè)中,已經(jīng)能看見(jiàn)他的身影。

就好像王興找上老同學(xué)王慧文開啟大模型創(chuàng)業(yè)一樣,這次李沐是與其導(dǎo)師Alex Smola一起創(chuàng)業(yè)的,Alex Smola曾任亞馬遜副總裁,是位杰出的AI科學(xué)家,目前任Boson.ai的CEO。

有傳聞稱阿里VP賈揚(yáng)清將離職創(chuàng)業(yè),計(jì)劃創(chuàng)業(yè)的方向是AIInfra(AI架構(gòu)),屬于是AI基礎(chǔ)設(shè)施提供商,關(guān)注包括大模型在內(nèi)的AI應(yīng)用。具體而言是要打造一個(gè)統(tǒng)一、多云和可觀察的人工智能平臺(tái)。目標(biāo)是提升人工智能產(chǎn)品化的效率,包括開發(fā)者效率和系統(tǒng)效率兩個(gè)方面。通過(guò)端到端的解決方案,來(lái)幫助企業(yè)和開發(fā)者高效部署人工智能。

僅隔一天,阿里再失一員AI大將。據(jù)悉,阿里M6大模型的前帶頭人楊紅霞已加入字節(jié)AILab(人工智能實(shí)驗(yàn)室),參與語(yǔ)言生成大模型的研發(fā)。

除此之外,據(jù)不完全統(tǒng)計(jì),AI大模型領(lǐng)域已經(jīng)集結(jié)了前美團(tuán)聯(lián)合創(chuàng)始人王慧文,原京東集團(tuán)技術(shù)委員會(huì)主席、云與 AI 總裁,京東人工智能研究院院長(zhǎng)周伯文,前搜狗CEO王小川,快手前AI核心人物李巖等。

3月20日,創(chuàng)新工場(chǎng)董事長(zhǎng)兼首席執(zhí)行官李開復(fù),轉(zhuǎn)型投資人多年的他,宣布將籌組名為“AI2.0”的項(xiàng)目。創(chuàng)新工場(chǎng)也將“Project AI 2.0”(AI2.0項(xiàng)目)掛到了官網(wǎng)首頁(yè),并表示將在全球范圍尋找具有 AI 大模型、NLP(語(yǔ)言生成模型)、Multi-modality(多模態(tài))等領(lǐng)域能力的優(yōu)秀技術(shù)人和研究員。這意味著,李開復(fù)要親自帶隊(duì)投入大模型創(chuàng)業(yè)中去了。

看到曾經(jīng)最優(yōu)秀的一批創(chuàng)業(yè)者投身AI大模型創(chuàng)業(yè),無(wú)疑是振奮人心的,然而我們要思考的是為什么ChatGPT沒(méi)有誕生在中國(guó),開發(fā)我們自己的ChatGPT到底需要什么?

01 為什么ChatGPT沒(méi)有誕生在中國(guó)?

ChatGPT的誕生讓世界為之震驚,也讓創(chuàng)投圈為之瘋狂,不少國(guó)人也為ChatGPT沒(méi)有誕生在中國(guó)而感到失落。

近幾個(gè)月,關(guān)于老外在用ChatGPT寫論文,寫工作總結(jié),寫各種報(bào)告等新聞不絕于耳,國(guó)人垂涎已久,盡管百度以最快的速度推出了號(hào)稱中國(guó)版的ChatGPT文心一言,然而無(wú)論是來(lái)自用戶還是投資者的反饋都不是滿意,甚至有人調(diào)侃,百度的文心一言發(fā)布會(huì)硬生生搞成了招商大會(huì)。發(fā)布會(huì)期間,百度股價(jià)一度閃崩,這不禁讓國(guó)內(nèi)再度發(fā)出疑問(wèn),百度做AI也有10年了,為什么它沒(méi)有率先做出ChatGPT,為什么ChatGPT沒(méi)有誕生在中國(guó)?

有不少專家從技術(shù)、法律等角度分析原因,他們認(rèn)為中國(guó)之所以沒(méi)有誕生ChatGPT主要是因?yàn)橐韵聨讉€(gè)原因:

華東政法大學(xué)政治學(xué)研究院院長(zhǎng)、人工智能與大數(shù)據(jù)指數(shù)研究院院長(zhǎng)高奇琦教授認(rèn)為,通用大模型是一個(gè)系統(tǒng)工程,算法、數(shù)據(jù)和算力這三個(gè)因素至關(guān)重要。目前,我們的差距主要集中在數(shù)據(jù)和算力。數(shù)據(jù)方面,英文互聯(lián)網(wǎng)上的數(shù)據(jù)質(zhì)量相對(duì)比較高,也更易于清洗。ChatGPT之所以問(wèn)題回答得好,很重要的原因就在于英文互聯(lián)網(wǎng)上有大量比較準(zhǔn)確的知識(shí)類信息,可以用于模型訓(xùn)練。中文互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)也很多,但質(zhì)量還有差距,加之國(guó)內(nèi)的數(shù)據(jù)大量?jī)?chǔ)存于移動(dòng)端APP中,數(shù)據(jù)比較難抓取,而互聯(lián)網(wǎng)巨頭之間的數(shù)據(jù)又是相互封閉的,數(shù)據(jù)孤島化的情況也比較嚴(yán)重。算力是另一個(gè)巨大的挑戰(zhàn),ChatGPT需要至少3萬(wàn)張英偉達(dá)A100卡的算力,這是巨大的一筆投入。

除此之外,還有人從政策法規(guī)的角度進(jìn)行了分析,他們認(rèn)為,為了避免人工智能技術(shù)可能帶來(lái)的潛在風(fēng)險(xiǎn)和威脅,中國(guó)國(guó)家和市級(jí)政府都出臺(tái)了一系列的人工智能技術(shù)規(guī)范和管理?xiàng)l例。這些規(guī)定對(duì)于ChatGPT這樣依賴深度學(xué)習(xí)技術(shù),可能涉及到數(shù)據(jù)保護(hù)和隱私保護(hù)等方面的技術(shù)提出了嚴(yán)格要求,需要滿足一系列的審批和認(rèn)證流程。

筆者從創(chuàng)投的角度分析,認(rèn)為中國(guó)之所以沒(méi)率先落地ChatGPT,一方面是國(guó)內(nèi)許多企業(yè)家對(duì)新技術(shù)缺乏敏感性,另一方面是國(guó)內(nèi)的投資人對(duì)底層技術(shù)的長(zhǎng)期不重視。

雖然不少國(guó)人紛紛舉手要進(jìn)行大模型創(chuàng)業(yè),立志要做出中國(guó)版的ChatGPT,然而俞敏洪卻指出了一個(gè)扎心的事實(shí)。近日,他在第23屆亞布力中國(guó)企業(yè)家論壇上說(shuō)道,“ChatGPT已討論兩個(gè)月了,有多少企業(yè)家玩過(guò)ChatGPT?”在他看來(lái),沒(méi)玩過(guò)ChatGPT的企業(yè)家,沒(méi)資格談?wù)摳呖萍己臀磥?lái)企業(yè)的走向,對(duì)于企業(yè)家來(lái)說(shuō),年齡不是問(wèn)題,思想的僵化和行動(dòng)的僵化才是問(wèn)題,不接受新鮮事物才是問(wèn)題。

知名互聯(lián)網(wǎng)學(xué)者劉興亮在一檔節(jié)目中被主持人問(wèn)到,為什么ChatGPT沒(méi)有誕生在中國(guó),他用一句話回答了這個(gè)問(wèn)題,即美國(guó)人在創(chuàng)新、中國(guó)人在應(yīng)用、歐洲人在立法。

俞敏洪與劉興亮分別揭示了國(guó)內(nèi)面對(duì)新技術(shù)不同層面的態(tài)度,俞敏洪指出了,中國(guó)企業(yè)家對(duì)于新興技術(shù)缺乏足夠的熱情,對(duì)于新事物缺乏思想上的接受能力以及相應(yīng)的行動(dòng)力,這也引發(fā)了中國(guó)的ChatGPT到底會(huì)在互聯(lián)網(wǎng)大廠誕生還是在創(chuàng)業(yè)企業(yè)誕生的討論。

劉興亮的回答也反映出一個(gè)問(wèn)題,即我國(guó)的創(chuàng)業(yè)項(xiàng)目有著太強(qiáng)的功利性,凡是不能快速變現(xiàn)或者暫時(shí)落地場(chǎng)景不明朗的項(xiàng)目很難得到投資人的青睞,這也讓我們忽略了許多底層技術(shù)的創(chuàng)業(yè)機(jī)會(huì),而恰恰是底層技術(shù)才是能夠“卡脖子”的地方。

所以,中國(guó)缺的不是能做出ChatGPT的技術(shù)人才,而是能夠孵化ChatGPT的環(huán)境土壤。

02 中國(guó)不缺技術(shù)人才,缺的是優(yōu)秀的企業(yè)家

每一個(gè)AI科學(xué)家都有一個(gè)做大模型的夢(mèng)想,比如李沐、賈揚(yáng)清等,我們要做的是給他們一個(gè)實(shí)現(xiàn)夢(mèng)想的溫床。

李沐,江湖人稱“沐神”,又被稱為深度學(xué)習(xí)界的“米其林”,是硅谷華人技術(shù)大神,深度學(xué)習(xí)框架MXNet創(chuàng)始人之一。

公開資料顯示,李沐2008年畢業(yè)于上海交通大學(xué)計(jì)算機(jī)系,大學(xué)期間,曾在微軟亞洲研究院擔(dān)任實(shí)習(xí)生。2011年4月-2012年8月,李沐在百度擔(dān)任高級(jí)研究員,后進(jìn)入卡耐基梅隆大學(xué)(CMU)讀博,師從Alex Smola和Dave Andersen。2017年CMU博士畢業(yè)后,李沐加入亞馬遜成為資深首席科學(xué)家。

李沐的主要研究興趣集中在大規(guī)模機(jī)器學(xué)習(xí),尤其是大規(guī)模分布式系統(tǒng)和機(jī)器學(xué)習(xí)算法的協(xié)同設(shè)計(jì)。李沐曾以第一作者的身份在計(jì)算機(jī)科學(xué)領(lǐng)域的大會(huì)以及期刊上發(fā)表了多篇論文,包括跨度理論(FOCS)、機(jī)器學(xué)習(xí)(NIPS、ICML)、應(yīng)用層面(CVPR、KDD)、操作系統(tǒng)(OSDI)等方向。

此外,李沐還是B站的一位UP主,注冊(cè)了“跟著李沐學(xué)AI”這一賬號(hào),通過(guò)視頻向大家介紹各種AI知識(shí),制作了幾十篇論文的精讀課程。不少同學(xué)跟著他養(yǎng)成了精讀論文的習(xí)慣。

李沐不僅是一位學(xué)霸,一位不錯(cuò)的老師,他在創(chuàng)業(yè)上也有這一定的經(jīng)驗(yàn)和心得。

李沐在CMU讀博期間,恰逢國(guó)內(nèi)創(chuàng)業(yè)熱潮,他在國(guó)內(nèi)的好友戴文淵、余凱等人紛紛加入創(chuàng)業(yè)大軍,受此影響,大洋彼岸的李沐與導(dǎo)師Alex Smola、同學(xué)等5人也體驗(yàn)了一把創(chuàng)業(yè)。他們創(chuàng)辦了數(shù)據(jù)分析算法公司 Marianas Labs,Alex Smol 教授擔(dān)任 CEO,李沐擔(dān)任 CTO。后來(lái)這家公司被收購(gòu)了。

“在學(xué)術(shù)界,當(dāng)你有一個(gè)想法,馬上就可以開始操作,并且只需要把想法實(shí)現(xiàn),大概完成 90% 的工作就好;而在工業(yè)界,想法不是最重要的,重要的是要把想法落地,剩下的那10% 的工作才是最重要的,甚至可能會(huì)花費(fèi)你 90% 的精力?!薄岸鴦?chuàng)業(yè),需要考慮的事情就更復(fù)雜了,除了要思考如何把想法落地,還需要考慮團(tuán)隊(duì)的合作、人員的調(diào)配,要決定團(tuán)隊(duì)的發(fā)展方向,分析整個(gè)工業(yè)環(huán)境的發(fā)展趨勢(shì)等”,李沐曾談到。

2016年7月,Alex Smola重返工業(yè)界,加入亞馬遜,后來(lái)在AWS 擔(dān)任副總裁級(jí)別的科學(xué)家,李沐也追隨導(dǎo)師,加入亞馬遜,離職前做到了AWS資深高級(jí)科學(xué)家。

還有最新加入大模型的阿里的兩位AI科學(xué)家。賈揚(yáng)清,本科和研究生階段就讀于清華大學(xué)自動(dòng)化專業(yè),后赴加州大學(xué)伯克利分校攻讀計(jì)算機(jī)科學(xué)博士。他在博士期間創(chuàng)立并開源了如今業(yè)內(nèi)目熟能詳?shù)纳疃葘W(xué)習(xí)框架Caffe,被微軟、雅虎英偉達(dá)、Adobe等公司采用。2019年3月,賈揚(yáng)清正式加入阿里巴巴,擔(dān)任技術(shù)副總裁崗位,領(lǐng)導(dǎo)大數(shù)據(jù)計(jì)算平臺(tái)的研發(fā)工作。

楊紅霞畢業(yè)于南開大學(xué)、杜克大學(xué)統(tǒng)計(jì)科學(xué)系,師從著名統(tǒng)計(jì)學(xué)家David Dunson。她在人工智能領(lǐng)域國(guó)際會(huì)議、頂級(jí)期刊有近百篇頁(yè)級(jí)論文。

楊紅霞曾是阿里達(dá)摩院超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型M6的技術(shù)負(fù)責(zé)人,M6是阿里巴巴達(dá)摩院研發(fā)的超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型。

楊紅霞曾帶領(lǐng)M6大模型從百億級(jí)進(jìn)化到千億、再到萬(wàn)億的參數(shù)量,并且主導(dǎo)認(rèn)知智能技術(shù)的發(fā)展和場(chǎng)景落地。2021年3月,M6大模型首次發(fā)布到2021年底,阿里云發(fā)布M6最新進(jìn)展時(shí),其參數(shù)已至10萬(wàn)億,成為當(dāng)時(shí)全球最大的AI預(yù)訓(xùn)練模型。

隨著越來(lái)越多的人加入大模型創(chuàng)業(yè),可以發(fā)現(xiàn),無(wú)論在國(guó)內(nèi)還是在國(guó)外,我們AI技術(shù)方面的人才并不在少數(shù),然而實(shí)際的結(jié)果卻是,我們并沒(méi)有率先做出自己的大模型出來(lái),這再次將我們一直以來(lái)的短板暴露出來(lái),我們是個(gè)很好的追隨者,但是做不了領(lǐng)先者。

如何改變這一局面呢?

03 ChatGPT會(huì)誕生在哪里?巨頭還是創(chuàng)業(yè)公司

想做領(lǐng)先者,不可忽視創(chuàng)業(yè)公司的作用。

在ChatGPT出來(lái)之前,很多國(guó)內(nèi)的投資人都認(rèn)為,這種沒(méi)有落地場(chǎng)景的底層技術(shù)只有巨頭才能玩,創(chuàng)業(yè)公司參與就是自尋死路,在他們看來(lái),巨頭在技術(shù)研發(fā)上的積累遠(yuǎn)超創(chuàng)業(yè)公司,在數(shù)據(jù)和算法資源也是遙遙領(lǐng)先,在資金和人才的儲(chǔ)備上也占盡優(yōu)勢(shì),甚至在管理能力方面都是成熟的,然而現(xiàn)實(shí)卻打臉了。

谷歌作為全球AI領(lǐng)域的領(lǐng)路人,一直被寄予厚望,然而突然殺出一個(gè)OpenAI,這著實(shí)讓它有點(diǎn)措手不及,同時(shí)在美國(guó)的其他巨頭中也沒(méi)有誕生出ChatGPT。

同樣在中國(guó),百度主攻AI多年,據(jù)稱,許多百度內(nèi)部的員工都不信百度能做好文心一言。

這一方面說(shuō)明,一個(gè)龐大的企業(yè)機(jī)器,雖然有著投資人所以為的諸多優(yōu)勢(shì),但由于內(nèi)部人際關(guān)系復(fù)雜,問(wèn)題盤根錯(cuò)節(jié),這造成了人浮于事,效率低下等問(wèn)題;另一方面,相比創(chuàng)業(yè)公司的孤注一擲,巨頭有著穩(wěn)定的現(xiàn)金流業(yè)務(wù),這也會(huì)讓企業(yè)家對(duì)新業(yè)務(wù)的重視程度不夠。此外,巨頭最缺的是創(chuàng)業(yè)團(tuán)隊(duì)對(duì)項(xiàng)目的熱情和成功的渴望,而這也是能否成為領(lǐng)先最關(guān)鍵的因素。

不少人覺(jué)得,高調(diào)進(jìn)入AI大模型創(chuàng)業(yè)就是為了蹭熱點(diǎn)、圈錢,真正踏踏實(shí)實(shí)做事的少之又少,誠(chéng)然,正如清華大學(xué)新聞學(xué)院教授、博士生導(dǎo)師沈陽(yáng)預(yù)測(cè),未來(lái)AI大模型的市場(chǎng)格局是ChatGPT一家,開源一家,中國(guó)一家,三分天下,這個(gè)行業(yè)必然是九死一生的,但是最后誰(shuí)是留下來(lái)的幸運(yùn)兒,誰(shuí)又能知道呢?

從個(gè)人投資者來(lái)說(shuō),不投九死一生的行業(yè)可以理解,但是從全國(guó)整體來(lái)說(shuō),我們需要敢于做夢(mèng)的投資家、企業(yè)家,畢竟OpenAI也是美國(guó)數(shù)位富豪喂出來(lái)的。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。