文|投資界PEdaily
今天(11月6日),由李開復創(chuàng)辦的AI公司——零一萬物,正式發(fā)布了首款開源中英雙語大模型“Yi”。投資界獲悉,零一萬物新一輪融資由阿里云領投,估值已超10億美元,躋身AI 2.0 獨角獸行列。
創(chuàng)投圈對李開復并不陌生。計算機科學家出身,他的職業(yè)生涯起步于硅谷,先后任職于微軟、谷歌等,后來創(chuàng)立了創(chuàng)新工場,以投資AI為人熟知。今年初,李開復宣布籌組零一萬物,歷經5個月時間,零一萬物團隊在今天現場亮相,大牛云集。
至此,AI公司融資一浪接一浪。僅僅過去一個月,智譜AI宣布今年累計獲得超25億人民幣融資;王小川的百川智能也宣布完成3億美元融資.....投資人用腳投票,幾乎所有局中人都篤信:這是一張通往未來的船票。
李開復帶隊,又一AI獨角獸揭開神秘面紗
今天交流會上,李開復率隊發(fā)布了Yi系列模型。
據悉,Yi系列模型包含34B和6B兩個版本。兩者的區(qū)別在于,Yi-6B適合個人及研究用途,而Yi-34B已經具備大模型涌現能力,適合發(fā)揮于多元場景,滿足開源社區(qū)的剛性需求。兩者目前都已開放免費商用申請。
其中,Yi-34B數據參數量達到340億,可支持200K超長上下文窗口,可以處理約40萬漢字超長文本輸入,是目前全球最長版本。
相比之下,OpenAI的GPT-4上下文窗口只有32K,文字處理量約2.5萬字。稍早前,由王小川創(chuàng)辦的百川智能發(fā)布Baichuan2-192K大模型,其上下文窗口長度達192K,一度成為全球最長的上下文窗口。僅僅過去一周,這一記錄再次被刷新。
為何在這一領域的競爭如此激烈?實際上,上下文窗口長度是大模型的核心技術之一。通俗來講,上下文窗口越大,窗口所能容納的信息就越多,從而可以結合更多上下文內容獲取更豐富的語義信息,不僅生成的信息準確度更高,而且應用范圍更為廣泛。
所以,如何把上下文窗口做得更大,成為各家公司比拼的戰(zhàn)場。而Yi-34B的突破,相當于能一次處理兩本《三體》小說、理解超過1000頁的PDF文檔等場景,將成為首家將超長上下文窗口在開源社區(qū)開放的大模型公司。
另一個突破則在于訓練成本大幅降低。零一萬物給出一組數據:Yi-34B模型訓練成本實測下降40%,實際訓練完成達標時間與預測的時間誤差不到一小時,進一步模擬上到千億規(guī)模訓練成本可下降多達50%。
截止目前,Yi系列模型已在 Hugging Face、ModelScope、GitHub 三大全球開源社區(qū)平臺正式上線,同時開放商用申請。這也是創(chuàng)立至今不到8個月時間里,零一萬物交出的第一份答卷。
那么,背后是一支怎樣的團隊?
早在今年3月,李開復宣布創(chuàng)業(yè)時,便親自下場搶人:“在全球范圍號召世界級人才”。今天的發(fā)布會上,零一萬物團隊首度亮相——
團隊成員中,技術副總裁及AI Alignment負責人是 Google Bard/Assistant 早期核心成員,主導或參與了從 Bert、LaMDA 到大模型在多輪對話、個人助理、AI Agent 等多個方向的研究和工程落地;首席架構師曾在Google Brain與Jeff Dean、Samy Bengio等合作,為TensorFlow的核心創(chuàng)始成員之一。
而算法和模型團隊成員中,有論文曾被GPT-4引用的算法大拿,有獲得過微軟內部研究大獎的優(yōu)秀研究員,曾獲得過阿里CEO特別獎的超級工程師??傆嬙贗CLR、NeurIPS、CVPR、ICCV等知名學術會議上發(fā)表過大模型相關學術論文100余篇。
作為主力戰(zhàn)將之一,零一萬物技術副總裁及 Pretrain 負責人黃文灝、技術副總裁及AI Infra負責人戴宗宏今天也正式亮相,并對最新產品進行介紹。此前,黃文灝曾先后任職于微軟亞洲研究院和智源研究院;戴宗宏則是前華為云 AI CTO 及技術創(chuàng)新部長、前阿里達摩院 AI Infra 總監(jiān)。
團隊集結,融資也正在到位。投資界獲悉,零一萬物已完成新一輪融資,由阿里云領投,估值已超10億美元。李開復透露,在完成 Yi-34B 預訓練的同時,目前零一萬物已經啟動下一個千億參數模型的訓練。
AI公司最近排隊宣布融資
放眼一級市場,AI大模型賽道沒有最火只有更火。
就在剛剛過去的10月,智譜AI宣布今年累計獲得超25億人民幣融資,投資方陣容豪華,囊括了社保基金中關村自主創(chuàng)新基金(君聯資本為基金管理人)、美團、螞蟻、阿里、騰訊、小米、金山、順為、Boss直聘、好未來、紅杉、高瓴等多家機構及包括君聯資本在內的部分老股東跟投。
這是一家從清華實驗室走出來的大模型公司,身后集結了一群清華大牛——CEO張鵬畢業(yè)于清華計算機系,總裁王紹蘭為清華創(chuàng)新領軍博士,清華大學計算系教授唐杰也參與了孵化。
無獨有偶,百川智能也宣布完成3億美元A1輪融資,阿里、騰訊再度聯手,小米也參投了本輪融資,公司躋身科技獨角獸行列,創(chuàng)下國內大模型初創(chuàng)企業(yè)最快晉升獨角獸的記錄。此外,深創(chuàng)投、基石資本、紅點中國、卓源資本、順為資本等知名機構也紛紛參與。
百川智能的創(chuàng)始人,王小川。1996年,王小川被點招入清華大學計算機系,研究生畢業(yè)后便加入搜狐。從搜狐到搜狗,王小川在互聯網時代留下了不少記憶。直到今年4月,他官宣自己的大模型創(chuàng)業(yè)之旅,旨在打造中國版OpenAI。
還有大模型初創(chuàng)公司月之暗面——由清華大學交叉信息學院、智源青年科學家楊植麟教授領銜,兩位聯合創(chuàng)始人周昕宇和吳育昕也均出身清華。投資界獲悉,公司已獲得紅杉、今日資本、礪思資本、真格基金等知名機構近20億元投資。
幾乎同一時間,九章云極DataCanvas也宣布完成總融資額3億元D1輪融資。中國電子集團旗下中電智慧基金、華民投、中國太平旗下太平創(chuàng)新、浙江東方旗下東方嘉富等央國企旗下投資機構,以及卓源資本等專注人工智能賽道的知名財務投資機構參與本輪融資。
稍早前的6月份,消息傳出,聚焦通用大模型的中國AI創(chuàng)企MiniMax接近完成規(guī)模超2.5億美元的一輪融資,估值有望達到近12億美元。MiniMax的最新一輪融資吸引到新的投資方,出現騰訊的身影。此前,MiniMax的融資中吸引到米哈游、云啟資本、明勢資本等。這也是大模型浪潮以來,騰訊被曝光的首次投資出手。
從目前來看,今年AI領域清華系幾乎一騎絕塵,出身清華的創(chuàng)始人排隊宣布融資;與此同時,自上海交大、中國科大的AI創(chuàng)業(yè)者同樣十分活躍,大家共同締造了AI江湖熱鬧一幕。
創(chuàng)投圈最火爆的一幕
今年一級市場格外冷清,但AI融資轟轟烈烈。為何大家似乎都奮不顧身?
稍早前,君聯資本總裁李家慶分享:“人工智能產業(yè)處于快速發(fā)展階段,商業(yè)化場景正從實驗室走向產業(yè)化生產,人工智能技術將實現從感知智能到認知智能的新突破,在科技情報、虛擬數字人等領域,基于認知智能搭建的行業(yè)通用平臺市場空間巨大。”
他判斷,“大模型+大算力”是邁向通用人工智能的可行路徑,未來基于大模型形成的變革性AI產業(yè)基礎設施將改變當前單一模型對應單一任務的人工智能研發(fā)范式,多模態(tài)大模型將成為不同領域的共性平臺技術。
而順為合伙人程天也表示:“隨著數字化和智能化時代的到來,生成式 AI 通用模型逐漸成為新一輪科技創(chuàng)新的焦點。模型之于現代科技產品,猶如核心技術的‘心臟’,承載著信息處理和智能決策的重要功能?!?/p>
“AI 2.0是有史以來最大的科技革命?!闭缋铋_復堅信,它帶來的改變世界的最大機會一定是平臺和技術,正如PC時代的微軟Office,移動互聯網時代的微信、抖音、美團一樣,商業(yè)化爆發(fā)式增長概率最高的一定是ToC應用。
與此同時,AI的戰(zhàn)火已在城市中蔓延開來——北京、上海、深圳等超一線城市全面發(fā)力,爭搶之勢躍然紙上??梢钥吹?,由ChatGPT掀起的AI浪潮正席卷全球,沒有人愿意錯過這場科技盛宴。
回想半年前,王興曾在朋友圈留下一句,“AI大模型讓我既興奮于即將創(chuàng)造出來的巨大生產力,又憂慮它未來對整個世界的沖擊。”言外之意,那是一個未知且嶄新的世界。
路漫漫其修遠兮,吾將上下而求索。用投資人的話來說,中國需要誕生自己的OpenAI,也終將誕生屬于自己的OpenAI。而在這條未知路上,一批批來自不同背景的國產AI軍團,從四面八方趕來,共同投身到這場歷史洪流之中。