文|獵云網(wǎng) 王非
大模型領(lǐng)域,一家“隱形獨(dú)角獸”,正在悄然成長(zhǎng)。
緊隨紅杉、金沙江、徐匯資本之后,百度、騰訊、智譜AI、經(jīng)緯、真格等近日入股了一家大模型算力公司——無(wú)問(wèn)芯穹(Infinigence-AI),投資陣容堪稱豪華。
這家成立于今年5月的新公司,由清華大學(xué)電子工程系系主任汪玉教授坐鎮(zhèn),也是他繼深鑒科技創(chuàng)業(yè)成功后的再次出發(fā),自然引發(fā)了外界的廣泛關(guān)注。
與汪玉攜手創(chuàng)業(yè)的依然是他的學(xué)生曾書霖、戴國(guó)浩等人,而這也意味著,清華系在大模型領(lǐng)域占據(jù)半壁江山后,“再下一城”。
針對(duì)融資細(xì)節(jié)、公司架構(gòu)等相關(guān)問(wèn)題,獵云網(wǎng)向公司法人曾書霖求證,無(wú)問(wèn)芯穹方面表示:“當(dāng)前無(wú)穹融資具體信息不方便透露,一切以官方對(duì)外發(fā)布過(guò)的信息為準(zhǔn);組織架構(gòu)信息同樣,也暫不方便透露。”
值得一提的是,作為上?!巴辽灵L(zhǎng)”的創(chuàng)業(yè)公司,無(wú)問(wèn)芯穹已經(jīng)與徐匯區(qū)完成了相關(guān)項(xiàng)目的簽約。
而在技術(shù)積累上,無(wú)問(wèn)芯穹參與完成的新研究,也已經(jīng)助力其刷新了大模型優(yōu)化紀(jì)錄。
紅杉打頭陣,騰訊百度經(jīng)緯真格等攜手入局
目前,無(wú)問(wèn)芯穹并未官宣過(guò)融資。但此前有市場(chǎng)消息稱,該公司已經(jīng)完成兩輪融資,領(lǐng)投方為紅杉,跟投方有經(jīng)緯、徐匯資本等。
工商變更記錄顯示,早在今年6月,即無(wú)問(wèn)芯穹創(chuàng)立的第二個(gè)月,紅杉就通過(guò)旗下紅創(chuàng)科興(寧波)科技有限公司(下稱:紅創(chuàng)科興),出現(xiàn)在了北京無(wú)問(wèn)芯穹的投資人列表,此次變更為“退出”,或?yàn)楹罄m(xù)轉(zhuǎn)向上海無(wú)問(wèn)芯穹做準(zhǔn)備。
隨后在今年9月,在目前無(wú)問(wèn)芯穹的主體——上海無(wú)問(wèn)芯穹中,紅創(chuàng)科興初次現(xiàn)身,并已是該公司的投資人。
也正是在此時(shí),無(wú)問(wèn)芯穹正式完成了真正意義上的的第一輪融資。
來(lái)源:天眼查
在這一輪投資人(股權(quán))變更中,紅杉又通過(guò)廈門紅杉雅恒股權(quán)投資合伙企業(yè)(有限合伙),加入了無(wú)問(wèn)芯穹投資行列。
與紅杉同時(shí)入股的還包括金沙江、徐匯資本、無(wú)限基金。
值得一提的是,金沙江早在深鑒科技創(chuàng)業(yè)時(shí),就曾連續(xù)參與過(guò)后者的天使輪和A輪融資。此次早早入股無(wú)問(wèn)芯穹,也是金沙江再次押注汪玉。
而徐匯資本的入股,或許早在7月份上海徐匯區(qū)與無(wú)問(wèn)芯穹完成相關(guān)項(xiàng)目的簽約時(shí),就已埋下了伏筆。
最新持股情況顯示,上海無(wú)問(wèn)長(zhǎng)庚企業(yè)管理合伙企業(yè)(有限合伙)為無(wú)問(wèn)芯穹的大股東,直接持股約15.220%。
而紅杉共持有無(wú)問(wèn)芯穹約10.722%股份,系最大外部機(jī)構(gòu)股東;此外,徐匯資本持股約2.315%,金沙江與無(wú)限基金均持股約1.286%。
短短兩個(gè)多月后,無(wú)問(wèn)芯穹于11月30日進(jìn)行了第二次投資人(股權(quán))變更,股東新增騰訊、百度、經(jīng)緯、真格、啟明創(chuàng)投、智譜AI等,投資陣容更加強(qiáng)大。
來(lái)源:天眼查
最新持股情況顯示,騰訊、百度、經(jīng)緯、真格的持股比例及最終受益股份均為1.952%;智譜AI持股比例及最終受益股份則均為0.651%。
今年以來(lái),BAT三家在大模型領(lǐng)域的投資時(shí)有交叉,生數(shù)科技吸引了阿里和百度的入股,智譜AI則獲得了阿里和騰訊的支持。此次投資無(wú)問(wèn)芯穹,或?yàn)轵v訊和百度在大模型領(lǐng)域的首次聯(lián)手。
值得一提的是,智譜AI今年以來(lái)已經(jīng)投資了7家公司,包括聆心智能、面壁智能、冪律智能、集異璧等大模型相關(guān)公司。此次入股無(wú)問(wèn)芯穹,或許與該公司10月份發(fā)布的Z計(jì)劃有關(guān)系,該計(jì)劃旨在為大模型創(chuàng)業(yè)者提供投資+技術(shù)支持,而無(wú)問(wèn)芯穹也正是智譜AI發(fā)布Z計(jì)劃后投資的首家大模型相關(guān)公司。
投資人變更的同時(shí),無(wú)問(wèn)芯穹還新增了多位主要人員。董事備案一欄顯示,在公元、曾書霖、戴國(guó)浩的基礎(chǔ)上,無(wú)問(wèn)芯穹新增周志峰、熊喬喬、曹曦、顏深根為董事。
其中,熊喬喬最早作為監(jiān)事出現(xiàn),目前已變更為李伯勛。
值得一提的是,熊喬喬也是無(wú)問(wèn)芯穹的最大受益所有人,最終受益股份約27.487%。
來(lái)源:天眼查
此外,戴國(guó)浩與顏深根,分別持有無(wú)問(wèn)芯穹8.528%股份。前者的最終受益股份更是高達(dá)22.404%,僅次于熊喬喬,后者的最終受益股份則為8.528%。
清華系主任坐鎮(zhèn),“產(chǎn)學(xué)結(jié)合,師生聯(lián)手”2.0
紅杉早早入局,金沙江繼續(xù)押注,騰訊百度經(jīng)緯真格等一眾互聯(lián)網(wǎng)大廠和頭部VC云集而至,與汪玉有著莫大關(guān)系。
天眼查App顯示,在核心成員一欄中,無(wú)問(wèn)芯穹創(chuàng)始人為汪玉。
汪玉于1998年入學(xué)清華,本碩博均在清華,自2007年開始留校任教。他是清華電子工程系首位80后系主任,也是該系創(chuàng)辦以來(lái)第二年輕系主任。
來(lái)源:清華大學(xué)電子工程系
汪玉長(zhǎng)期從事智能芯片、高能效電路與系統(tǒng)研究,曾多次在頂會(huì)拿下最佳論文獎(jiǎng),共發(fā)表IEEE/ACM雜志文章50余篇,谷歌學(xué)術(shù)引用17000余次。
2016年1月,以汪玉為負(fù)責(zé)人的深度學(xué)習(xí)處理器項(xiàng)目,通過(guò)清華大學(xué)電子信息學(xué)院論證并獲得支持。之后,項(xiàng)目團(tuán)隊(duì)以研究成果“卷積神經(jīng)網(wǎng)絡(luò)的逐層變精度定點(diǎn)化方法及裝置”作價(jià)入股AI芯片公司深鑒科技,進(jìn)行產(chǎn)業(yè)化運(yùn)營(yíng)。
汪玉的學(xué)生,姚頌、單羿正是深鑒科技的創(chuàng)始成員,這也是他首次與學(xué)生攜手創(chuàng)業(yè)。
2018年,深鑒科技被FPGA廠商賽靈思收購(gòu)。汪玉與合伙人旋即,共同向母校清華大學(xué)捐贈(zèng)了500萬(wàn)美元。
此次創(chuàng)辦無(wú)問(wèn)芯穹,也是汪玉繼深鑒科技后,又一次“產(chǎn)學(xué)結(jié)合,師生聯(lián)手”。目前公開的兩名學(xué)生,分別為曾書霖和戴國(guó)浩。
首先,曾書霖是北京無(wú)問(wèn)芯穹(成立于5月8日)、上海無(wú)問(wèn)芯穹(成立于5月31日)這兩家公司的法定代表人。在無(wú)問(wèn)芯穹核心成員一欄中,他僅作為執(zhí)行董事&總經(jīng)理出現(xiàn)。但在主要人員列表中,他的職位是董事長(zhǎng)、總經(jīng)理、財(cái)務(wù)負(fù)責(zé)人。
公開資料顯示,2014年,來(lái)自廣西南寧的“數(shù)學(xué)學(xué)霸”曾書霖順利進(jìn)入清華大學(xué)電子工程系。2018年,他開啟了博士學(xué)位學(xué)習(xí)生涯,導(dǎo)師就是汪玉,主要研究方向是基于FPGA的神經(jīng)網(wǎng)絡(luò)加速器設(shè)計(jì)、軟硬件協(xié)同優(yōu)化、云端硬件虛擬化、大規(guī)模異構(gòu)計(jì)算等。
2017-2019年,曾書霖曾在深鑒FPGA硬件組當(dāng)過(guò)兩年實(shí)習(xí)生,于是此次共同創(chuàng)辦無(wú)問(wèn)芯穹,也是他和導(dǎo)師的再次攜手。
其次,戴國(guó)浩雖未出現(xiàn)在核心成員,但卻是無(wú)問(wèn)芯穹受益股份達(dá)22.404%的大股東之一,僅次于熊喬喬的27.487%。
2014年和2019年,戴國(guó)浩先后獲得清華大學(xué)電子工程系工學(xué)學(xué)士和博士學(xué)位。博士期間,汪玉正是戴國(guó)浩博士畢業(yè)論文指導(dǎo)老師。
目前,戴國(guó)浩是上海交通大學(xué)長(zhǎng)聘教軌副教授,還是清源研究院定制計(jì)算中心共同負(fù)責(zé)人、人工智能設(shè)計(jì)自動(dòng)化創(chuàng)新實(shí)驗(yàn)室負(fù)責(zé)人。
來(lái)源:上海交通大學(xué)
據(jù)悉,此次創(chuàng)辦無(wú)問(wèn)芯穹,汪玉的合作伙伴還包括北京大學(xué)科研副教授、商湯原數(shù)據(jù)與計(jì)算平臺(tái)部執(zhí)行總監(jiān)、小紅書原AI平臺(tái)部負(fù)責(zé)人顏深根等。
需要注意的是,12月18日,在以“讓算力更自由”為主題的首屆AI Tech Day(AI 嘉年華)上,夏立雪將以無(wú)問(wèn)芯穹創(chuàng)始人的身份出席,并發(fā)表《模型推理加速,釋放算力潛力》主題演講。
目前,網(wǎng)絡(luò)上關(guān)于夏立雪的消息并不多。在今年4月的《清華112周年校慶電子系校友返校論壇》上,他作為電子系2009級(jí)畢業(yè)10周年校友代表作了相關(guān)發(fā)言。而在今年8月常德全媒公眾號(hào)的一篇文章中,他曾以無(wú)問(wèn)芯穹CEO身份出現(xiàn),但在后續(xù)推文修改后,已無(wú)此描述。
同樣是在“AI 嘉年華”上,汪玉也將現(xiàn)身以《自主可控的AGI產(chǎn)業(yè)發(fā)展與布局,讓算力更自由》為主題的圓桌論壇環(huán)節(jié)。但他的介紹里并未提及無(wú)問(wèn)芯穹,僅顯示為“清華大學(xué)電子系主任”。
做大模型基礎(chǔ)設(shè)施,加速大模型落地最后一公里
與市場(chǎng)上大多數(shù)通用或?qū)S么竽P凸静煌瑹o(wú)問(wèn)芯穹另辟蹊徑,走得是一條服務(wù)大模型公司的“大路”。
據(jù)介紹,無(wú)問(wèn)芯穹以無(wú)穹大模型能效優(yōu)化工具包為基礎(chǔ),整合國(guó)產(chǎn)芯片算力, 構(gòu)建統(tǒng)一算力底座。在AI大模型多樣、算力多樣的分散行業(yè)格局下,構(gòu)建連接模型和算力的M*N中間層。通過(guò)模型層、系統(tǒng)層、硬件層的跨層協(xié)同優(yōu)化,發(fā)揮各類算力硬件的效率,助力大模型應(yīng)用落地。
具體而言,無(wú)問(wèn)芯穹主要提供智算云服務(wù)、智算一體機(jī)、大模型能效優(yōu)化工具包等解決方案。同時(shí),公司還自研了行業(yè)大模型,包括政務(wù)大模型、法律大模型、證券大模型等。
解決什么痛點(diǎn)?無(wú)問(wèn)芯穹商業(yè)化副總裁李楓在9月及11月份的相關(guān)活動(dòng)中做過(guò)詳細(xì)分享——《加速大模型落地最后一公里》。
據(jù)李楓介紹,為了解決模型和算力之間的瓶頸,無(wú)問(wèn)芯穹致力于提供大模型軟硬一體化自動(dòng)化優(yōu)化方案。向上,我們服務(wù)多家大模型算法企業(yè);向下,我們聯(lián)動(dòng)多家國(guó)產(chǎn)芯片公司。產(chǎn)品上,我們實(shí)現(xiàn)了大模型在多種硬件上的M×N一鍵部署平臺(tái),降低大模型的使用門檻,讓模型部署越快越好,真正成為AI 2.0時(shí)代大模型的基礎(chǔ)設(shè)施。
為了助力 AI 2.0 時(shí)代大模型落地,無(wú)問(wèn)芯穹著力于解決四個(gè)痛點(diǎn)需求。
1.支持長(zhǎng)文本或大輸入:比如之前支持 2K token 的模型,我們可以用快速推理和訓(xùn)練,使它支持 32K token,我們就可以做好例如專業(yè)長(zhǎng)文本的信息檢索、生成、會(huì)議聊天助手等應(yīng)用;
2.提升性價(jià)比:我們把語(yǔ)言和多模態(tài)生成模型部署到消費(fèi)級(jí)顯卡,甚至手機(jī)等終端設(shè)備上,讓廣大客戶用得起;
3.垂直領(lǐng)域適配:用大模型通用能力幫助各行各業(yè)的人們提升體驗(yàn)和效率;
4.一鍵式部署:讓大模型能低人力成本被部署到各種場(chǎng)景,讓每個(gè)工廠、學(xué)校、家庭甚至個(gè)人都能用到它的能力。
無(wú)問(wèn)芯穹希望實(shí)現(xiàn)“大模型用得好、用得起、用得廣、愿意用”的目標(biāo),加速大模型落地最后一公里。
來(lái)源:青云科技
作為上海“土生土長(zhǎng)”的創(chuàng)業(yè)公司,創(chuàng)立僅兩月,無(wú)問(wèn)芯穹就在今年7月的2023世界人工智能大會(huì)上,正式首次亮相。
據(jù)上海徐匯公眾號(hào)文章,徐匯區(qū)委常委、副區(qū)長(zhǎng)俞林偉代表徐匯,與無(wú)問(wèn)芯穹進(jìn)行了簽約。雙方簽約項(xiàng)目為無(wú)問(wèn)芯穹大模型軟硬件協(xié)同優(yōu)化平臺(tái),旨在解決大模型算法向大算力芯片的高效統(tǒng)一部署問(wèn)題,建設(shè)面向大模型的M×N算法-芯片聯(lián)合優(yōu)化平臺(tái),其中M層支撐多種大模型算法、N層連接多種大算力芯片,提升大模型到國(guó)產(chǎn)芯片平臺(tái)的部署效率,實(shí)現(xiàn)在不同國(guó)產(chǎn)芯片上的“高效”“統(tǒng)一”部署。
在無(wú)問(wèn)芯穹11月份發(fā)布的公眾號(hào)文章中,也提到了公司的最新進(jìn)展。
據(jù)介紹,來(lái)自無(wú)問(wèn)芯穹、清華大學(xué)和上海交通大學(xué)的聯(lián)合團(tuán)隊(duì)提出了一種新方法FlashDecoding++,可以將GPU推理提速2-4倍,同時(shí)支持英偉達(dá)和AMD的GPU。
目前,F(xiàn)lashDecoding++已被集成于無(wú)問(wèn)芯穹的大模型計(jì)算引擎Infini-ACC中。在Infini-ACC的支持下,無(wú)問(wèn)芯穹正在開發(fā)一系列大模型軟硬件一體化的解決方案,其中包含大模型無(wú)穹天權(quán)(Infini-Megrez)、軟硬件一體機(jī)等。
據(jù)了解,Infini-Megrez在處理長(zhǎng)文本方面表現(xiàn)非常出色,將可處理的文本長(zhǎng)度破紀(jì)錄地提升到了256k token,也是當(dāng)前大模型所能處理的最長(zhǎng)文本長(zhǎng)度。
來(lái)源:無(wú)問(wèn)芯穹
此外,Infini-Megrez大模型在 CEval(中)、MMLU(英)、CMMLU(中)、AGIEval等數(shù)據(jù)集上均取得了第一梯隊(duì)算法性能,并依托Infini-ACC計(jì)算引擎持續(xù)進(jìn)化中。