文|聽(tīng)筒Tech 饒言
編輯|才哥
當(dāng)互聯(lián)網(wǎng)大廠還醉心于在AI的“百模大戰(zhàn)”中大顯身手時(shí),誰(shuí)也沒(méi)有料到,他們竟然被一個(gè)“新人”抄了后路。
Kimi的爆火,來(lái)得太過(guò)突然,也很意外。
Kimi有多火?火到宕機(jī)成了近期常見(jiàn)的事,以至于官方不得不出面道歉。
說(shuō)到AIGC,必聊Kimi,成了網(wǎng)友們最近的日常。很多人發(fā)現(xiàn),自己的朋友圈和微信群幾乎都在推薦Kimi,“這幾天微博熱搜幾乎每天都能刷到Kimi”、“如果還沒(méi)用過(guò)Kimi,那你就OUT了”……
“此前我一直用文心一言,直到有一天,朋友推薦了Kimi,我才知道,什么是好用的國(guó)產(chǎn)大模型?!?0后李琳是文字工作者,她對(duì)大模型的需求主要集中在資料的檢索和整理,之前文心一言能夠基本滿足她的需求。
但Kimi給了李琳全新的體驗(yàn),“僅從資料和素材的整理這一點(diǎn)來(lái)言,Kimi體驗(yàn)感明顯勝于文心一言。”
王明是一位資深A(yù)I從業(yè)人員,他對(duì)此并不驚訝,他見(jiàn)證了Kimi從內(nèi)測(cè)到爆火的過(guò)程,“很顯然,‘草根出身’的Kimi更懂得什么是用戶真正的需求。”
“Kimi仍有一些不足之處,但從目前的用戶體驗(yàn)來(lái)看,它已經(jīng)走在一些大廠大模型的前面。”王明直言,在目前在國(guó)產(chǎn)大模型中,他更看好Kimi的未來(lái)。
資本市場(chǎng)也對(duì)Kimi表現(xiàn)出了滿腔熱情。自3月中旬以來(lái),A股市場(chǎng)便催生了Kimi概念股,不少公司的股價(jià)受此影響,接連大漲。
萬(wàn)興科技是接入Kimi的AIGC軟件企業(yè)之一,旗下視頻創(chuàng)意軟件萬(wàn)興喵影接入Kimi。在萬(wàn)興科技AI創(chuàng)新中心總經(jīng)理齊鏜泉看來(lái),Kimi的出圈不僅反映了公眾對(duì)于新興技術(shù)的興趣和期待,也體現(xiàn)了資本市場(chǎng)對(duì)于AI技術(shù)的信心和追捧,“這也是個(gè)積極的信號(hào),展示了AI應(yīng)用的潛力和商業(yè)價(jià)值?!?/p>
“Kimi的出圈并非一蹴而就,其背后是大量的研發(fā)投入和持續(xù)的技術(shù)創(chuàng)新?!饼R鏜泉對(duì)《聽(tīng)筒Tech》表示。
不過(guò),Kimi未來(lái)能延續(xù)目前的火熱嗎?目前顯然還無(wú)法判定。實(shí)際上,隨著Kimi的爆火,有關(guān)其技術(shù)處理能力和商業(yè)化路徑的質(zhì)疑聲也不斷。
齊鏜泉也提示了風(fēng)險(xiǎn),“隨著AI技術(shù)的廣泛應(yīng)用,我們也應(yīng)該關(guān)注其可能帶來(lái)的數(shù)據(jù)安全和隱私保護(hù)等問(wèn)題,并積極尋求解決方案。”
01 Kimi到底表現(xiàn)如何?
“用過(guò)一次Kimi后,現(xiàn)在大部分時(shí)候都選擇使用它。”不少人和李琳的做法一樣,長(zhǎng)期需要閱讀大量數(shù)據(jù)和報(bào)告的證券分析師張強(qiáng)最近也在使用Kimi,在他看來(lái),Kimi界面更友好,在文生文的大模型中,更貼近自己的需求。
張強(qiáng)已經(jīng)獲得Kimi的200萬(wàn)字長(zhǎng)文輸入內(nèi)測(cè)資格,他經(jīng)常將一些上市公司的年報(bào)或者IPO文件全文輸入到Kimi,他對(duì)《聽(tīng)筒Tech》表示,Kimi能夠迅速將核心內(nèi)容提取出來(lái),包括上市公司的基本信息、財(cái)務(wù)概覽、公司治理等核心內(nèi)容,“相對(duì)而言,其他國(guó)產(chǎn)大模型在歸納總結(jié)方面有所欠缺?!?/p>
Kimi的用戶體驗(yàn)到底如何?《聽(tīng)筒Tech》對(duì)Kimi、文心一言、通義千問(wèn)、豆包,以及騰訊混元助手做了一系列小測(cè)試。
首先測(cè)試的是這些大模型對(duì)資料的總結(jié)能力。
需要說(shuō)明的是,在幾家大模型的PC端版本中,Kimi、通義千問(wèn)、豆包、文心一言對(duì)文件上傳功能操作友好,而騰訊混元助手PC端對(duì)文檔的上傳界面不太友好,《聽(tīng)筒Tech》幾經(jīng)折騰,都未能找到將文件上傳到對(duì)話中的辦法。
《聽(tīng)筒Tech》隨意抽取了一份最新的《美團(tuán)2023年財(cái)務(wù)報(bào)告》進(jìn)行測(cè)試,測(cè)試結(jié)果如下。
從左至右分別為:Kimi(上)、豆包(下)通義千問(wèn)(上)、文心一言(下),來(lái)源:《聽(tīng)筒Tech》截圖
從測(cè)試結(jié)果來(lái)看,正如張強(qiáng)所言,Kimi對(duì)文檔的歸納總結(jié)功能明顯優(yōu)于其他幾家大模型。對(duì)這份財(cái)務(wù)報(bào)告,Kimi的總結(jié)清晰且簡(jiǎn)明扼要,豆包和通義千問(wèn)雖然也能總結(jié),但結(jié)果呈現(xiàn)并不理想,而文心一言則需要進(jìn)一步的指令。
隨后測(cè)試的是用戶常用的資料檢索和整理功能,《聽(tīng)筒Tech》對(duì)各大模型進(jìn)行了“閱讀GTC大會(huì)黃仁勛的演講”的測(cè)試,結(jié)果如下。
從左至右分別為:Kimi(上)、豆包(下),通義千問(wèn)(上)、文心一言(中)、騰訊混元助手(下)來(lái)源:《聽(tīng)筒Tech》截圖
從大模型的檢索結(jié)果來(lái)看,Kimi準(zhǔn)確且精簡(jiǎn)地對(duì)黃仁勛在2024年GTC大會(huì)上的演講內(nèi)容進(jìn)行了總結(jié)。
除Kimi外,其他幾家大模型均無(wú)法檢索到黃仁勛在GTC大會(huì)上的演講內(nèi)容,騰訊混元助手甚至無(wú)法生成任何答案,需要進(jìn)一步的指令。
創(chuàng)作能力是每個(gè)大模型都要具備的重要能力之一,這能夠更好地理解和模擬人類的思維過(guò)程,從而生成更具創(chuàng)意和價(jià)值的內(nèi)容。
視頻腳本的生成,便是用戶常用的文學(xué)創(chuàng)作能力大模型功能之一。為此,《聽(tīng)筒Tech》測(cè)試了大模型的視頻腳本制作能力。
本次測(cè)試的內(nèi)容是“以‘運(yùn)動(dòng)改變生活’為主題生成視頻腳本”。從生成的結(jié)果來(lái)看,Kimi、文心一言、通義千問(wèn)、豆包均能生成符合基本要求的視頻腳本文案。
從左至右依次為:Kimi(上)、文心一言(下)豆包(上)、騰訊混元助手(中)、通義千問(wèn)(下)來(lái)源:《聽(tīng)筒Tech》截圖
其中豆包生成的視頻腳本包含了時(shí)長(zhǎng)、地點(diǎn)等元素,相對(duì)比較專業(yè)。Kimi與文心一言生成的腳本內(nèi)容更為連貫且有條理。而騰訊混元助手甚至將上一個(gè)問(wèn)題混淆到了腳本中。
從測(cè)試結(jié)果來(lái)看,Kimi、文心一言、通義千問(wèn)和豆包都具有較強(qiáng)的視頻腳本生成能力,可以為視頻制作提供很好的幫助。相比之下,騰訊混元助手對(duì)問(wèn)題的理解顯然不夠。
從以上簡(jiǎn)單的綜合測(cè)試結(jié)果來(lái)看,實(shí)際上,在文生文的基礎(chǔ)功能上,Kimi的處理結(jié)果更貼近基礎(chǔ)用戶的需求。
對(duì)于像李琳以及張強(qiáng)這樣的基礎(chǔ)用戶而言,Kimi目前的文生文基本功能已經(jīng)遠(yuǎn)超其他國(guó)產(chǎn)大模型。
當(dāng)然,他們也期待Kimi能夠解決更多問(wèn)題,李琳笑言,“我已經(jīng)期待它幫我做PPT了。”
02 為什么出圈的是Kimi?
Kimi到底是誰(shuí)?
公開(kāi)報(bào)道顯示,Kimi的母公司為北京月之暗面科技有限公司(以下簡(jiǎn)稱“月之暗面”),創(chuàng)始人為楊植麟。
企查查數(shù)據(jù)顯示,月之暗面成立于2023年3月,同年10月推出全球首個(gè)支持輸入20萬(wàn)漢字的智能助手產(chǎn)品Kimi。
創(chuàng)立至今短短一年時(shí)間里,月之暗面已經(jīng)獲得紅杉中國(guó)、真格基金,以及阿里巴巴、小紅書、美團(tuán)等知名機(jī)構(gòu)和企業(yè)在內(nèi)的兩輪融資,融資金額超12億美元,投后估值已約25億美元。
今年年初,Kimi的訪問(wèn)量開(kāi)始上漲。據(jù)Similarweb和七麥數(shù)據(jù)的資料顯示,2024年2月18日至3月16日,Kimi的日均瀏覽量將近20萬(wàn)次,Kimi在全平臺(tái)的累計(jì)下載量為50萬(wàn)次。
尤其是最近兩周,Kimi的訪問(wèn)量更是爆增。根據(jù)Similarweb數(shù)據(jù)顯示,近兩周Kimi的訪問(wèn)量分別為152.0萬(wàn)和225.0萬(wàn),一度引發(fā)平臺(tái)訪問(wèn)異常的情況。
在眾多國(guó)產(chǎn)大模型中,為什么出圈的是Kimi?
在王明看來(lái),一方面,與其創(chuàng)始人團(tuán)隊(duì)的背景不無(wú)關(guān)系?!皬墓_(kāi)的資料來(lái)看,月之暗面可以稱得上匯集了目前國(guó)內(nèi)大模型領(lǐng)域相對(duì)領(lǐng)先的人才的一個(gè)團(tuán)隊(duì)?!?/p>
公開(kāi)資料顯示,楊植麟出生于1992年,被譽(yù)為最年輕的中國(guó)大模型創(chuàng)始人。其本科畢業(yè)于清華大學(xué)計(jì)算機(jī)系,師從清華教授、知名AI學(xué)者唐杰。博士畢業(yè)于卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)學(xué)院,師從蘋果AI研究負(fù)責(zé)人Rualan Salakhutdinov 和谷歌首席科學(xué)家 William Cohen。
據(jù)公開(kāi)報(bào)道,楊植麟目前仍是清華大學(xué)交叉信息研究院(以下簡(jiǎn)稱“交叉信息院”)的助理教授。要知道,交叉信息院涵蓋大名鼎鼎的清華“姚班”。楊植麟與圖靈獎(jiǎng)得主楊樂(lè)昆(Yann LeCun)和約書亞·本吉奧(Yoshua Bengio)均有過(guò)科研合作。
圖:楊植麟在清華大學(xué)交叉信息研究院的任職信息,來(lái)源:清華大學(xué)交叉信息研究院官網(wǎng) 《聽(tīng)筒Tech》截圖
實(shí)際上,月之暗面是楊植麟第二次創(chuàng)業(yè),在此之前,他曾與別人共同創(chuàng)立了循環(huán)智能,也拿到了紅杉中國(guó)的投資,并在2021年和華為云聯(lián)合推出了當(dāng)時(shí)全球最大的中文語(yǔ)言模型“盤古”。
另?yè)?jù)媒體報(bào)道,月之暗面的核心團(tuán)隊(duì)成員在大模型方向有重要發(fā)明,如RoPE相對(duì)位置編碼和group normalization,這些技術(shù)是Meta LLaMa、谷歌PALM等主流模型的重要組成部分。其另外兩位創(chuàng)始人周昕宇和吳育昕,同樣是AIGC領(lǐng)域的領(lǐng)先技術(shù)人才,有過(guò)1萬(wàn)+的Google Scholar的引用。
一位在學(xué)術(shù)上與楊植麟有交集的AI領(lǐng)域研究學(xué)者Liam認(rèn)為,月之暗面的團(tuán)隊(duì)可以稱得上目前國(guó)內(nèi)領(lǐng)先的AGI團(tuán)隊(duì)之一,他亦認(rèn)同業(yè)界對(duì)楊植麟“堅(jiān)定的AGI信徒和有技術(shù)號(hào)召力的創(chuàng)始人”的評(píng)價(jià)。
Liam對(duì)Kimi的出圈并不意外,“實(shí)際上,AI技術(shù)圈內(nèi)的人從去年幾家公司宣布做AGI的時(shí)候,就基本確定月之暗面和智譜是最有希望做成的,也正因此,頭部資本會(huì)在第一時(shí)間擠向這幾家公司?!?/p>
在Liam看來(lái),楊植麟是一位“為數(shù)不多的善于從第一性原理思考問(wèn)題的學(xué)者”,“Kimi走的long-context的技術(shù)路徑與大廠不一樣,或許也是源于其對(duì)第一性原理的思考?!?/p>
另一方面,“楊植麟對(duì)什么是用戶真正需要的大模型也有清醒的認(rèn)知”。Liam向《聽(tīng)筒Tech》透露,在楊植麟看來(lái),一個(gè)好的產(chǎn)品,應(yīng)該知道用戶想要什么,通過(guò)滿足用戶的需求來(lái)實(shí)現(xiàn)產(chǎn)品的優(yōu)化,“這也是為什么月之暗面一開(kāi)始推出的產(chǎn)品便是TO C,而不是TO B的原因所在。”
在Liam看來(lái),“TO C的定位,能夠給Kimi帶來(lái)更多‘訓(xùn)練’的機(jī)會(huì),更有利于產(chǎn)品的優(yōu)化和完善?!?/p>
市場(chǎng)顯然也認(rèn)可楊植麟對(duì)Kimi的這一定位,國(guó)信證券的分析報(bào)告指出,Kimi日活用戶的顯著增長(zhǎng)反映了Kimi在模型優(yōu)化、人才擴(kuò)展和用戶吸引方面的成功策略。
“Kimi的成功不僅依賴于其技術(shù)優(yōu)勢(shì),更在于其對(duì)用戶體驗(yàn)的重視,包括通過(guò)數(shù)據(jù)驅(qū)動(dòng)的持續(xù)產(chǎn)品優(yōu)化、創(chuàng)新的分享機(jī)制以及對(duì)核心功能的精準(zhǔn)打磨,這些因素共同提升了Kimi的市場(chǎng)競(jìng)爭(zhēng)力?!?/p>
中信建投也在其研報(bào)中表示,“月之暗面打造高關(guān)注度應(yīng)用Kimi Chat,一方面在于核心團(tuán)隊(duì)技術(shù)背景深,另一方面在于產(chǎn)品面向C端免費(fèi)開(kāi)放,注重產(chǎn)品運(yùn)營(yíng)?!?/p>
在齊鏜泉看來(lái),用戶需要的,是一個(gè)能解決特定場(chǎng)景中80%問(wèn)題的大模型、一個(gè)結(jié)合了本土用戶使用習(xí)慣的本土化大模型、一個(gè)能夠與用戶進(jìn)行交互和共創(chuàng)的大模型。
“大模型始終會(huì)是’應(yīng)用為王‘。大模型需要提供的并不是一個(gè)淺嘗輒止的工具,而是一套標(biāo)準(zhǔn)化的流程支持,包括基礎(chǔ)大模型、完整的工具鏈、豐富的應(yīng)用,以及有專家支持的服務(wù)。”
這些,或許就是Kimi率先出圈的原因。
Kimi火速出圈還有一個(gè)原因,那就是前期異常低調(diào),之前幾乎沒(méi)人聽(tīng)過(guò)這家公司的名字,這與大廠在AI方面的高調(diào)形成鮮明的對(duì)比。
如果說(shuō)財(cái)大氣粗的大廠更要面子,那么“草根出身”的Kimi則更注重里子。
03 Kimi能火多久?
爆火的Kimi能否如愿在大模型這一新戰(zhàn)場(chǎng)中脫穎而出?目前來(lái)看,尚無(wú)定論。
僅從Kimi引以為傲的長(zhǎng)文本處理技術(shù)來(lái)看,Kimi或?qū)⒚媾R巨大的壓力。
一個(gè)不容忽視的事實(shí)是,Kimi大模型爆火后,大廠正在迅速跟進(jìn)。
3月22日,阿里通義千問(wèn)宣布免費(fèi)開(kāi)放1000萬(wàn)字長(zhǎng)文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用。隨后,360宣布智腦正式內(nèi)測(cè)500萬(wàn)字長(zhǎng)文本處理功能,該功能入駐360AI瀏覽器。另?yè)?jù)媒體報(bào)道,百度也將免費(fèi)開(kāi)放200-500萬(wàn)長(zhǎng)文本功能。
在一位AI技術(shù)人員看來(lái),“長(zhǎng)文本處理這項(xiàng)技術(shù)并不難,只不過(guò)之前的大模型關(guān)注點(diǎn)不在這一方面。更重要的是,長(zhǎng)文本處理相對(duì)而言,成本太高,甚至可以說(shuō)是’虧本的生意‘?!?/p>
該AI技術(shù)人員認(rèn)為,“當(dāng)市場(chǎng)意識(shí)到這一技術(shù)能迅速打開(kāi)市場(chǎng),勢(shì)必會(huì)加入這一戰(zhàn)場(chǎng),這無(wú)疑將對(duì)Kimi造成巨大的壓力 ?!?/p>
實(shí)際上,一個(gè)簡(jiǎn)單的測(cè)試便能看出,該AI技術(shù)人員的觀點(diǎn)存在一定的道理。
因目前尚未獲得200萬(wàn)字的內(nèi)測(cè)資格,《聽(tīng)筒Tech》對(duì)Kimi與通義千問(wèn)分別提交了一份近35萬(wàn)字的《茶百道聆訊后資料集》,發(fā)出相同的指令后,kimi反饋“超出字?jǐn)?shù)限制,只閱讀了前31%”,而通義千問(wèn)順利對(duì)全文進(jìn)行了總結(jié)。
一定程度而言,開(kāi)放了1000萬(wàn)字長(zhǎng)文檔處理功能的通義千問(wèn),雖然總結(jié)的內(nèi)容不盡如意,得到的直觀結(jié)果優(yōu)于Kimi。
圖:目前Kimi(左)與通義千問(wèn)(右)對(duì)長(zhǎng)文檔的處理結(jié)果,來(lái)源:《聽(tīng)筒Tech》截圖
不過(guò),Liam對(duì)以上AI技術(shù)人員的看法持不同觀點(diǎn),Liam表示,“長(zhǎng)文本處理這項(xiàng)技術(shù)并不難”這個(gè)說(shuō)法存在誤解,準(zhǔn)確地說(shuō)應(yīng)該是“將文本變長(zhǎng)確實(shí)不難”,但是“在變長(zhǎng)的同時(shí)不丟掉有效信息,保證模型對(duì)文本仍然有很深入的理解”存在很大技術(shù)難度。
在Liam看來(lái),“在文本變長(zhǎng)甚至變到無(wú)限長(zhǎng)的情況下,保證計(jì)算量和計(jì)算成本可控”這件事,需要大量的基礎(chǔ)研究來(lái)支持,大廠的人才密度不足以支撐這樣的研究。
另一方面,從多次宕機(jī)的情況來(lái)看,也意味著Kimi后臺(tái)需求解決的問(wèn)題仍不少。
上述AI技術(shù)人員表示,雖然月之暗面確實(shí)匯集了一些領(lǐng)先的技術(shù)人才,但還需加強(qiáng),“我看媒體報(bào)道,目前Kimi團(tuán)隊(duì)不足百人,這對(duì)于一家處于上升期的大模型企業(yè)而言,遠(yuǎn)遠(yuǎn)不夠?!?/p>
不過(guò),在Liam看來(lái),人才密度是頂尖科技公司最關(guān)鍵的因素,而不是人才數(shù)量。
“這從OpenAI便能得出答案,ChatGPT發(fā)布時(shí),OpenAI也僅100余人,都是領(lǐng)域內(nèi)最頂尖的科學(xué)家和工程師,當(dāng)然GPT爆火后,OpenAI開(kāi)始大力擴(kuò)招,人才密度有所下降,也因此引發(fā)了一些問(wèn)題。”
另外,Kimi要想持續(xù)發(fā)展,就必須正視商業(yè)化這一難題。
目前,月之暗面的具體商業(yè)化路徑仍未對(duì)外公開(kāi)。Kimi爆火時(shí),有媒體報(bào)道稱,月之暗面相關(guān)負(fù)責(zé)人提到,年內(nèi)將有商業(yè)化初步方案。
有業(yè)內(nèi)人士稱,Kimi的商業(yè)化可能類似于OpenAI,更傾向于一種通用性的商業(yè)化,例如商業(yè)化的高端接入入口用以擴(kuò)展客戶的應(yīng)用等。
但這一模式能否落地,能否足以支撐Kimi的長(zhǎng)遠(yuǎn)發(fā)展,尚未可知。
在王明看來(lái),如果目前Kimi的獲客成本真像媒體報(bào)道的“每天投入可能超過(guò)20萬(wàn)元”,那顯然不是一個(gè)小數(shù)目,目前的商業(yè)模式也不足以支撐其未來(lái)的快速發(fā)展。
更重要的是,Kimi爆火后,進(jìn)一步推動(dòng)了“百模大戰(zhàn)”的升級(jí),國(guó)內(nèi)外AI公司對(duì)其已形成圍獵之勢(shì)。
且不說(shuō)國(guó)外,僅國(guó)內(nèi),騰訊、阿里、百度、科大訊飛、商湯科技等巨頭和AI公司都紛紛推出了大模型,同時(shí),各行業(yè)也不斷涌現(xiàn)垂類大模型。
公開(kāi)數(shù)據(jù)顯示,目前,國(guó)內(nèi)公布的大模型數(shù)量已超過(guò)200個(gè)。“這些對(duì)Kimi而言,都是巨大的壓力。”王明直言。
在此前接受媒體的采訪時(shí),楊植麟曾表示,“AI不是我在接下來(lái)一兩年找到什么PMF(Product/Market Fit,產(chǎn)品/市場(chǎng)契合),而是接下來(lái)十到二十年如何改變世界?!?/p>
這或許不是楊植麟一個(gè)人的愿景,也是眾多國(guó)產(chǎn)大模型從業(yè)者所希冀的未來(lái)。
(文中李琳、王明、張強(qiáng)、Liam均為化名。)
參考資料:
1、《Kimi掀起國(guó)產(chǎn)大模型長(zhǎng)文本競(jìng)賽》,來(lái)源:《北京商報(bào)》;
2、《互聯(lián)網(wǎng)大廠,集體「圍剿」Kimi》,來(lái)源:《新浪科技》。