正在閱讀:

實(shí)測(cè)Kimi智能助手功能后,我們找到了Kimi爆火的原因

掃一掃下載界面新聞APP

實(shí)測(cè)Kimi智能助手功能后,我們找到了Kimi爆火的原因

中文領(lǐng)域開(kāi)啟了AI大模型應(yīng)用元年,長(zhǎng)文本時(shí)代已至。

文|派財(cái)經(jīng) 羅莉

近日,Kimi智能助手火了。

一個(gè)明顯的感知是,最近身邊的大學(xué)生、職場(chǎng)人士都開(kāi)始談?wù)撈鹆薑imi。一位職場(chǎng)寶媽告訴派財(cái)經(jīng),她最近在嘗試用Kimi輔導(dǎo)娃寫(xiě)作業(yè),“真的很方便,都不用下載APP小程序和網(wǎng)頁(yè)就能打開(kāi)。”

根據(jù)AI產(chǎn)品榜aicpb.com統(tǒng)計(jì),目前國(guó)內(nèi)訪問(wèn)量前十的產(chǎn)品中,Kimi在3月以12.61M的訪問(wèn)量、環(huán)比321.58%的增長(zhǎng)排在第二,僅次于文心一言。

成立近一年,短短五個(gè)月內(nèi)Kmi的“長(zhǎng)文本”輸入量提升了10倍。

3月18日下午,月之暗面曾宣布在大模型長(zhǎng)上下文窗口技術(shù)上取得新的突破,Kimi智能助手支持無(wú)損上下文長(zhǎng)度從最初的20多萬(wàn)字,擴(kuò)容到200萬(wàn)字。該消息公布后,Kimi關(guān)注度一路走高,一度擠爆了服務(wù)器。3月22日,月之暗面回應(yīng)稱,觀測(cè)到Kimi系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢(shì)遠(yuǎn)超對(duì)資源的預(yù)期規(guī)劃,并表示已經(jīng)有多項(xiàng)應(yīng)急措施正在實(shí)施,包括已經(jīng)進(jìn)行了5次擴(kuò)容工作。

此前,月之暗面副總裁許欣然在會(huì)議室展示了幾份用于測(cè)試的文件。幾十萬(wàn)字的《甄嬛傳》劇本,Kimi不僅能夠一口氣讀完,而且還能根據(jù)情節(jié)準(zhǔn)確回答出細(xì)節(jié)問(wèn)題,解析人物劇情走向;在迅速學(xué)習(xí)完頭部醫(yī)學(xué)書(shū)籍《中醫(yī)內(nèi)科學(xué)》和《中醫(yī)診斷學(xué)》后,便可化身“老中醫(yī)”進(jìn)行在線問(wèn)診。

Kimi的成功破圈,讓國(guó)內(nèi)一眾大模型廠商感到措手不及。

01 Kimi,真的強(qiáng)嗎?

Kimi用戶體驗(yàn)如何?派財(cái)經(jīng)對(duì)Kimi、文心一言、通義千問(wèn)和豆包做了系列小測(cè)試。分別對(duì)其資料總結(jié)能力、檢索能力和創(chuàng)作能力進(jìn)行了測(cè)驗(yàn)。

首先是對(duì)資料總結(jié)、財(cái)報(bào)解讀能力測(cè)試:

派財(cái)經(jīng)隨機(jī)上傳了一份阿里2024財(cái)年中期報(bào)告pdf,輸入解讀指令。根據(jù)生成內(nèi)容來(lái)看,Kimi和通義千問(wèn)給出的回答,羅列較為清晰,而文心一言則給出了概況,具體需要進(jìn)一步指令才能繼續(xù)解讀,豆包給出了核心數(shù)據(jù)提煉回答。

其次是對(duì)用戶常用的資料檢索和整理功能測(cè)試:

派財(cái)經(jīng)以“幫我閱讀馬斯克最新演講”為指令,分別詢問(wèn)。根據(jù)生成內(nèi)容來(lái)看,Kimi通過(guò)對(duì)7篇資料檢索解讀,給出了邏輯明確且詳細(xì)的觀點(diǎn)總結(jié),豆包則直接搜索出了多個(gè)相關(guān)報(bào)道鏈接,文心一言和通義千問(wèn)則給出了比較框架性的總結(jié)。

值得注意的是,派財(cái)經(jīng)發(fā)現(xiàn)在已經(jīng)創(chuàng)建的Kimi窗口上傳完本地文件和網(wǎng)之后,智能助手會(huì)自動(dòng)關(guān)閉聯(lián)網(wǎng)模式,這一功能在其它三個(gè)智能助手界面尚未發(fā)現(xiàn)。

再是對(duì)創(chuàng)作能力,生成腳本等創(chuàng)作力測(cè)試:

派財(cái)經(jīng)以“圍繞北京文旅為主題,寫(xiě)一個(gè)短劇劇本”為指令,分別測(cè)試其創(chuàng)作能力。按照給出的基礎(chǔ)大綱來(lái)看,通義千問(wèn)、Kimi和豆包給出了較為規(guī)范的劇本大綱框架,其中Kimi給出的最為規(guī)范且細(xì)節(jié),提到角色、場(chǎng)景、地點(diǎn)相對(duì)較詳細(xì),在取名上也較為文藝。相較之下,文心一言給出的標(biāo)題則較為直接,未交待劇本角色設(shè)定,但在場(chǎng)景、對(duì)話和獨(dú)白上更有“人味”。

綜上,在文生文應(yīng)用上,Kimi的效果確實(shí)是看起來(lái)更有特色。

02 誰(shuí)在為Kimi站臺(tái)?

Kimi智能助手是國(guó)內(nèi)大模型獨(dú)角獸公司月之暗面面向C端用戶推出的一項(xiàng)產(chǎn)品。

月之暗面公司成立于2023年3月,創(chuàng)始人楊植麟畢業(yè)于清華,博士畢業(yè)于卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)專業(yè),曾就職于Google Brain和美國(guó)初創(chuàng)公司FAIR,師從蘋(píng)果公司人工智能負(fù)責(zé)人Ruslan Salakhutdinov,有多年創(chuàng)業(yè)經(jīng)驗(yàn)。

從技術(shù)能力上看,Kimi的強(qiáng)大基因最初就已經(jīng)在創(chuàng)始人身上顯現(xiàn)。楊植麟是業(yè)內(nèi)公認(rèn)的長(zhǎng)文本領(lǐng)域?qū)<?,在近五年的自研語(yǔ)言處理(NLP)領(lǐng)域影響力頗大。

在讀博士期間,楊植麟就以第一作者身份發(fā)表 Transformer-XL 和 XLNet 兩項(xiàng)工作,在谷歌學(xué)術(shù)上被引用近兩萬(wàn)次,并在多個(gè)NLP任務(wù)上取得了當(dāng)時(shí)的最佳效果。而Transformer-XL成為首個(gè)全面超越 RNN 的注意力語(yǔ)言模型,XLNet則在20項(xiàng)頂級(jí)會(huì)議中獲得最佳論文提名。在華人學(xué)者引用排名中,楊植麟的學(xué)術(shù)論文位居前10,在40歲以下排名第一。

楊植麟的學(xué)術(shù)研究能力,助力其團(tuán)隊(duì)創(chuàng)造了Kimi獨(dú)特且表現(xiàn)優(yōu)秀的無(wú)損壓縮技術(shù)。

這種技術(shù)可減少參數(shù)對(duì)存儲(chǔ)的需求、推理的算力,以及數(shù)據(jù)傳輸?shù)膸捳加?,從而高效率無(wú)損處理百萬(wàn)級(jí)的長(zhǎng)Token。而為了快速趕上長(zhǎng)文本熱潮,其他大廠只能退而求其次,選擇檢索增強(qiáng)生成RAG技術(shù)。

Kimi的無(wú)損長(zhǎng)上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術(shù)是對(duì)全文關(guān)鍵信息進(jìn)行檢索生成答案,但可能會(huì)丟失掉部分關(guān)鍵的信息。

這也就解釋了為何Kimi的長(zhǎng)文本對(duì)話回答更準(zhǔn)確,在用戶體驗(yàn)度上美譽(yù)頗多。

但也有小紅書(shū)博主發(fā)筆記表示,在對(duì)Kimi的測(cè)試中發(fā)現(xiàn),Kimi有一股RAG味。

“月之暗面”這個(gè)名字,來(lái)源于英國(guó)著名搖滾樂(lè)隊(duì)Pink Floyd的專輯《The Dark Side of the Moon》,在科研之外,楊植麟也是一名搖滾發(fā)燒友,他曾在樂(lè)隊(duì)中擔(dān)任鼓手角色。

資本市場(chǎng)眾星捧月。創(chuàng)業(yè)一年之內(nèi),月之暗面就已經(jīng)完成了兩筆融資。最新一輪融資是在今年2月19日,融資額度超10億美金,投資方包括紅杉中國(guó)、小紅書(shū)、美團(tuán)、阿里,老股東跟投。該筆融資成為國(guó)內(nèi)AI大模型迄今為止單輪融資最高的金額。早在2023年6月,月之暗面就曾獲得來(lái)自包括紅杉中國(guó)、真格基金等頭部投資公司的3億美金融資。在兩輪融資之后,當(dāng)前月之暗面估值達(dá)到了25億美元。

Kimi的走火,離不開(kāi)阿里在底層的算力支持。有消息稱,最新10億美金融資中有8億美金來(lái)自阿里,部分資金以阿里提供的算力折算。當(dāng)前,Kimi借調(diào)了阿里的英偉達(dá)(NVDA.O)A800以及A100 GPU處理器的機(jī)型進(jìn)行擴(kuò)容,未來(lái)Kimi算力側(cè)的支持,也將主要來(lái)自于阿里。

03 Kimi搶了文心一言和豆包們的故事

在對(duì)AI長(zhǎng)文本探索上,Kimi絕對(duì)不是第一家,國(guó)內(nèi)大模型頭部大廠,百度文心一言、阿里通義千問(wèn)和360AI早已在做長(zhǎng)文本的探索,抖音也在去年年底發(fā)力AI工具豆包。

在其他大模型大廠還在卷參數(shù)、開(kāi)源和榜單的時(shí)候,Kimi切中了一個(gè)更貼近市場(chǎng)剛需的應(yīng)用場(chǎng)景。將長(zhǎng)文本作為標(biāo)簽,通過(guò)大量的廣告營(yíng)銷(xiāo)和用戶口碑,以“長(zhǎng)文本”概念迅速占領(lǐng)用戶心智。上線之初,就通過(guò)突出文本處理字?jǐn)?shù),為自己貼上了“超大內(nèi)存”的標(biāo)簽,在PC硬件時(shí)代,不少C端用戶的認(rèn)知是,內(nèi)存越大,處理能力就越強(qiáng)。

在Kimi出圈之前,行業(yè)內(nèi)在C端用戶市場(chǎng)教育上,百度的文心一言一家獨(dú)大,文心一言是大模型廠商中率先向社會(huì)全面開(kāi)放的平臺(tái)。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),截至2023年9月,百度文心一言App的月活量達(dá)到最高峰值710萬(wàn)。不過(guò)與Kimi不同的是除了2C之外,文心一言更大的精力放在研發(fā)行業(yè)大模型,垂直B端應(yīng)用上。

其次是抖音的豆包在年初的初露頭角。依托于抖音的流量轉(zhuǎn)化池,字節(jié)跳動(dòng)旗下的豆包APP在2024年1月活翻了一倍達(dá)到了400萬(wàn)。

而新晉“網(wǎng)紅”Kimi的走紅要更快,據(jù)Similarweb數(shù)據(jù),Kimi Chat網(wǎng)頁(yè)端數(shù)據(jù)最新峰值達(dá)34.6萬(wàn)人次。根據(jù)AI產(chǎn)品榜,Kimi Chat的2月訪問(wèn)量在國(guó)內(nèi)榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周繼續(xù)攀升。

Kimi上線的時(shí)間是2023年10月,當(dāng)時(shí)可以支持無(wú)損上下文長(zhǎng)度最多為20萬(wàn)漢字。在5個(gè)月的時(shí)間內(nèi),月之暗面直接將長(zhǎng)文本能力提高10倍。按照AI領(lǐng)域的計(jì)算標(biāo)準(zhǔn),200萬(wàn)漢字的長(zhǎng)度大約為400萬(wàn)token,在全球范圍內(nèi)也屬于領(lǐng)先的標(biāo)準(zhǔn)。3月18日,月之暗面宣布在大模型長(zhǎng)上下文窗口技術(shù)上取得新的突破,其自研的Kimi智能助手已支持200萬(wàn)字超長(zhǎng)無(wú)損上下文,并于今日開(kāi)啟產(chǎn)品內(nèi)測(cè)。

月之暗面方面表示,如今Kimi能夠一口氣精讀500個(gè)甚至數(shù)量更多的文件,幫助用戶快速分析所有文件的內(nèi)容,并且支持通過(guò)自然語(yǔ)言進(jìn)行信息查詢和篩選,大大提高信息處理效率。

在產(chǎn)品定位上,Kimi足夠堅(jiān)定,面向C端用戶,主打長(zhǎng)文本。AI搜索+文檔總結(jié)功能。

Kimi開(kāi)始就為用戶敞開(kāi)了大門(mén),不僅能從網(wǎng)頁(yè)端入口進(jìn)入,還能在APP和小程序端口打開(kāi),降低了使用大模型的門(mén)檻,這是業(yè)內(nèi)B端大模型廠商無(wú)法匹敵的。

在選擇早期產(chǎn)品使用者集中在科研、法律、金融、媒體等垂直領(lǐng)域,而這部分垂直領(lǐng)域的KOL為Kimi帶來(lái)了自然流量與口碑積累。

Kimi在發(fā)力營(yíng)銷(xiāo)同時(shí),也有一部分“自來(lái)水”自發(fā)為Kimi站臺(tái)推廣。

將互聯(lián)網(wǎng)營(yíng)銷(xiāo)公式帶入到了硬科技領(lǐng)域,Kimi的營(yíng)銷(xiāo)開(kāi)局頗為高調(diào)。在月之暗面發(fā)布的Kimi上線官宣文標(biāo)題中提到,“歡迎與Moonshot AI共同開(kāi)啟Looooooooooong LLM時(shí)代”,其中英文“l(fā)ong”用了接連十個(gè)“o”將Kimi的“長(zhǎng)文本能力”直觀呈現(xiàn)出來(lái)。

Kimi提供的長(zhǎng)文本閱讀能力和概括能力是兩大功能,面向C端用戶,致力于為用戶打造一個(gè)高學(xué)習(xí)力的免費(fèi)私人助手。

一份上萬(wàn)字的文獻(xiàn),投喂給Kimi,只需要幾分鐘就能讀完全文并歸納總結(jié)出核心論點(diǎn),極大程度為用戶提升了閱讀效率。

用戶投喂的各種資料又能反哺Kimi的語(yǔ)意語(yǔ)境學(xué)習(xí)理解能力,從而在不斷打磨中提高準(zhǔn)確性。值得一提的是,在此類專業(yè)語(yǔ)料處理上的進(jìn)步速度,Kimi甚至快于Open AI。主要由于當(dāng)前Open AI對(duì)于C端用戶上傳文件仍然有所限制。

如果把Kimi智能助手類比做人類,它的突出之處在于具備較長(zhǎng)時(shí)間段的記憶力,是一個(gè)記性超好的學(xué)霸,可以一次記住20萬(wàn)字的上下文,一口氣讀完一本書(shū)或者一系列文章。相較國(guó)外綜合能力最強(qiáng)的學(xué)霸GPT4(可以記住2.5萬(wàn)字)。Kimi的記憶力是GPT4的8倍。

有小紅書(shū)博主試著通過(guò)Kimi智能助手,訓(xùn)練出在自媒體領(lǐng)域現(xiàn)象級(jí)創(chuàng)作者咪蒙,將50個(gè)文檔投喂給Kimi之后,一步步引導(dǎo)其分析咪蒙寫(xiě)作的核心特點(diǎn)以及對(duì)待感情態(tài)度后,下指令讓其生成一篇關(guān)于“彩禮”的文章,成稿雖然簡(jiǎn)短但頗具“咪蒙味”。

在Kimi走火之后,各大模型廠商紛紛“秀肌肉”。

據(jù)第三方機(jī)構(gòu)的最新統(tǒng)計(jì)數(shù)據(jù)顯示,目前國(guó)內(nèi)已經(jīng)發(fā)布的大型語(yǔ)言模型數(shù)量已經(jīng)超過(guò)了300個(gè)。這些大型模型的發(fā)布主體涵蓋了科技巨頭、國(guó)內(nèi)頂尖的高等學(xué)府、以及各類科研機(jī)構(gòu),他們?cè)谫Y金投入、資源配置、人才聚集等方面都擁有絕對(duì)的優(yōu)勢(shì)。

國(guó)內(nèi)互聯(lián)網(wǎng)大廠火速將相關(guān)功能進(jìn)行了升級(jí),卷起了長(zhǎng)文本“長(zhǎng)度”。

2023年10月30日,Kimi首發(fā)不到一個(gè)月,同為清華系校友的王小川的百川智能就推出了單次處理35萬(wàn)漢字的Baichuan2-192K,打破了Kimi的20萬(wàn)字記錄,隨后,李開(kāi)復(fù)也發(fā)布了能夠處理40萬(wàn)字的Yi-34B。

在Kimi宣布更新200萬(wàn)字長(zhǎng)文檔處理能力后,阿里宣布通義千問(wèn)升級(jí),免費(fèi)開(kāi)放1000萬(wàn)字的長(zhǎng)文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用;隨后,百度文心一言、360智腦也都把500萬(wàn)字長(zhǎng)文本提上了日程。

目前,大模型最強(qiáng)王者OpenAI的GPT-4 Turbo-128k可處理文本能力約為10萬(wàn)漢字,專攻長(zhǎng)本文的Claude3-200K上下文處理能力約為16萬(wàn)漢字。

一時(shí)間,各大模型廠商比起了誰(shuí)更“長(zhǎng)”,而文本處理能力越長(zhǎng)就能代表能力強(qiáng)嗎?

此前,對(duì)于文本窗口的長(zhǎng)度,楊植麟曾表示,不能只提升窗口,不能只看數(shù)字,要看它在這個(gè)窗口下能實(shí)現(xiàn)的推理能力、the faithfulness的能力(對(duì)原始信息的忠實(shí)度)、the instruction following的能力(遵循指令的能力)。

04 長(zhǎng)文本能力能幫Kimi造血嗎?

Kimi火爆的表象之下,一個(gè)更為現(xiàn)實(shí)的問(wèn)題暴露無(wú)遺,長(zhǎng)文本能力能為Kimi造血嗎?

根據(jù)新浪科技提供的數(shù)據(jù),考慮到廣告投放和算力成本,Kimi每個(gè)獲客用戶的成本達(dá)到12-13元,而按照近一個(gè)月將近18000的日均下載量計(jì)算,Kimi每日的獲客成本高達(dá)20萬(wàn)元。而除了每日20萬(wàn)的獲客成本外,Kimi需要燒錢(qián)的地方還有很多,比如不斷提升信息檢索能力、遵循復(fù)雜指令的能力,推動(dòng)多模態(tài)模型研發(fā),以及實(shí)現(xiàn)音頻處理等其他需求。

接下來(lái),付出了高額成本,能否將現(xiàn)有用戶留住,持續(xù)轉(zhuǎn)化將是對(duì)Kimi產(chǎn)品的一大考驗(yàn)。為龐大的用戶群體提供穩(wěn)定的服務(wù),同樣是一筆不小開(kāi)支。

長(zhǎng)文本能力短期內(nèi)幫助Kimi出圈,但很難成為其獨(dú)家技術(shù)壁壘。Kimi的長(zhǎng)文本處理能力與通義千問(wèn)、360智腦等AI產(chǎn)品相比,并沒(méi)有非常明顯的優(yōu)勢(shì)。

雖然實(shí)現(xiàn)造血能力難,但Kimi的C端策略也有一定意義,通過(guò)長(zhǎng)文本先征服用戶,進(jìn)而讓更多B端客戶看到大模型底層應(yīng)用能力的真正價(jià)值。

但從整體盈利角度來(lái)看,Kimi靠燒錢(qián)摸索出的獲客模式很容易被復(fù)制,對(duì)于將業(yè)務(wù)重心放在B端服務(wù)的大廠們來(lái)說(shuō),獲客成本反而是更低的。

行業(yè)內(nèi)多數(shù)大模型公司均采取的是2B和2C兩條腿走路,通過(guò)推出行業(yè)大模型直接售賣(mài)B端解決方案,或是向公司、開(kāi)發(fā)者售賣(mài)API,按照調(diào)用次數(shù)收費(fèi)。此外,以文心一言為代表的一種C端打法是,面向C端用戶,為會(huì)員增值服務(wù),在應(yīng)用端按月/年向用戶收費(fèi),當(dāng)前文心一言扔在試水階段,而后起之秀Kimi則仍然處于免費(fèi)模式階段。

不過(guò),有聲音認(rèn)為,Kimi的出現(xiàn)對(duì)于國(guó)內(nèi)大模型市場(chǎng)提供了新的思路,從基礎(chǔ)大模型的訓(xùn)練和競(jìng)爭(zhēng)逐步向更貼近客戶的產(chǎn)品功能和細(xì)節(jié)需求轉(zhuǎn)變。

有業(yè)內(nèi)人士表示,當(dāng)下這一輪人工智能革命本質(zhì)上是自然語(yǔ)言處理(NLP)的技術(shù)革命,更是一次交互方式的革命。從文本向多模態(tài)發(fā)展是大模型必經(jīng)之路。而視頻處理需要更大的參數(shù)量和存儲(chǔ)容量,對(duì)算力和算法的要求也更高。接下來(lái)Kimi的應(yīng)用將從單模態(tài),向多模態(tài)化發(fā)展,即從單一的文本處理基礎(chǔ)上,增添聲音、圖像等信息處理技術(shù)。

亦有觀點(diǎn)認(rèn)為,Kimi的出圈意味著在中文領(lǐng)域開(kāi)啟了AI大模型應(yīng)用元年,長(zhǎng)文本時(shí)代已至。大模型在實(shí)現(xiàn)通往AGI(通用人工智能)路上又近了一步。然而需要厘清的是,長(zhǎng)文本能力并非唯一標(biāo)準(zhǔn),多模態(tài)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)架構(gòu)創(chuàng)新、應(yīng)用落地與生態(tài)建設(shè)、倫理與道德框架構(gòu)建等各個(gè)維度都不可或缺。

一位初入職場(chǎng)的金融分析師向派財(cái)經(jīng)感嘆道,Kimi的強(qiáng)大學(xué)習(xí)理解能力讓人感到威脅,“可能過(guò)不了多久,向我這樣的初級(jí)分析師就要被AI智能助手替代了?!边@一擔(dān)憂并非空穴來(lái)鳳,在效率至上的資本市場(chǎng),華爾街有個(gè)說(shuō)法叫“20美金實(shí)習(xí)生”,時(shí)薪20美金的實(shí)習(xí)生工作未來(lái)一段時(shí)間大概率會(huì)被AI替代。

AI是否會(huì)替代職場(chǎng)人?在《所羅門(mén)的密碼:AI時(shí)代的價(jià)值、權(quán)力與信任》中,作者奧拉夫·格羅思、馬克·尼茲伯格曾給出過(guò)解釋,“最終,問(wèn)題不在于工作是否會(huì)改變,工人是否會(huì)被取代。這甚至不需要超級(jí)智能就會(huì)實(shí)現(xiàn)。問(wèn)題是這些轉(zhuǎn)變將會(huì)以多快的速度發(fā)生,我們能否跟上它們的步伐,特別是在教育和勞動(dòng)力培訓(xùn)方面。正如奧萊利媒體公司的創(chuàng)始人兼首席執(zhí)行官蒂姆·奧萊利(Tim O’Reilly),在他的視頻《我們?yōu)槭裁从肋h(yuǎn)不會(huì)失業(yè)》中所說(shuō)的那樣,我們的辦法總比困難多。但是,適應(yīng)新的工作性質(zhì)需要發(fā)揮想象力并做好準(zhǔn)備?!?/p>

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

實(shí)測(cè)Kimi智能助手功能后,我們找到了Kimi爆火的原因

中文領(lǐng)域開(kāi)啟了AI大模型應(yīng)用元年,長(zhǎng)文本時(shí)代已至。

文|派財(cái)經(jīng) 羅莉

近日,Kimi智能助手火了。

一個(gè)明顯的感知是,最近身邊的大學(xué)生、職場(chǎng)人士都開(kāi)始談?wù)撈鹆薑imi。一位職場(chǎng)寶媽告訴派財(cái)經(jīng),她最近在嘗試用Kimi輔導(dǎo)娃寫(xiě)作業(yè),“真的很方便,都不用下載APP小程序和網(wǎng)頁(yè)就能打開(kāi)?!?/p>

根據(jù)AI產(chǎn)品榜aicpb.com統(tǒng)計(jì),目前國(guó)內(nèi)訪問(wèn)量前十的產(chǎn)品中,Kimi在3月以12.61M的訪問(wèn)量、環(huán)比321.58%的增長(zhǎng)排在第二,僅次于文心一言。

成立近一年,短短五個(gè)月內(nèi)Kmi的“長(zhǎng)文本”輸入量提升了10倍。

3月18日下午,月之暗面曾宣布在大模型長(zhǎng)上下文窗口技術(shù)上取得新的突破,Kimi智能助手支持無(wú)損上下文長(zhǎng)度從最初的20多萬(wàn)字,擴(kuò)容到200萬(wàn)字。該消息公布后,Kimi關(guān)注度一路走高,一度擠爆了服務(wù)器。3月22日,月之暗面回應(yīng)稱,觀測(cè)到Kimi系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢(shì)遠(yuǎn)超對(duì)資源的預(yù)期規(guī)劃,并表示已經(jīng)有多項(xiàng)應(yīng)急措施正在實(shí)施,包括已經(jīng)進(jìn)行了5次擴(kuò)容工作。

此前,月之暗面副總裁許欣然在會(huì)議室展示了幾份用于測(cè)試的文件。幾十萬(wàn)字的《甄嬛傳》劇本,Kimi不僅能夠一口氣讀完,而且還能根據(jù)情節(jié)準(zhǔn)確回答出細(xì)節(jié)問(wèn)題,解析人物劇情走向;在迅速學(xué)習(xí)完頭部醫(yī)學(xué)書(shū)籍《中醫(yī)內(nèi)科學(xué)》和《中醫(yī)診斷學(xué)》后,便可化身“老中醫(yī)”進(jìn)行在線問(wèn)診。

Kimi的成功破圈,讓國(guó)內(nèi)一眾大模型廠商感到措手不及。

01 Kimi,真的強(qiáng)嗎?

Kimi用戶體驗(yàn)如何?派財(cái)經(jīng)對(duì)Kimi、文心一言、通義千問(wèn)和豆包做了系列小測(cè)試。分別對(duì)其資料總結(jié)能力、檢索能力和創(chuàng)作能力進(jìn)行了測(cè)驗(yàn)。

首先是對(duì)資料總結(jié)、財(cái)報(bào)解讀能力測(cè)試:

派財(cái)經(jīng)隨機(jī)上傳了一份阿里2024財(cái)年中期報(bào)告pdf,輸入解讀指令。根據(jù)生成內(nèi)容來(lái)看,Kimi和通義千問(wèn)給出的回答,羅列較為清晰,而文心一言則給出了概況,具體需要進(jìn)一步指令才能繼續(xù)解讀,豆包給出了核心數(shù)據(jù)提煉回答。

其次是對(duì)用戶常用的資料檢索和整理功能測(cè)試:

派財(cái)經(jīng)以“幫我閱讀馬斯克最新演講”為指令,分別詢問(wèn)。根據(jù)生成內(nèi)容來(lái)看,Kimi通過(guò)對(duì)7篇資料檢索解讀,給出了邏輯明確且詳細(xì)的觀點(diǎn)總結(jié),豆包則直接搜索出了多個(gè)相關(guān)報(bào)道鏈接,文心一言和通義千問(wèn)則給出了比較框架性的總結(jié)。

值得注意的是,派財(cái)經(jīng)發(fā)現(xiàn)在已經(jīng)創(chuàng)建的Kimi窗口上傳完本地文件和網(wǎng)之后,智能助手會(huì)自動(dòng)關(guān)閉聯(lián)網(wǎng)模式,這一功能在其它三個(gè)智能助手界面尚未發(fā)現(xiàn)。

再是對(duì)創(chuàng)作能力,生成腳本等創(chuàng)作力測(cè)試:

派財(cái)經(jīng)以“圍繞北京文旅為主題,寫(xiě)一個(gè)短劇劇本”為指令,分別測(cè)試其創(chuàng)作能力。按照給出的基礎(chǔ)大綱來(lái)看,通義千問(wèn)、Kimi和豆包給出了較為規(guī)范的劇本大綱框架,其中Kimi給出的最為規(guī)范且細(xì)節(jié),提到角色、場(chǎng)景、地點(diǎn)相對(duì)較詳細(xì),在取名上也較為文藝。相較之下,文心一言給出的標(biāo)題則較為直接,未交待劇本角色設(shè)定,但在場(chǎng)景、對(duì)話和獨(dú)白上更有“人味”。

綜上,在文生文應(yīng)用上,Kimi的效果確實(shí)是看起來(lái)更有特色。

02 誰(shuí)在為Kimi站臺(tái)?

Kimi智能助手是國(guó)內(nèi)大模型獨(dú)角獸公司月之暗面面向C端用戶推出的一項(xiàng)產(chǎn)品。

月之暗面公司成立于2023年3月,創(chuàng)始人楊植麟畢業(yè)于清華,博士畢業(yè)于卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)專業(yè),曾就職于Google Brain和美國(guó)初創(chuàng)公司FAIR,師從蘋(píng)果公司人工智能負(fù)責(zé)人Ruslan Salakhutdinov,有多年創(chuàng)業(yè)經(jīng)驗(yàn)。

從技術(shù)能力上看,Kimi的強(qiáng)大基因最初就已經(jīng)在創(chuàng)始人身上顯現(xiàn)。楊植麟是業(yè)內(nèi)公認(rèn)的長(zhǎng)文本領(lǐng)域?qū)<?,在近五年的自研語(yǔ)言處理(NLP)領(lǐng)域影響力頗大。

在讀博士期間,楊植麟就以第一作者身份發(fā)表 Transformer-XL 和 XLNet 兩項(xiàng)工作,在谷歌學(xué)術(shù)上被引用近兩萬(wàn)次,并在多個(gè)NLP任務(wù)上取得了當(dāng)時(shí)的最佳效果。而Transformer-XL成為首個(gè)全面超越 RNN 的注意力語(yǔ)言模型,XLNet則在20項(xiàng)頂級(jí)會(huì)議中獲得最佳論文提名。在華人學(xué)者引用排名中,楊植麟的學(xué)術(shù)論文位居前10,在40歲以下排名第一。

楊植麟的學(xué)術(shù)研究能力,助力其團(tuán)隊(duì)創(chuàng)造了Kimi獨(dú)特且表現(xiàn)優(yōu)秀的無(wú)損壓縮技術(shù)。

這種技術(shù)可減少參數(shù)對(duì)存儲(chǔ)的需求、推理的算力,以及數(shù)據(jù)傳輸?shù)膸捳加?,從而高效率無(wú)損處理百萬(wàn)級(jí)的長(zhǎng)Token。而為了快速趕上長(zhǎng)文本熱潮,其他大廠只能退而求其次,選擇檢索增強(qiáng)生成RAG技術(shù)。

Kimi的無(wú)損長(zhǎng)上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術(shù)是對(duì)全文關(guān)鍵信息進(jìn)行檢索生成答案,但可能會(huì)丟失掉部分關(guān)鍵的信息。

這也就解釋了為何Kimi的長(zhǎng)文本對(duì)話回答更準(zhǔn)確,在用戶體驗(yàn)度上美譽(yù)頗多。

但也有小紅書(shū)博主發(fā)筆記表示,在對(duì)Kimi的測(cè)試中發(fā)現(xiàn),Kimi有一股RAG味。

“月之暗面”這個(gè)名字,來(lái)源于英國(guó)著名搖滾樂(lè)隊(duì)Pink Floyd的專輯《The Dark Side of the Moon》,在科研之外,楊植麟也是一名搖滾發(fā)燒友,他曾在樂(lè)隊(duì)中擔(dān)任鼓手角色。

資本市場(chǎng)眾星捧月。創(chuàng)業(yè)一年之內(nèi),月之暗面就已經(jīng)完成了兩筆融資。最新一輪融資是在今年2月19日,融資額度超10億美金,投資方包括紅杉中國(guó)、小紅書(shū)、美團(tuán)、阿里,老股東跟投。該筆融資成為國(guó)內(nèi)AI大模型迄今為止單輪融資最高的金額。早在2023年6月,月之暗面就曾獲得來(lái)自包括紅杉中國(guó)、真格基金等頭部投資公司的3億美金融資。在兩輪融資之后,當(dāng)前月之暗面估值達(dá)到了25億美元。

Kimi的走火,離不開(kāi)阿里在底層的算力支持。有消息稱,最新10億美金融資中有8億美金來(lái)自阿里,部分資金以阿里提供的算力折算。當(dāng)前,Kimi借調(diào)了阿里的英偉達(dá)(NVDA.O)A800以及A100 GPU處理器的機(jī)型進(jìn)行擴(kuò)容,未來(lái)Kimi算力側(cè)的支持,也將主要來(lái)自于阿里。

03 Kimi搶了文心一言和豆包們的故事

在對(duì)AI長(zhǎng)文本探索上,Kimi絕對(duì)不是第一家,國(guó)內(nèi)大模型頭部大廠,百度文心一言、阿里通義千問(wèn)和360AI早已在做長(zhǎng)文本的探索,抖音也在去年年底發(fā)力AI工具豆包。

在其他大模型大廠還在卷參數(shù)、開(kāi)源和榜單的時(shí)候,Kimi切中了一個(gè)更貼近市場(chǎng)剛需的應(yīng)用場(chǎng)景。將長(zhǎng)文本作為標(biāo)簽,通過(guò)大量的廣告營(yíng)銷(xiāo)和用戶口碑,以“長(zhǎng)文本”概念迅速占領(lǐng)用戶心智。上線之初,就通過(guò)突出文本處理字?jǐn)?shù),為自己貼上了“超大內(nèi)存”的標(biāo)簽,在PC硬件時(shí)代,不少C端用戶的認(rèn)知是,內(nèi)存越大,處理能力就越強(qiáng)。

在Kimi出圈之前,行業(yè)內(nèi)在C端用戶市場(chǎng)教育上,百度的文心一言一家獨(dú)大,文心一言是大模型廠商中率先向社會(huì)全面開(kāi)放的平臺(tái)。據(jù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),截至2023年9月,百度文心一言App的月活量達(dá)到最高峰值710萬(wàn)。不過(guò)與Kimi不同的是除了2C之外,文心一言更大的精力放在研發(fā)行業(yè)大模型,垂直B端應(yīng)用上。

其次是抖音的豆包在年初的初露頭角。依托于抖音的流量轉(zhuǎn)化池,字節(jié)跳動(dòng)旗下的豆包APP在2024年1月活翻了一倍達(dá)到了400萬(wàn)。

而新晉“網(wǎng)紅”Kimi的走紅要更快,據(jù)Similarweb數(shù)據(jù),Kimi Chat網(wǎng)頁(yè)端數(shù)據(jù)最新峰值達(dá)34.6萬(wàn)人次。根據(jù)AI產(chǎn)品榜,Kimi Chat的2月訪問(wèn)量在國(guó)內(nèi)榜排名第三,2月平均日活同比上升101.9%,全球增速榜排名第一,3月前二周繼續(xù)攀升。

Kimi上線的時(shí)間是2023年10月,當(dāng)時(shí)可以支持無(wú)損上下文長(zhǎng)度最多為20萬(wàn)漢字。在5個(gè)月的時(shí)間內(nèi),月之暗面直接將長(zhǎng)文本能力提高10倍。按照AI領(lǐng)域的計(jì)算標(biāo)準(zhǔn),200萬(wàn)漢字的長(zhǎng)度大約為400萬(wàn)token,在全球范圍內(nèi)也屬于領(lǐng)先的標(biāo)準(zhǔn)。3月18日,月之暗面宣布在大模型長(zhǎng)上下文窗口技術(shù)上取得新的突破,其自研的Kimi智能助手已支持200萬(wàn)字超長(zhǎng)無(wú)損上下文,并于今日開(kāi)啟產(chǎn)品內(nèi)測(cè)。

月之暗面方面表示,如今Kimi能夠一口氣精讀500個(gè)甚至數(shù)量更多的文件,幫助用戶快速分析所有文件的內(nèi)容,并且支持通過(guò)自然語(yǔ)言進(jìn)行信息查詢和篩選,大大提高信息處理效率。

在產(chǎn)品定位上,Kimi足夠堅(jiān)定,面向C端用戶,主打長(zhǎng)文本。AI搜索+文檔總結(jié)功能。

Kimi開(kāi)始就為用戶敞開(kāi)了大門(mén),不僅能從網(wǎng)頁(yè)端入口進(jìn)入,還能在APP和小程序端口打開(kāi),降低了使用大模型的門(mén)檻,這是業(yè)內(nèi)B端大模型廠商無(wú)法匹敵的。

在選擇早期產(chǎn)品使用者集中在科研、法律、金融、媒體等垂直領(lǐng)域,而這部分垂直領(lǐng)域的KOL為Kimi帶來(lái)了自然流量與口碑積累。

Kimi在發(fā)力營(yíng)銷(xiāo)同時(shí),也有一部分“自來(lái)水”自發(fā)為Kimi站臺(tái)推廣。

將互聯(lián)網(wǎng)營(yíng)銷(xiāo)公式帶入到了硬科技領(lǐng)域,Kimi的營(yíng)銷(xiāo)開(kāi)局頗為高調(diào)。在月之暗面發(fā)布的Kimi上線官宣文標(biāo)題中提到,“歡迎與Moonshot AI共同開(kāi)啟Looooooooooong LLM時(shí)代”,其中英文“l(fā)ong”用了接連十個(gè)“o”將Kimi的“長(zhǎng)文本能力”直觀呈現(xiàn)出來(lái)。

Kimi提供的長(zhǎng)文本閱讀能力和概括能力是兩大功能,面向C端用戶,致力于為用戶打造一個(gè)高學(xué)習(xí)力的免費(fèi)私人助手。

一份上萬(wàn)字的文獻(xiàn),投喂給Kimi,只需要幾分鐘就能讀完全文并歸納總結(jié)出核心論點(diǎn),極大程度為用戶提升了閱讀效率。

用戶投喂的各種資料又能反哺Kimi的語(yǔ)意語(yǔ)境學(xué)習(xí)理解能力,從而在不斷打磨中提高準(zhǔn)確性。值得一提的是,在此類專業(yè)語(yǔ)料處理上的進(jìn)步速度,Kimi甚至快于Open AI。主要由于當(dāng)前Open AI對(duì)于C端用戶上傳文件仍然有所限制。

如果把Kimi智能助手類比做人類,它的突出之處在于具備較長(zhǎng)時(shí)間段的記憶力,是一個(gè)記性超好的學(xué)霸,可以一次記住20萬(wàn)字的上下文,一口氣讀完一本書(shū)或者一系列文章。相較國(guó)外綜合能力最強(qiáng)的學(xué)霸GPT4(可以記住2.5萬(wàn)字)。Kimi的記憶力是GPT4的8倍。

有小紅書(shū)博主試著通過(guò)Kimi智能助手,訓(xùn)練出在自媒體領(lǐng)域現(xiàn)象級(jí)創(chuàng)作者咪蒙,將50個(gè)文檔投喂給Kimi之后,一步步引導(dǎo)其分析咪蒙寫(xiě)作的核心特點(diǎn)以及對(duì)待感情態(tài)度后,下指令讓其生成一篇關(guān)于“彩禮”的文章,成稿雖然簡(jiǎn)短但頗具“咪蒙味”。

在Kimi走火之后,各大模型廠商紛紛“秀肌肉”。

據(jù)第三方機(jī)構(gòu)的最新統(tǒng)計(jì)數(shù)據(jù)顯示,目前國(guó)內(nèi)已經(jīng)發(fā)布的大型語(yǔ)言模型數(shù)量已經(jīng)超過(guò)了300個(gè)。這些大型模型的發(fā)布主體涵蓋了科技巨頭、國(guó)內(nèi)頂尖的高等學(xué)府、以及各類科研機(jī)構(gòu),他們?cè)谫Y金投入、資源配置、人才聚集等方面都擁有絕對(duì)的優(yōu)勢(shì)。

國(guó)內(nèi)互聯(lián)網(wǎng)大廠火速將相關(guān)功能進(jìn)行了升級(jí),卷起了長(zhǎng)文本“長(zhǎng)度”。

2023年10月30日,Kimi首發(fā)不到一個(gè)月,同為清華系校友的王小川的百川智能就推出了單次處理35萬(wàn)漢字的Baichuan2-192K,打破了Kimi的20萬(wàn)字記錄,隨后,李開(kāi)復(fù)也發(fā)布了能夠處理40萬(wàn)字的Yi-34B。

在Kimi宣布更新200萬(wàn)字長(zhǎng)文檔處理能力后,阿里宣布通義千問(wèn)升級(jí),免費(fèi)開(kāi)放1000萬(wàn)字的長(zhǎng)文檔處理功能,成為全球文檔處理容量第一的AI應(yīng)用;隨后,百度文心一言、360智腦也都把500萬(wàn)字長(zhǎng)文本提上了日程。

目前,大模型最強(qiáng)王者OpenAI的GPT-4 Turbo-128k可處理文本能力約為10萬(wàn)漢字,專攻長(zhǎng)本文的Claude3-200K上下文處理能力約為16萬(wàn)漢字。

一時(shí)間,各大模型廠商比起了誰(shuí)更“長(zhǎng)”,而文本處理能力越長(zhǎng)就能代表能力強(qiáng)嗎?

此前,對(duì)于文本窗口的長(zhǎng)度,楊植麟曾表示,不能只提升窗口,不能只看數(shù)字,要看它在這個(gè)窗口下能實(shí)現(xiàn)的推理能力、the faithfulness的能力(對(duì)原始信息的忠實(shí)度)、the instruction following的能力(遵循指令的能力)。

04 長(zhǎng)文本能力能幫Kimi造血嗎?

Kimi火爆的表象之下,一個(gè)更為現(xiàn)實(shí)的問(wèn)題暴露無(wú)遺,長(zhǎng)文本能力能為Kimi造血嗎?

根據(jù)新浪科技提供的數(shù)據(jù),考慮到廣告投放和算力成本,Kimi每個(gè)獲客用戶的成本達(dá)到12-13元,而按照近一個(gè)月將近18000的日均下載量計(jì)算,Kimi每日的獲客成本高達(dá)20萬(wàn)元。而除了每日20萬(wàn)的獲客成本外,Kimi需要燒錢(qián)的地方還有很多,比如不斷提升信息檢索能力、遵循復(fù)雜指令的能力,推動(dòng)多模態(tài)模型研發(fā),以及實(shí)現(xiàn)音頻處理等其他需求。

接下來(lái),付出了高額成本,能否將現(xiàn)有用戶留住,持續(xù)轉(zhuǎn)化將是對(duì)Kimi產(chǎn)品的一大考驗(yàn)。為龐大的用戶群體提供穩(wěn)定的服務(wù),同樣是一筆不小開(kāi)支。

長(zhǎng)文本能力短期內(nèi)幫助Kimi出圈,但很難成為其獨(dú)家技術(shù)壁壘。Kimi的長(zhǎng)文本處理能力與通義千問(wèn)、360智腦等AI產(chǎn)品相比,并沒(méi)有非常明顯的優(yōu)勢(shì)。

雖然實(shí)現(xiàn)造血能力難,但Kimi的C端策略也有一定意義,通過(guò)長(zhǎng)文本先征服用戶,進(jìn)而讓更多B端客戶看到大模型底層應(yīng)用能力的真正價(jià)值。

但從整體盈利角度來(lái)看,Kimi靠燒錢(qián)摸索出的獲客模式很容易被復(fù)制,對(duì)于將業(yè)務(wù)重心放在B端服務(wù)的大廠們來(lái)說(shuō),獲客成本反而是更低的。

行業(yè)內(nèi)多數(shù)大模型公司均采取的是2B和2C兩條腿走路,通過(guò)推出行業(yè)大模型直接售賣(mài)B端解決方案,或是向公司、開(kāi)發(fā)者售賣(mài)API,按照調(diào)用次數(shù)收費(fèi)。此外,以文心一言為代表的一種C端打法是,面向C端用戶,為會(huì)員增值服務(wù),在應(yīng)用端按月/年向用戶收費(fèi),當(dāng)前文心一言扔在試水階段,而后起之秀Kimi則仍然處于免費(fèi)模式階段。

不過(guò),有聲音認(rèn)為,Kimi的出現(xiàn)對(duì)于國(guó)內(nèi)大模型市場(chǎng)提供了新的思路,從基礎(chǔ)大模型的訓(xùn)練和競(jìng)爭(zhēng)逐步向更貼近客戶的產(chǎn)品功能和細(xì)節(jié)需求轉(zhuǎn)變。

有業(yè)內(nèi)人士表示,當(dāng)下這一輪人工智能革命本質(zhì)上是自然語(yǔ)言處理(NLP)的技術(shù)革命,更是一次交互方式的革命。從文本向多模態(tài)發(fā)展是大模型必經(jīng)之路。而視頻處理需要更大的參數(shù)量和存儲(chǔ)容量,對(duì)算力和算法的要求也更高。接下來(lái)Kimi的應(yīng)用將從單模態(tài),向多模態(tài)化發(fā)展,即從單一的文本處理基礎(chǔ)上,增添聲音、圖像等信息處理技術(shù)。

亦有觀點(diǎn)認(rèn)為,Kimi的出圈意味著在中文領(lǐng)域開(kāi)啟了AI大模型應(yīng)用元年,長(zhǎng)文本時(shí)代已至。大模型在實(shí)現(xiàn)通往AGI(通用人工智能)路上又近了一步。然而需要厘清的是,長(zhǎng)文本能力并非唯一標(biāo)準(zhǔn),多模態(tài)學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)架構(gòu)創(chuàng)新、應(yīng)用落地與生態(tài)建設(shè)、倫理與道德框架構(gòu)建等各個(gè)維度都不可或缺。

一位初入職場(chǎng)的金融分析師向派財(cái)經(jīng)感嘆道,Kimi的強(qiáng)大學(xué)習(xí)理解能力讓人感到威脅,“可能過(guò)不了多久,向我這樣的初級(jí)分析師就要被AI智能助手替代了?!边@一擔(dān)憂并非空穴來(lái)鳳,在效率至上的資本市場(chǎng),華爾街有個(gè)說(shuō)法叫“20美金實(shí)習(xí)生”,時(shí)薪20美金的實(shí)習(xí)生工作未來(lái)一段時(shí)間大概率會(huì)被AI替代。

AI是否會(huì)替代職場(chǎng)人?在《所羅門(mén)的密碼:AI時(shí)代的價(jià)值、權(quán)力與信任》中,作者奧拉夫·格羅思、馬克·尼茲伯格曾給出過(guò)解釋,“最終,問(wèn)題不在于工作是否會(huì)改變,工人是否會(huì)被取代。這甚至不需要超級(jí)智能就會(huì)實(shí)現(xiàn)。問(wèn)題是這些轉(zhuǎn)變將會(huì)以多快的速度發(fā)生,我們能否跟上它們的步伐,特別是在教育和勞動(dòng)力培訓(xùn)方面。正如奧萊利媒體公司的創(chuàng)始人兼首席執(zhí)行官蒂姆·奧萊利(Tim O’Reilly),在他的視頻《我們?yōu)槭裁从肋h(yuǎn)不會(huì)失業(yè)》中所說(shuō)的那樣,我們的辦法總比困難多。但是,適應(yīng)新的工作性質(zhì)需要發(fā)揮想象力并做好準(zhǔn)備?!?/p>

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。