文|適道
01 看來(lái)做AI是真不賺錢(qián)
有句話說(shuō):看一個(gè)行業(yè)能不能賺錢(qián),就看賣(mài)課的多不多。
行業(yè)遍地黃金時(shí),大家都在埋頭淘金,誰(shuí)會(huì)想不開(kāi)讓別人搶飯碗。只有“卷無(wú)可卷”時(shí),才會(huì)靠賣(mài)信息差,割一波韭菜。
現(xiàn)在國(guó)內(nèi)AI行業(yè)便是如此:做技術(shù)開(kāi)發(fā)門(mén)檻高,成本大,戰(zhàn)線長(zhǎng),靠講故事拉不來(lái)投資人。
如果不想這樣,你可以另辟蹊徑——賣(mài)課。
199元AI課程,一年賣(mài)出25萬(wàn)份,營(yíng)收5000萬(wàn)元,這不比吭哧吭哧搞開(kāi)發(fā)賺錢(qián)?
但這個(gè)世界是一個(gè)巨大的套娃,“盜用”的“盜用”也在賺錢(qián)。在某寶上,李一舟的全套課程花0.26元就能買(mǎi)到,同時(shí)還贈(zèng)送另一“巨頭”鶴老師的全套AI課,月銷(xiāo)量相當(dāng)可觀。
為何AI培訓(xùn)這么賺錢(qián)?換個(gè)問(wèn)法,為何熱門(mén)技術(shù)培訓(xùn)這么賺錢(qián)?
知識(shí)付費(fèi)是向人性的弱點(diǎn)付費(fèi),當(dāng)賺大錢(qián)的欲望和被淘汰的恐懼雙管齊下,再加上“清華博士”“小白可學(xué)”“全程服務(wù)”等誘人噱頭,輔以“199”的低價(jià)。誰(shuí)聽(tīng)了都心動(dòng)。
賣(mài)課就是“講故事”。哪個(gè)技術(shù)熱門(mén),哪里就有故事。投資人聽(tīng)膩了的故事,說(shuō)給“韭菜”聽(tīng)卻很新鮮。
2021年,《元宇宙第一講》10天狂賺160萬(wàn);
2023年,《每個(gè)人的人工智能課》一年?duì)I收5000萬(wàn)。
所有的slogan都總結(jié)為一句話:xxx是普通人改變命運(yùn)的最后一波機(jī)會(huì)。“xxx”可以是元宇宙,可以是區(qū)塊鏈,人工智能,也可能是未來(lái)任何一項(xiàng)熱門(mén)技術(shù)。
盲猜下一個(gè)是教企業(yè)怎么出海(狗頭保命)。
02 AI創(chuàng)業(yè)都繞不開(kāi)的“套殼”
除了賣(mài)課,我們回到AI賺錢(qián)的第二條捷徑“套殼”,當(dāng)然,在李一舟的案例里,說(shuō)“借殼”更準(zhǔn)確。
其實(shí)“套殼”沒(méi)有一個(gè)明確的定義。
大模型“內(nèi)核”指核心架構(gòu)和算法。如果深究下去,你甚至可以說(shuō)幾乎所有模型都在“套殼”Google DeepMind 的 Transformer 及其三個(gè)變體架構(gòu)。
實(shí)際上,“套殼”也并非沒(méi)有技術(shù)含量。我們先從大模型的研發(fā)原理來(lái)看。
首先,自研大模型需要經(jīng)過(guò)預(yù)訓(xùn)練(Pre-training)和調(diào)優(yōu)(Fine-tuning)。
預(yù)訓(xùn)練(Pre-training),開(kāi)發(fā)者給大模型“喂知識(shí)”,不介入它,讓它“啃書(shū)”自學(xué),而后得到一個(gè)基礎(chǔ)的能力,即基座模型(Base Model)。
調(diào)優(yōu)(Fine-tuning),也稱(chēng)“微調(diào)”,開(kāi)發(fā)者給大模型“出題”,介入式地讓它能夠適應(yīng)特定任務(wù)的需求。
此時(shí),如果在基座模型(Base Model)上加入特定行業(yè)的數(shù)據(jù)集做進(jìn)一步的微調(diào),就會(huì)得到一個(gè)微調(diào)模型(Fine-tuning Model),或稱(chēng)為行業(yè)模型、垂直模型。
基于多種情景的“套殼”就發(fā)生在以上研發(fā)過(guò)程。
例如在預(yù)訓(xùn)練階段,會(huì)出現(xiàn)“數(shù)據(jù)套殼”,此前爆出因?yàn)橹形臄?shù)據(jù)質(zhì)量差,有國(guó)內(nèi)團(tuán)隊(duì)用ChatGPT輸出的數(shù)據(jù)進(jìn)行訓(xùn)練。
在調(diào)優(yōu)階段,也會(huì)出現(xiàn)“微調(diào)套殼”,但其中不乏優(yōu)秀產(chǎn)品,例如Perplexity。該AI問(wèn)答引擎微調(diào)了GPT-3.5,性能顯著提升,但比GPT-4的費(fèi)用低,速度快。前一周,Perplexity完成B輪融資,估值5.2億美元。
不過(guò),以上幾種“套殼”都具備相當(dāng)一部分的技術(shù)含量。而我們平時(shí)最常說(shuō)的“套殼”是指簡(jiǎn)單粗暴地套開(kāi)源或者ChatGPT,技術(shù)門(mén)檻相當(dāng)?shù)?,也可以稱(chēng)之為“借殼”。
目前,國(guó)內(nèi)很多“借殼”ChatGPT向用戶收費(fèi)。雖然這一行為已經(jīng)涉嫌侵權(quán),只不過(guò)因?yàn)镺penAI在國(guó)內(nèi)沒(méi)有代理商,無(wú)法起訴。
但這不代表“借殼”者可以肆意妄為。
根據(jù)2023年7月出臺(tái)的《生成式人工智能服務(wù)管理暫行辦法》,對(duì)于來(lái)源于中國(guó)境外向境內(nèi)提供生成式人工智能服務(wù)不符合法律、行政法規(guī)和本辦法規(guī)定的,國(guó)家網(wǎng)信部門(mén)應(yīng)當(dāng)通知有關(guān)機(jī)構(gòu)采取技術(shù)措施和其他必要措施予以處置。其中,構(gòu)成犯罪的,依法追究刑事責(zé)任。
但《辦法》也在多處放寬了監(jiān)管要求,并增加了鼓勵(lì)人工智能技術(shù)發(fā)展的措施。
例如,明確生成式AI實(shí)施算法的“備案制”,此前預(yù)期則是審核許可制。
例如,《辦法》規(guī)定,利用生成式人工智能技術(shù)向中華人民共和國(guó)境內(nèi)公眾提供生成文本、圖片、音頻、視頻等內(nèi)容的服務(wù),適用本辦法。而在4月的《征求意見(jiàn)稿》第二條中,只要是向境內(nèi)用戶提供服務(wù),不論是“研發(fā)”生成式AI還是“利用”生成式AI,都屬于監(jiān)管范圍。
我們可以推測(cè),“研發(fā)”和“利用”畫(huà)出了模型“借殼”和“微調(diào)”法律適用范圍的不同。在當(dāng)前國(guó)內(nèi)AI創(chuàng)業(yè)場(chǎng)景中,完全不“套殼”可能行不通。但開(kāi)發(fā)者技術(shù)門(mén)檻越高,“研發(fā)”含量越高,就越不容易觸及監(jiān)管底線。
03 “三重?cái)⒃帯被蛏嫦悠墼p
最后,回到李一舟事件,你會(huì)發(fā)現(xiàn)這廝玩的居然是“三重?cái)⒃帯薄?/p>
一開(kāi)始,他說(shuō)他是“自研”模型,但其平臺(tái)卻是“借殼”組合,當(dāng)你以為他只是“借殼”,面具下面卻是“盜用”。
從目前來(lái)看,國(guó)內(nèi)很多模型都是開(kāi)發(fā)者“微調(diào)”開(kāi)源模型Stable Diffusion而來(lái)。
據(jù)「市界」報(bào)道:一位名為“兔猻”的AI繪圖模型開(kāi)發(fā)者發(fā)現(xiàn),自己微調(diào)的3個(gè)模型被一舟智能“盜用”,其中兩個(gè)模型是他與Liblib平臺(tái)簽署了獨(dú)家協(xié)議合同。煉丹科技創(chuàng)始人忠忠,獨(dú)立開(kāi)發(fā)者娜烏斯嘉等人發(fā)現(xiàn),自己在其他平臺(tái)發(fā)布的模型出現(xiàn)在了一舟智能的官網(wǎng)首頁(yè)。
對(duì)開(kāi)發(fā)者而言,最直接的影響是他們無(wú)法從自己制作的模型產(chǎn)品中獲得任何收益?!巴锚s”訓(xùn)練模型時(shí)間多達(dá)半年,租賃算力花費(fèi)2萬(wàn)元,購(gòu)買(mǎi)英偉達(dá)顯卡花費(fèi)8萬(wàn)元。
目前,合計(jì)97個(gè)模型,除1個(gè)模型為Stable Diffusion XL官方模型外,其余均為國(guó)內(nèi)或國(guó)外開(kāi)發(fā)者所制作第三方模型。
這就讓人不禁想問(wèn)一句,如此光明正大地搬運(yùn)國(guó)內(nèi)開(kāi)發(fā)者模型,還對(duì)學(xué)員稱(chēng)“自研”模型,不怕被告兩頭詐騙嗎?
不過(guò),有律師表示不明確是否構(gòu)成“詐騙”,因?yàn)锳I相關(guān)的內(nèi)容和課程的含義本身比較寬泛,只要在用戶付費(fèi)后,提供了約定的相關(guān)資料,就不能說(shuō)詐騙。至于這些資料是否符合用戶的預(yù)期,屬于合同履行的問(wèn)題。
但可以肯定的是,李一舟的AI課不僅涉嫌違反《廣告法》和《反不正當(dāng)競(jìng)爭(zhēng)法》,構(gòu)成虛假宣傳的不正當(dāng)競(jìng)爭(zhēng)行為,而且涉嫌違反《消費(fèi)者權(quán)益保護(hù)法》,侵犯消費(fèi)者的知情權(quán)、公平交易權(quán)等。
目前,LiblibAI已經(jīng)發(fā)布聲明,表示密切關(guān)注此事件,并可能采取法律措施來(lái)追究侵權(quán)責(zé)任,為被侵權(quán)的創(chuàng)作者維權(quán)聲討。
據(jù)報(bào)道,目前愿意共同發(fā)聲的開(kāi)發(fā)者人數(shù),已經(jīng)達(dá)到了17人,對(duì)應(yīng)25個(gè)模型。雖然單個(gè)賠付金額不大,但如果有律師來(lái)搞集體訴訟,結(jié)果就很難預(yù)料了。
參考資料:
- 《Sora封的第一個(gè)“神”,塌了》,市界 董溫淑 董雨晴
- 《大模型套殼祛魅:質(zhì)疑套殼,理解套殼》,甲子光年 趙健
- 《李一舟再陷兩大硬核爭(zhēng)議:一舟智能未獲備案涉嫌非法運(yùn)營(yíng),盜用AI繪圖模型》,鞭牛士 鞭牛士
- 《清華博士網(wǎng)紅“AI課賣(mài)了5000萬(wàn)”?AI課程亂象調(diào)查》,澎湃新聞 范佳來(lái) 史若彤 郭思航