正在閱讀:

科大訊飛回應(yīng)“套殼”,AI大模型狂潮祛魅

掃一掃下載界面新聞APP

科大訊飛回應(yīng)“套殼”,AI大模型狂潮祛魅

大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最后?

文|數(shù)智商業(yè)秀 崔思

編輯|張弘一

“星火大模型與OpenAI,是什么關(guān)系?”

“我和OpenAI沒有關(guān)系,我是訊飛星火認(rèn)知大模型,我是由科大訊飛優(yōu)秀的人工智能科學(xué)家、工程師和語言學(xué)家等組成的團(tuán)隊自主研發(fā)的?!?/p>

當(dāng)「商業(yè)秀」在星火認(rèn)知大模型輸入以上問題后,它很快給出了答復(fù)。這與近期訊飛星火大模型的一則傳言不符。

近日有網(wǎng)友發(fā)現(xiàn),訊飛星火大模型在有些“問答”中會出現(xiàn)“我是由OpenAI開發(fā)的”等內(nèi)容,由此一則關(guān)于“訊飛星火大模型被質(zhì)疑‘套殼OpenAI的ChatGPT’”的消息傳播開來。

5月11日,科大訊飛在最新披露的投資者關(guān)系活動記錄表中表示,星火大模型“套殼OpenAI的ChatGPT”既不符合事實,也不符合邏輯。

科大訊飛具體表示,如果是套殼 ChatGPT,就不可能出現(xiàn)訊飛星火大模型的響應(yīng)速度比ChatGPT還快;更不會出現(xiàn)訊飛星火大模型在文本生成、知識問答、數(shù)學(xué)能力等方面的結(jié)果均優(yōu)于 ChatGPT 的情況。

我們有理由相信,此時的科大訊飛,比任何一家公司都需要大模型的故事,而非“套殼”事故。且先不論大模型本身的優(yōu)劣,光看科大訊飛迅速辟謠這一行徑,足見星火大模型對其之重要。至少在挽救股價層面,大模型的影響無出其右,就在這個季度乃至更漫長的一段時間內(nèi),均是如此。

今年4月底,科大訊飛發(fā)布了2022年財報和2023年一季度報,財報顯示,凈利潤出現(xiàn)大幅下滑態(tài)勢,市場似乎對其瞬間喪失了大部分信心,股價一路下跌。直到5月6月(星期六),科大訊飛發(fā)布星火大模型,在5月8日開盤后,其股價才開始拉升10%,此后數(shù)日,一度呈現(xiàn)上漲趨勢。市場對這家公司,似乎又恢復(fù)了信心。

推出大模型,再經(jīng)歷被質(zhì)疑“套殼OpenAI”事件,科大訊飛也必須面對共同的AI話題:大模型紛紛扎堆,是時候該理性祛魅了。

在這個大模型橫空出世的時代,科大訊飛并非“孤勇者”。自ChatGPT發(fā)布以來,掀起的科技軍備競賽就一直沒有停息,其余威在國內(nèi)也愈演愈烈,各家公司在AI領(lǐng)域“卷”個不停,前段時間大模型集中爆發(fā),被評價為“頗有十年前互聯(lián)網(wǎng)‘百團(tuán)大戰(zhàn)’甚至‘千團(tuán)大戰(zhàn)’的氣勢”。

據(jù)不完全統(tǒng)計,在ChatGPT發(fā)布后的短短4個月時間里,至少已經(jīng)有30多個國內(nèi)研發(fā)機構(gòu)和企業(yè),在ChatGPT發(fā)布之后紛紛推出了自己品牌的大模型和相關(guān)產(chǎn)品。

一時間,整個科技圈“類ChatGPT”比比皆是,聲稱“國內(nèi)首發(fā)”的企業(yè)更是不少,資本市場風(fēng)起云涌。與大模型相關(guān)的媒體報道鋪天蓋地,隨后又陷入一陣短暫的沉寂。而下一波,大概率還在來的路上。

大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最后?決戰(zhàn)未來,各家真正的核心競爭力又是什么?

從商業(yè)發(fā)展的歷史規(guī)律來看,喧囂過后,市場終會擠破泡沫,大模型狂潮不可能永遠(yuǎn)持續(xù)。只有冷靜思考大模型能夠帶來的內(nèi)核性改變,才能真正抓住這場由AI技術(shù)帶來的產(chǎn)業(yè)變革機會。

01 超越了ChatGPT?

“目前星火認(rèn)知大模型在國內(nèi)明顯遙遙領(lǐng)先,中文已經(jīng)超越ChatGPT,英文已接近?!痹诳拼笥嶏w星火認(rèn)知大模型發(fā)布會上,劉慶峰自信滿滿地說道。

作為繼百度、阿里、商湯、昆侖萬維后,第五家正式發(fā)布大模型的公司,科大訊飛一上場,就迫不及待展示自己的強大能力。

劉慶峰更是全程主持發(fā)布會,并與科大訊飛研究院院長劉聰現(xiàn)場展示了包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、編程能力等多項能力。

在現(xiàn)場演示環(huán)節(jié),劉聰提問:“你為什么叫星火 ”“如果有個小伙子跟女朋友吵架了,那他應(yīng)該寧死不屈還是能屈能伸?” “孔子在2008年北京奧運會上說了什么?”等各類稀奇古怪的問題,星火迅速“接招”,并給出了恰如其分的回答。

在數(shù)學(xué)能力方面,劉聰也拋出了“花壇里有三種花,一共88朵,其中月季花的數(shù)量是菊花的4倍,牡丹花的數(shù)量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”這類計算問題。星火也很快給出了答案,并羅列了相關(guān)解題步驟。

劉慶峰隨即表示,數(shù)理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內(nèi)系統(tǒng)中遙遙領(lǐng)先,也超過了ChatGPT。

對此,「商業(yè)秀」也進(jìn)行了多輪“挖坑式”測試,例如詢問“姚明在幾幾年獲得了亞洲足球先生的稱號?” “范志毅在NBA服役多少年?斬獲了多少個進(jìn)球?”等問題。星火都準(zhǔn)確識別出了人為“陷阱”,并給出了恰當(dāng)?shù)幕卮稹?/p>

這表明,在常識性問題上,星火都進(jìn)行了一定的訓(xùn)練,并具備一定的糾錯能力。

相同的問題,「商業(yè)秀」也通過ChatGPT-3進(jìn)行了測試,其同樣也給出了恰當(dāng)?shù)幕卮?,但在信息豐富度上不及星火全面。

在數(shù)理能力上,「商業(yè)秀」也測試了“雞兔同籠,雞兔一共有25只,籠子里腳一共有74只,請問分別有多少只雞和多少只兔子?”“一支股票今天漲10%,明天跌10%,請問賺還是賠?”等問題,星火也迅速給出了正確回答。

「商業(yè)秀」將同樣的數(shù)理問題拋給了ChatGPT-3,在這方面,結(jié)果顯示ChatGPT-3的回答更有邏輯性。后者先給出了結(jié)論,再給出了具體實例,并且還會有延伸的問題,配合原問題答疑解惑。

星火還支持語音提問和輸出,即可通過語音提問,模型輸出的答案也能轉(zhuǎn)換為語音,并能通過持續(xù)對話調(diào)整語音風(fēng)格。

「商業(yè)秀」通過語音詢問“雞兔同籠,籠里一共有35只,一共有94只腳,問一共有多少只雞和多少只兔子” “中國拿到網(wǎng)球大滿貫職業(yè)選手是誰”等問題。星火也準(zhǔn)確識別了語音內(nèi)容,并給出了相應(yīng)的答案。

但這個操作,要求提問者的語速要很慢,并且能一字一句以標(biāo)準(zhǔn)普通話說出,否則星火可能無法準(zhǔn)確識別出相應(yīng)文字,或文字識別不準(zhǔn)確導(dǎo)致回答有誤。

經(jīng)過多輪測試,「商業(yè)秀」認(rèn)為,星火具備了一定的大語言模型能力,并且能夠在某些特定領(lǐng)域輸出自己的商業(yè)價值。

在發(fā)布會上,科大訊飛還發(fā)布了一系列結(jié)合星火大模型的產(chǎn)品,例如訊飛智能辦公本能將語音實時轉(zhuǎn)寫與墨水屏紙感書寫相結(jié)合,對會議記錄內(nèi)容形成一份精簡的會議紀(jì)要;“星火大模型+智能座艙”為數(shù)千個車型提供多輪、多人、多區(qū)域、多模態(tài)的語音交互;基于大模型的生成式RPA(機器人流程自動化),讓數(shù)字員工更智能……

但星火也不是沒有缺點,劉慶峰自己也在發(fā)布會上坦言,“大模型技術(shù)目前還存在不少待攻克的缺陷。包括新知識難以及時更新、事實類問答容易‘張冠李戴’,史實、傳統(tǒng)典籍等容易‘編造情節(jié)’等問題?!彼S之提及,上述問題在今年會有明顯的改進(jìn)。

據(jù)了解,星火認(rèn)知大模型始于2022年12月。彼時,科大訊飛啟動了“1+N”大模型技術(shù)攻關(guān)。其中,“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺,“N”是將認(rèn)知智能大模型技術(shù)應(yīng)用在教育、醫(yī)療、人機交互、辦公、翻譯等多個行業(yè)領(lǐng)域。

不到半年時間,星火認(rèn)知大模型正式面世,研發(fā)時間之短暫、模型發(fā)布之匆忙,這直接導(dǎo)致包括科大訊飛在內(nèi)的很多企業(yè)被外界質(zhì)疑。

確實,在這么短的時間內(nèi),星火的面世僅僅是一個開始,它仍需經(jīng)過多輪迭代優(yōu)化。劉慶峰在發(fā)布會上公布了星火認(rèn)知大模型的發(fā)展規(guī)劃:今年6月9日,星火大模型將突破開放式問答,多輪對話能力和數(shù)學(xué)能力再升級;8月15日,星火認(rèn)知大模型將突破代碼能力,多模態(tài)交互再升級;10月24日,星火認(rèn)知大模型通用模型將直接對標(biāo)ChatGPT,其中中文能力超越后者,英文能力與后者相當(dāng)。

從這份規(guī)劃日期來看,科大訊飛甚至細(xì)化到了哪一天,這從側(cè)面或許表明其急于想將大模型能力落地應(yīng)用,從而推進(jìn)商業(yè)化。業(yè)內(nèi)認(rèn)為,這或許與近幾年科大訊飛的商業(yè)化能力不佳有關(guān)。

02 急需大模型“提振信心”

此前,科大訊飛優(yōu)異的業(yè)績與賺錢能力常被業(yè)內(nèi)稱贊,但在經(jīng)歷了連續(xù)10年的增長后,神話基本結(jié)束于2022年。

科大訊飛2022年財報顯示,該公司實現(xiàn)營收188.2億元,同比微增2.77%;毛利為76.84億元,同比微增2%;歸母凈利潤5.61億元,同比下滑63.94%;扣非凈利潤4.18億元,同比下滑57.31%。

這還是科大訊飛錄入政府補貼后的數(shù)據(jù),2022年,科大訊飛政府補貼金額為11億元。與此同時,這也是近五年來科大訊飛凈利潤同比增長率首次出現(xiàn)下滑。數(shù)據(jù)顯示,從2018年到2022年,科大訊飛的凈利潤增長率分別為24.71%、51.12%、66.48%、14.13%和﹣63.94%。

資本市場對這一成績單頗感失望,在財報發(fā)布后,科大訊飛股價下跌超9%。

對于業(yè)績出現(xiàn)如此大幅變動,科大訊飛方面給出了三個原因。

首先是大環(huán)境的影響,科大訊飛表示“受到去年12月份和今年1月份特殊的社會經(jīng)濟(jì)客觀環(huán)境,以及春節(jié)假期影響,導(dǎo)致部分項目無法順利及時推進(jìn)”。

其次,繼2019年被列入美國實體清單,2022年10月7日被再次極限施壓,由于調(diào)整供應(yīng)鏈和相關(guān)合同簽署等工作影響了當(dāng)季訂單節(jié)奏。

最后一點,與星火大模型有關(guān)??拼笥嶏w提到,去年12月啟動的“1+N認(rèn)知智能大模型專項攻關(guān)”影響了當(dāng)期利潤,這從側(cè)面印證科大訊飛在大模型上的投入很大。

來到今年,這三大原因仍持續(xù)影響科大訊飛的業(yè)績。

數(shù)據(jù)顯示,2023年一季度,科大訊飛實現(xiàn)營收28.88億元,同比下降17.64%;凈虧損5789.5萬元,上年同期凈利潤1.1億元;扣非后歸母凈虧損3.38億元,上年同期凈利潤1.46億元。

據(jù)界面新聞報道,科大訊飛總裁吳曉如透露,2022年和2023年一季度訊飛凈利潤下滑嚴(yán)重主要在于公司在教育、醫(yī)療等持續(xù)運營型業(yè)務(wù)的合作平臺拓展投入、新產(chǎn)品研發(fā)以及核心技術(shù)自主可控和國產(chǎn)化適配等方向新增投入約8億元。

不過,科大訊飛對業(yè)績下滑的情況似乎不太擔(dān)心。在業(yè)績會上表示目前基于在國產(chǎn)替代和業(yè)務(wù)開拓上的進(jìn)展,預(yù)計從今年二季度開始將實現(xiàn)收入和毛利正向增長,并有信心實現(xiàn)全年高質(zhì)量增長的目標(biāo)。

科大訊飛的主營業(yè)務(wù)分別包括教育產(chǎn)品與服務(wù)、信息工程和開放平臺。其中教育產(chǎn)品是其主要營收來源,占到總營收比例的32.74%。

科大訊飛還構(gòu)建了面向G端、B端和C端三類客戶的業(yè)務(wù)體系:G端主要是面向地市縣等區(qū)域,涵蓋區(qū)域內(nèi)各類學(xué)校和用戶的因材施教解決方案;B端主要是面向?qū)W校的大數(shù)據(jù)精準(zhǔn)教學(xué)、英語聽說課堂、智慧作業(yè)等;C端主要以面向家長的AI學(xué)習(xí)機、個性化學(xué)習(xí)手冊、課后服務(wù)課程服務(wù)等產(chǎn)品。

財報顯示,G端業(yè)務(wù)目前已累計在 50 多個市、區(qū)(縣)級應(yīng)用;B端業(yè)務(wù)中的訊飛課后服務(wù)業(yè)務(wù)已覆蓋超300區(qū)縣、12000余所學(xué)校;C端的AI學(xué)習(xí)機該年銷售額增長超50%,但并未透露出具體銷售數(shù)量與金額。

而實際上,其業(yè)績與目標(biāo)業(yè)績尚相差甚遠(yuǎn)??拼笥嶏w曾在2022年初的公告中提到,各項根據(jù)地業(yè)務(wù)預(yù)計保持50%的增長。同時提到,2022年個性化學(xué)習(xí)手冊業(yè)務(wù)預(yù)計營收增長超70%,AI學(xué)習(xí)機收入目標(biāo)增長200%+,目標(biāo)十四五做到年收入100 億元。

除了主營業(yè)務(wù)未達(dá)預(yù)期外,科大訊飛的智慧城市、開放平臺及消費者業(yè)務(wù)、智慧汽車、智慧醫(yī)療等業(yè)務(wù)表現(xiàn)也較為一般。

財報顯示,智慧城市下屬的信息工程、數(shù)字政府行業(yè)應(yīng)用、智慧政法行業(yè)應(yīng)用三大板塊與開放平臺業(yè)務(wù)均呈現(xiàn)同比下降態(tài)勢。智慧汽車、智慧醫(yī)療與智慧金融業(yè)務(wù)雖然呈同比增長態(tài)勢,例如智慧金融同比增長19.33%,但在整體營收規(guī)模中的占比實在少得可憐,智慧金融僅占比1.25%,智慧汽車與智慧醫(yī)療分別占比2.47%和2.48%。

如此看來,科大訊飛的主營業(yè)務(wù)表現(xiàn)不佳,創(chuàng)新業(yè)務(wù)又還遠(yuǎn)未達(dá)到大規(guī)模營收的階段。此時的科大訊飛,必須要抓住大模型帶來的巨大價值,為各項業(yè)務(wù)增加更多商業(yè)競爭力。

但如今處于風(fēng)口浪尖的大模型,能否幫助科大訊飛實現(xiàn)目標(biāo),還需要時間去驗證。

03 大模型狂潮祛魅時分

今年數(shù)月以來,全球的科技企業(yè)們處于一種近乎瘋狂當(dāng)中。放眼國內(nèi)外,圍繞大模型發(fā)布的浪潮迭起,尤其是國內(nèi)的科技巨頭們接連推出了自己的大模型產(chǎn)品。

據(jù)「商業(yè)秀」不完全統(tǒng)計,目前已推出大模型產(chǎn)品的公司有百度文心一言、阿里通義千問、華為盤古、商湯日日新、昆侖萬維天工以及科大訊飛星火,同時王慧文、王小川等互聯(lián)網(wǎng)大佬創(chuàng)立的大模型公司也迅速獲得了融資。

但這么多大模型都能順利跑出來嗎?大模型的核心競爭價值到底是什么?大模型還能帶來哪些顛覆性機會?

瘋狂的大模型浪潮,也該到了理性審視的祛魅階段。

“現(xiàn)在涌現(xiàn)出很多大模型產(chǎn)品,但圍繞大模型的訓(xùn)練和調(diào)試成本投入非常高,一般公司真燒不起,同時對中小企業(yè)來說自研經(jīng)濟(jì)性較低,未來競爭更大可能發(fā)生在巨頭之間?!蹦筹L(fēng)投機構(gòu)投資經(jīng)理董浩對「商業(yè)秀」表示。

英偉達(dá)的研究表示,GPT3最大規(guī)模的模型需要使用到175 Billions的參數(shù)量,需要使用512顆V100顯卡訓(xùn)練7個月時間,或者使用1024顆A100芯片訓(xùn)練長達(dá)一個月的時間。每月大模型訓(xùn)練成本在數(shù)百萬美元以上量級。

上月,由中國人工智能學(xué)會主辦的人工智能大模型技術(shù)高峰論壇上,華為云人工智能領(lǐng)域首席科學(xué)家田奇發(fā)表的演講中也提到,大模型開發(fā)和訓(xùn)練的單次費用高達(dá)1200萬美元。

大模型開發(fā)成本如此高昂,但應(yīng)用成本(收費)很低。OpenAI在今年3月開放API(應(yīng)用程序接口),允許第三方開發(fā)者通過API將ChatGPT集成至應(yīng)用程序和服務(wù)中。其將接口服務(wù)定價為0.002美元/每1000 tokens,這一定價較GPT 3.5模型便宜約90%。

從經(jīng)濟(jì)角度考慮,這一定價很難將巨額研發(fā)投入賺回來,更不用說盈利了。所以這終究不是中小企業(yè)耗得起的生意,只有巨頭才有資金、資源投入,搶占未來的一席之地。

或許正因如此,目前已發(fā)布大模型產(chǎn)品的企業(yè),都將大模型能力內(nèi)置到了自身已有的成熟產(chǎn)品中?!斑@一做法既能提高現(xiàn)有產(chǎn)品的AI能力,又可吸引更多客戶為具體產(chǎn)品買單,而不是僅收取接口服務(wù)費?!币晃粯I(yè)內(nèi)人士告訴「商業(yè)秀」。

但即便如此,國內(nèi)大模型的競爭也極為激烈。作為大模型應(yīng)用較為成熟的辦公領(lǐng)域,就有多家企業(yè)推出了相關(guān)產(chǎn)品,如百度“文心一言”具備制作PPT的能力;釘釘接入阿里“通義千問”后可喚起10多項AI能力;字節(jié)跳動旗下辦公應(yīng)用飛書也將上線AI助手“MY AI”;金山辦公也推出“WPS AI”應(yīng)用等。

這一次,科大訊飛在星火大模型發(fā)布會上也發(fā)布了錄音筆、翻譯筆、辦公本等辦公產(chǎn)品,意在搶占更多辦公場景的用戶。但是否真的能掘金成功,還要看接下來用戶的實際反饋情況。

“雖然大模型競爭主要在巨頭之間,但巨頭也難以做到一家獨大,這其中的關(guān)鍵就在于數(shù)據(jù)。不同玩家積累的數(shù)據(jù)不一,就可能在特定領(lǐng)域建立自己的核心優(yōu)勢與獨有場景?!倍七M(jìn)一步表示。

舉例來說,阿里有天貓、淘寶的電商數(shù)據(jù),菜鳥系的物流數(shù)據(jù),這是其他企業(yè)無法獲取的獨有數(shù)據(jù),同樣科大訊飛在教育領(lǐng)域深耕多年,也積累了自己的獨有數(shù)據(jù)。這些數(shù)據(jù),或許就是真正拉開企業(yè)差距的關(guān)鍵。

也就是說,那些沒有持續(xù)資金支持的中小公司,或許很難做出真正的通用大模型產(chǎn)品,而各個大廠推出的通用大模型產(chǎn)品,已經(jīng)在急于考慮商業(yè)變現(xiàn),缺乏研發(fā)耐心與技術(shù)突破。

董浩直言,“這一切都來得太快了,還沒幾個月,各家大模型似乎都成熟可商用了,但事實上這其中必然存在諸多泡沫。”

眼下這場狂熱的大模型競賽才剛剛開始,在巨頭和企業(yè)瘋狂入局與廝殺的同時,不少業(yè)內(nèi)人士也疾呼:是時候該回歸初心,對技術(shù)保持敬畏,對商業(yè)保持探索,而不是一味追求速度、規(guī)模與效率,才能迎來大模型最好的時代。

(文中對話者均為化名)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

科大訊飛回應(yīng)“套殼”,AI大模型狂潮祛魅

大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最后?

文|數(shù)智商業(yè)秀 崔思

編輯|張弘一

“星火大模型與OpenAI,是什么關(guān)系?”

“我和OpenAI沒有關(guān)系,我是訊飛星火認(rèn)知大模型,我是由科大訊飛優(yōu)秀的人工智能科學(xué)家、工程師和語言學(xué)家等組成的團(tuán)隊自主研發(fā)的?!?/p>

當(dāng)「商業(yè)秀」在星火認(rèn)知大模型輸入以上問題后,它很快給出了答復(fù)。這與近期訊飛星火大模型的一則傳言不符。

近日有網(wǎng)友發(fā)現(xiàn),訊飛星火大模型在有些“問答”中會出現(xiàn)“我是由OpenAI開發(fā)的”等內(nèi)容,由此一則關(guān)于“訊飛星火大模型被質(zhì)疑‘套殼OpenAI的ChatGPT’”的消息傳播開來。

5月11日,科大訊飛在最新披露的投資者關(guān)系活動記錄表中表示,星火大模型“套殼OpenAI的ChatGPT”既不符合事實,也不符合邏輯。

科大訊飛具體表示,如果是套殼 ChatGPT,就不可能出現(xiàn)訊飛星火大模型的響應(yīng)速度比ChatGPT還快;更不會出現(xiàn)訊飛星火大模型在文本生成、知識問答、數(shù)學(xué)能力等方面的結(jié)果均優(yōu)于 ChatGPT 的情況。

我們有理由相信,此時的科大訊飛,比任何一家公司都需要大模型的故事,而非“套殼”事故。且先不論大模型本身的優(yōu)劣,光看科大訊飛迅速辟謠這一行徑,足見星火大模型對其之重要。至少在挽救股價層面,大模型的影響無出其右,就在這個季度乃至更漫長的一段時間內(nèi),均是如此。

今年4月底,科大訊飛發(fā)布了2022年財報和2023年一季度報,財報顯示,凈利潤出現(xiàn)大幅下滑態(tài)勢,市場似乎對其瞬間喪失了大部分信心,股價一路下跌。直到5月6月(星期六),科大訊飛發(fā)布星火大模型,在5月8日開盤后,其股價才開始拉升10%,此后數(shù)日,一度呈現(xiàn)上漲趨勢。市場對這家公司,似乎又恢復(fù)了信心。

推出大模型,再經(jīng)歷被質(zhì)疑“套殼OpenAI”事件,科大訊飛也必須面對共同的AI話題:大模型紛紛扎堆,是時候該理性祛魅了。

在這個大模型橫空出世的時代,科大訊飛并非“孤勇者”。自ChatGPT發(fā)布以來,掀起的科技軍備競賽就一直沒有停息,其余威在國內(nèi)也愈演愈烈,各家公司在AI領(lǐng)域“卷”個不停,前段時間大模型集中爆發(fā),被評價為“頗有十年前互聯(lián)網(wǎng)‘百團(tuán)大戰(zhàn)’甚至‘千團(tuán)大戰(zhàn)’的氣勢”。

據(jù)不完全統(tǒng)計,在ChatGPT發(fā)布后的短短4個月時間里,至少已經(jīng)有30多個國內(nèi)研發(fā)機構(gòu)和企業(yè),在ChatGPT發(fā)布之后紛紛推出了自己品牌的大模型和相關(guān)產(chǎn)品。

一時間,整個科技圈“類ChatGPT”比比皆是,聲稱“國內(nèi)首發(fā)”的企業(yè)更是不少,資本市場風(fēng)起云涌。與大模型相關(guān)的媒體報道鋪天蓋地,隨后又陷入一陣短暫的沉寂。而下一波,大概率還在來的路上。

大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最后?決戰(zhàn)未來,各家真正的核心競爭力又是什么?

從商業(yè)發(fā)展的歷史規(guī)律來看,喧囂過后,市場終會擠破泡沫,大模型狂潮不可能永遠(yuǎn)持續(xù)。只有冷靜思考大模型能夠帶來的內(nèi)核性改變,才能真正抓住這場由AI技術(shù)帶來的產(chǎn)業(yè)變革機會。

01 超越了ChatGPT?

“目前星火認(rèn)知大模型在國內(nèi)明顯遙遙領(lǐng)先,中文已經(jīng)超越ChatGPT,英文已接近?!痹诳拼笥嶏w星火認(rèn)知大模型發(fā)布會上,劉慶峰自信滿滿地說道。

作為繼百度、阿里、商湯、昆侖萬維后,第五家正式發(fā)布大模型的公司,科大訊飛一上場,就迫不及待展示自己的強大能力。

劉慶峰更是全程主持發(fā)布會,并與科大訊飛研究院院長劉聰現(xiàn)場展示了包括文本生成、語言理解、知識問答、邏輯推理、數(shù)學(xué)能力、編程能力等多項能力。

在現(xiàn)場演示環(huán)節(jié),劉聰提問:“你為什么叫星火 ”“如果有個小伙子跟女朋友吵架了,那他應(yīng)該寧死不屈還是能屈能伸?” “孔子在2008年北京奧運會上說了什么?”等各類稀奇古怪的問題,星火迅速“接招”,并給出了恰如其分的回答。

在數(shù)學(xué)能力方面,劉聰也拋出了“花壇里有三種花,一共88朵,其中月季花的數(shù)量是菊花的4倍,牡丹花的數(shù)量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”這類計算問題。星火也很快給出了答案,并羅列了相關(guān)解題步驟。

劉慶峰隨即表示,數(shù)理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內(nèi)系統(tǒng)中遙遙領(lǐng)先,也超過了ChatGPT。

對此,「商業(yè)秀」也進(jìn)行了多輪“挖坑式”測試,例如詢問“姚明在幾幾年獲得了亞洲足球先生的稱號?” “范志毅在NBA服役多少年?斬獲了多少個進(jìn)球?”等問題。星火都準(zhǔn)確識別出了人為“陷阱”,并給出了恰當(dāng)?shù)幕卮稹?/p>

這表明,在常識性問題上,星火都進(jìn)行了一定的訓(xùn)練,并具備一定的糾錯能力。

相同的問題,「商業(yè)秀」也通過ChatGPT-3進(jìn)行了測試,其同樣也給出了恰當(dāng)?shù)幕卮穑谛畔⒇S富度上不及星火全面。

在數(shù)理能力上,「商業(yè)秀」也測試了“雞兔同籠,雞兔一共有25只,籠子里腳一共有74只,請問分別有多少只雞和多少只兔子?”“一支股票今天漲10%,明天跌10%,請問賺還是賠?”等問題,星火也迅速給出了正確回答。

「商業(yè)秀」將同樣的數(shù)理問題拋給了ChatGPT-3,在這方面,結(jié)果顯示ChatGPT-3的回答更有邏輯性。后者先給出了結(jié)論,再給出了具體實例,并且還會有延伸的問題,配合原問題答疑解惑。

星火還支持語音提問和輸出,即可通過語音提問,模型輸出的答案也能轉(zhuǎn)換為語音,并能通過持續(xù)對話調(diào)整語音風(fēng)格。

「商業(yè)秀」通過語音詢問“雞兔同籠,籠里一共有35只,一共有94只腳,問一共有多少只雞和多少只兔子” “中國拿到網(wǎng)球大滿貫職業(yè)選手是誰”等問題。星火也準(zhǔn)確識別了語音內(nèi)容,并給出了相應(yīng)的答案。

但這個操作,要求提問者的語速要很慢,并且能一字一句以標(biāo)準(zhǔn)普通話說出,否則星火可能無法準(zhǔn)確識別出相應(yīng)文字,或文字識別不準(zhǔn)確導(dǎo)致回答有誤。

經(jīng)過多輪測試,「商業(yè)秀」認(rèn)為,星火具備了一定的大語言模型能力,并且能夠在某些特定領(lǐng)域輸出自己的商業(yè)價值。

在發(fā)布會上,科大訊飛還發(fā)布了一系列結(jié)合星火大模型的產(chǎn)品,例如訊飛智能辦公本能將語音實時轉(zhuǎn)寫與墨水屏紙感書寫相結(jié)合,對會議記錄內(nèi)容形成一份精簡的會議紀(jì)要;“星火大模型+智能座艙”為數(shù)千個車型提供多輪、多人、多區(qū)域、多模態(tài)的語音交互;基于大模型的生成式RPA(機器人流程自動化),讓數(shù)字員工更智能……

但星火也不是沒有缺點,劉慶峰自己也在發(fā)布會上坦言,“大模型技術(shù)目前還存在不少待攻克的缺陷。包括新知識難以及時更新、事實類問答容易‘張冠李戴’,史實、傳統(tǒng)典籍等容易‘編造情節(jié)’等問題?!彼S之提及,上述問題在今年會有明顯的改進(jìn)。

據(jù)了解,星火認(rèn)知大模型始于2022年12月。彼時,科大訊飛啟動了“1+N”大模型技術(shù)攻關(guān)。其中,“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練方案底座平臺,“N”是將認(rèn)知智能大模型技術(shù)應(yīng)用在教育、醫(yī)療、人機交互、辦公、翻譯等多個行業(yè)領(lǐng)域。

不到半年時間,星火認(rèn)知大模型正式面世,研發(fā)時間之短暫、模型發(fā)布之匆忙,這直接導(dǎo)致包括科大訊飛在內(nèi)的很多企業(yè)被外界質(zhì)疑。

確實,在這么短的時間內(nèi),星火的面世僅僅是一個開始,它仍需經(jīng)過多輪迭代優(yōu)化。劉慶峰在發(fā)布會上公布了星火認(rèn)知大模型的發(fā)展規(guī)劃:今年6月9日,星火大模型將突破開放式問答,多輪對話能力和數(shù)學(xué)能力再升級;8月15日,星火認(rèn)知大模型將突破代碼能力,多模態(tài)交互再升級;10月24日,星火認(rèn)知大模型通用模型將直接對標(biāo)ChatGPT,其中中文能力超越后者,英文能力與后者相當(dāng)。

從這份規(guī)劃日期來看,科大訊飛甚至細(xì)化到了哪一天,這從側(cè)面或許表明其急于想將大模型能力落地應(yīng)用,從而推進(jìn)商業(yè)化。業(yè)內(nèi)認(rèn)為,這或許與近幾年科大訊飛的商業(yè)化能力不佳有關(guān)。

02 急需大模型“提振信心”

此前,科大訊飛優(yōu)異的業(yè)績與賺錢能力常被業(yè)內(nèi)稱贊,但在經(jīng)歷了連續(xù)10年的增長后,神話基本結(jié)束于2022年。

科大訊飛2022年財報顯示,該公司實現(xiàn)營收188.2億元,同比微增2.77%;毛利為76.84億元,同比微增2%;歸母凈利潤5.61億元,同比下滑63.94%;扣非凈利潤4.18億元,同比下滑57.31%。

這還是科大訊飛錄入政府補貼后的數(shù)據(jù),2022年,科大訊飛政府補貼金額為11億元。與此同時,這也是近五年來科大訊飛凈利潤同比增長率首次出現(xiàn)下滑。數(shù)據(jù)顯示,從2018年到2022年,科大訊飛的凈利潤增長率分別為24.71%、51.12%、66.48%、14.13%和﹣63.94%。

資本市場對這一成績單頗感失望,在財報發(fā)布后,科大訊飛股價下跌超9%。

對于業(yè)績出現(xiàn)如此大幅變動,科大訊飛方面給出了三個原因。

首先是大環(huán)境的影響,科大訊飛表示“受到去年12月份和今年1月份特殊的社會經(jīng)濟(jì)客觀環(huán)境,以及春節(jié)假期影響,導(dǎo)致部分項目無法順利及時推進(jìn)”。

其次,繼2019年被列入美國實體清單,2022年10月7日被再次極限施壓,由于調(diào)整供應(yīng)鏈和相關(guān)合同簽署等工作影響了當(dāng)季訂單節(jié)奏。

最后一點,與星火大模型有關(guān)。科大訊飛提到,去年12月啟動的“1+N認(rèn)知智能大模型專項攻關(guān)”影響了當(dāng)期利潤,這從側(cè)面印證科大訊飛在大模型上的投入很大。

來到今年,這三大原因仍持續(xù)影響科大訊飛的業(yè)績。

數(shù)據(jù)顯示,2023年一季度,科大訊飛實現(xiàn)營收28.88億元,同比下降17.64%;凈虧損5789.5萬元,上年同期凈利潤1.1億元;扣非后歸母凈虧損3.38億元,上年同期凈利潤1.46億元。

據(jù)界面新聞報道,科大訊飛總裁吳曉如透露,2022年和2023年一季度訊飛凈利潤下滑嚴(yán)重主要在于公司在教育、醫(yī)療等持續(xù)運營型業(yè)務(wù)的合作平臺拓展投入、新產(chǎn)品研發(fā)以及核心技術(shù)自主可控和國產(chǎn)化適配等方向新增投入約8億元。

不過,科大訊飛對業(yè)績下滑的情況似乎不太擔(dān)心。在業(yè)績會上表示目前基于在國產(chǎn)替代和業(yè)務(wù)開拓上的進(jìn)展,預(yù)計從今年二季度開始將實現(xiàn)收入和毛利正向增長,并有信心實現(xiàn)全年高質(zhì)量增長的目標(biāo)。

科大訊飛的主營業(yè)務(wù)分別包括教育產(chǎn)品與服務(wù)、信息工程和開放平臺。其中教育產(chǎn)品是其主要營收來源,占到總營收比例的32.74%。

科大訊飛還構(gòu)建了面向G端、B端和C端三類客戶的業(yè)務(wù)體系:G端主要是面向地市縣等區(qū)域,涵蓋區(qū)域內(nèi)各類學(xué)校和用戶的因材施教解決方案;B端主要是面向?qū)W校的大數(shù)據(jù)精準(zhǔn)教學(xué)、英語聽說課堂、智慧作業(yè)等;C端主要以面向家長的AI學(xué)習(xí)機、個性化學(xué)習(xí)手冊、課后服務(wù)課程服務(wù)等產(chǎn)品。

財報顯示,G端業(yè)務(wù)目前已累計在 50 多個市、區(qū)(縣)級應(yīng)用;B端業(yè)務(wù)中的訊飛課后服務(wù)業(yè)務(wù)已覆蓋超300區(qū)縣、12000余所學(xué)校;C端的AI學(xué)習(xí)機該年銷售額增長超50%,但并未透露出具體銷售數(shù)量與金額。

而實際上,其業(yè)績與目標(biāo)業(yè)績尚相差甚遠(yuǎn)。科大訊飛曾在2022年初的公告中提到,各項根據(jù)地業(yè)務(wù)預(yù)計保持50%的增長。同時提到,2022年個性化學(xué)習(xí)手冊業(yè)務(wù)預(yù)計營收增長超70%,AI學(xué)習(xí)機收入目標(biāo)增長200%+,目標(biāo)十四五做到年收入100 億元。

除了主營業(yè)務(wù)未達(dá)預(yù)期外,科大訊飛的智慧城市、開放平臺及消費者業(yè)務(wù)、智慧汽車、智慧醫(yī)療等業(yè)務(wù)表現(xiàn)也較為一般。

財報顯示,智慧城市下屬的信息工程、數(shù)字政府行業(yè)應(yīng)用、智慧政法行業(yè)應(yīng)用三大板塊與開放平臺業(yè)務(wù)均呈現(xiàn)同比下降態(tài)勢。智慧汽車、智慧醫(yī)療與智慧金融業(yè)務(wù)雖然呈同比增長態(tài)勢,例如智慧金融同比增長19.33%,但在整體營收規(guī)模中的占比實在少得可憐,智慧金融僅占比1.25%,智慧汽車與智慧醫(yī)療分別占比2.47%和2.48%。

如此看來,科大訊飛的主營業(yè)務(wù)表現(xiàn)不佳,創(chuàng)新業(yè)務(wù)又還遠(yuǎn)未達(dá)到大規(guī)模營收的階段。此時的科大訊飛,必須要抓住大模型帶來的巨大價值,為各項業(yè)務(wù)增加更多商業(yè)競爭力。

但如今處于風(fēng)口浪尖的大模型,能否幫助科大訊飛實現(xiàn)目標(biāo),還需要時間去驗證。

03 大模型狂潮祛魅時分

今年數(shù)月以來,全球的科技企業(yè)們處于一種近乎瘋狂當(dāng)中。放眼國內(nèi)外,圍繞大模型發(fā)布的浪潮迭起,尤其是國內(nèi)的科技巨頭們接連推出了自己的大模型產(chǎn)品。

據(jù)「商業(yè)秀」不完全統(tǒng)計,目前已推出大模型產(chǎn)品的公司有百度文心一言、阿里通義千問、華為盤古、商湯日日新、昆侖萬維天工以及科大訊飛星火,同時王慧文、王小川等互聯(lián)網(wǎng)大佬創(chuàng)立的大模型公司也迅速獲得了融資。

但這么多大模型都能順利跑出來嗎?大模型的核心競爭價值到底是什么?大模型還能帶來哪些顛覆性機會?

瘋狂的大模型浪潮,也該到了理性審視的祛魅階段。

“現(xiàn)在涌現(xiàn)出很多大模型產(chǎn)品,但圍繞大模型的訓(xùn)練和調(diào)試成本投入非常高,一般公司真燒不起,同時對中小企業(yè)來說自研經(jīng)濟(jì)性較低,未來競爭更大可能發(fā)生在巨頭之間?!蹦筹L(fēng)投機構(gòu)投資經(jīng)理董浩對「商業(yè)秀」表示。

英偉達(dá)的研究表示,GPT3最大規(guī)模的模型需要使用到175 Billions的參數(shù)量,需要使用512顆V100顯卡訓(xùn)練7個月時間,或者使用1024顆A100芯片訓(xùn)練長達(dá)一個月的時間。每月大模型訓(xùn)練成本在數(shù)百萬美元以上量級。

上月,由中國人工智能學(xué)會主辦的人工智能大模型技術(shù)高峰論壇上,華為云人工智能領(lǐng)域首席科學(xué)家田奇發(fā)表的演講中也提到,大模型開發(fā)和訓(xùn)練的單次費用高達(dá)1200萬美元。

大模型開發(fā)成本如此高昂,但應(yīng)用成本(收費)很低。OpenAI在今年3月開放API(應(yīng)用程序接口),允許第三方開發(fā)者通過API將ChatGPT集成至應(yīng)用程序和服務(wù)中。其將接口服務(wù)定價為0.002美元/每1000 tokens,這一定價較GPT 3.5模型便宜約90%。

從經(jīng)濟(jì)角度考慮,這一定價很難將巨額研發(fā)投入賺回來,更不用說盈利了。所以這終究不是中小企業(yè)耗得起的生意,只有巨頭才有資金、資源投入,搶占未來的一席之地。

或許正因如此,目前已發(fā)布大模型產(chǎn)品的企業(yè),都將大模型能力內(nèi)置到了自身已有的成熟產(chǎn)品中?!斑@一做法既能提高現(xiàn)有產(chǎn)品的AI能力,又可吸引更多客戶為具體產(chǎn)品買單,而不是僅收取接口服務(wù)費。”一位業(yè)內(nèi)人士告訴「商業(yè)秀」。

但即便如此,國內(nèi)大模型的競爭也極為激烈。作為大模型應(yīng)用較為成熟的辦公領(lǐng)域,就有多家企業(yè)推出了相關(guān)產(chǎn)品,如百度“文心一言”具備制作PPT的能力;釘釘接入阿里“通義千問”后可喚起10多項AI能力;字節(jié)跳動旗下辦公應(yīng)用飛書也將上線AI助手“MY AI”;金山辦公也推出“WPS AI”應(yīng)用等。

這一次,科大訊飛在星火大模型發(fā)布會上也發(fā)布了錄音筆、翻譯筆、辦公本等辦公產(chǎn)品,意在搶占更多辦公場景的用戶。但是否真的能掘金成功,還要看接下來用戶的實際反饋情況。

“雖然大模型競爭主要在巨頭之間,但巨頭也難以做到一家獨大,這其中的關(guān)鍵就在于數(shù)據(jù)。不同玩家積累的數(shù)據(jù)不一,就可能在特定領(lǐng)域建立自己的核心優(yōu)勢與獨有場景?!倍七M(jìn)一步表示。

舉例來說,阿里有天貓、淘寶的電商數(shù)據(jù),菜鳥系的物流數(shù)據(jù),這是其他企業(yè)無法獲取的獨有數(shù)據(jù),同樣科大訊飛在教育領(lǐng)域深耕多年,也積累了自己的獨有數(shù)據(jù)。這些數(shù)據(jù),或許就是真正拉開企業(yè)差距的關(guān)鍵。

也就是說,那些沒有持續(xù)資金支持的中小公司,或許很難做出真正的通用大模型產(chǎn)品,而各個大廠推出的通用大模型產(chǎn)品,已經(jīng)在急于考慮商業(yè)變現(xiàn),缺乏研發(fā)耐心與技術(shù)突破。

董浩直言,“這一切都來得太快了,還沒幾個月,各家大模型似乎都成熟可商用了,但事實上這其中必然存在諸多泡沫?!?/p>

眼下這場狂熱的大模型競賽才剛剛開始,在巨頭和企業(yè)瘋狂入局與廝殺的同時,不少業(yè)內(nèi)人士也疾呼:是時候該回歸初心,對技術(shù)保持敬畏,對商業(yè)保持探索,而不是一味追求速度、規(guī)模與效率,才能迎來大模型最好的時代。

(文中對話者均為化名)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。