文|數智商業(yè)秀 崔思
編輯|張弘一
“星火大模型與OpenAI,是什么關系?”
“我和OpenAI沒有關系,我是訊飛星火認知大模型,我是由科大訊飛優(yōu)秀的人工智能科學家、工程師和語言學家等組成的團隊自主研發(fā)的?!?/p>
當「商業(yè)秀」在星火認知大模型輸入以上問題后,它很快給出了答復。這與近期訊飛星火大模型的一則傳言不符。
近日有網友發(fā)現,訊飛星火大模型在有些“問答”中會出現“我是由OpenAI開發(fā)的”等內容,由此一則關于“訊飛星火大模型被質疑‘套殼OpenAI的ChatGPT’”的消息傳播開來。
5月11日,科大訊飛在最新披露的投資者關系活動記錄表中表示,星火大模型“套殼OpenAI的ChatGPT”既不符合事實,也不符合邏輯。
科大訊飛具體表示,如果是套殼 ChatGPT,就不可能出現訊飛星火大模型的響應速度比ChatGPT還快;更不會出現訊飛星火大模型在文本生成、知識問答、數學能力等方面的結果均優(yōu)于 ChatGPT 的情況。
我們有理由相信,此時的科大訊飛,比任何一家公司都需要大模型的故事,而非“套殼”事故。且先不論大模型本身的優(yōu)劣,光看科大訊飛迅速辟謠這一行徑,足見星火大模型對其之重要。至少在挽救股價層面,大模型的影響無出其右,就在這個季度乃至更漫長的一段時間內,均是如此。
今年4月底,科大訊飛發(fā)布了2022年財報和2023年一季度報,財報顯示,凈利潤出現大幅下滑態(tài)勢,市場似乎對其瞬間喪失了大部分信心,股價一路下跌。直到5月6月(星期六),科大訊飛發(fā)布星火大模型,在5月8日開盤后,其股價才開始拉升10%,此后數日,一度呈現上漲趨勢。市場對這家公司,似乎又恢復了信心。
推出大模型,再經歷被質疑“套殼OpenAI”事件,科大訊飛也必須面對共同的AI話題:大模型紛紛扎堆,是時候該理性祛魅了。
在這個大模型橫空出世的時代,科大訊飛并非“孤勇者”。自ChatGPT發(fā)布以來,掀起的科技軍備競賽就一直沒有停息,其余威在國內也愈演愈烈,各家公司在AI領域“卷”個不停,前段時間大模型集中爆發(fā),被評價為“頗有十年前互聯網‘百團大戰(zhàn)’甚至‘千團大戰(zhàn)’的氣勢”。
據不完全統計,在ChatGPT發(fā)布后的短短4個月時間里,至少已經有30多個國內研發(fā)機構和企業(yè),在ChatGPT發(fā)布之后紛紛推出了自己品牌的大模型和相關產品。
一時間,整個科技圈“類ChatGPT”比比皆是,聲稱“國內首發(fā)”的企業(yè)更是不少,資本市場風起云涌。與大模型相關的媒體報道鋪天蓋地,隨后又陷入一陣短暫的沉寂。而下一波,大概率還在來的路上。
大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最后?決戰(zhàn)未來,各家真正的核心競爭力又是什么?
從商業(yè)發(fā)展的歷史規(guī)律來看,喧囂過后,市場終會擠破泡沫,大模型狂潮不可能永遠持續(xù)。只有冷靜思考大模型能夠帶來的內核性改變,才能真正抓住這場由AI技術帶來的產業(yè)變革機會。
01 超越了ChatGPT?
“目前星火認知大模型在國內明顯遙遙領先,中文已經超越ChatGPT,英文已接近。”在科大訊飛星火認知大模型發(fā)布會上,劉慶峰自信滿滿地說道。
作為繼百度、阿里、商湯、昆侖萬維后,第五家正式發(fā)布大模型的公司,科大訊飛一上場,就迫不及待展示自己的強大能力。
劉慶峰更是全程主持發(fā)布會,并與科大訊飛研究院院長劉聰現場展示了包括文本生成、語言理解、知識問答、邏輯推理、數學能力、編程能力等多項能力。
在現場演示環(huán)節(jié),劉聰提問:“你為什么叫星火 ”“如果有個小伙子跟女朋友吵架了,那他應該寧死不屈還是能屈能伸?” “孔子在2008年北京奧運會上說了什么?”等各類稀奇古怪的問題,星火迅速“接招”,并給出了恰如其分的回答。
在數學能力方面,劉聰也拋出了“花壇里有三種花,一共88朵,其中月季花的數量是菊花的4倍,牡丹花的數量是菊花的5倍少2朵,那么請問花壇里一共有多少朵牡丹花?”這類計算問題。星火也很快給出了答案,并羅列了相關解題步驟。
劉慶峰隨即表示,數理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內系統中遙遙領先,也超過了ChatGPT。
對此,「商業(yè)秀」也進行了多輪“挖坑式”測試,例如詢問“姚明在幾幾年獲得了亞洲足球先生的稱號?” “范志毅在NBA服役多少年?斬獲了多少個進球?”等問題。星火都準確識別出了人為“陷阱”,并給出了恰當的回答。
這表明,在常識性問題上,星火都進行了一定的訓練,并具備一定的糾錯能力。
相同的問題,「商業(yè)秀」也通過ChatGPT-3進行了測試,其同樣也給出了恰當的回答,但在信息豐富度上不及星火全面。
在數理能力上,「商業(yè)秀」也測試了“雞兔同籠,雞兔一共有25只,籠子里腳一共有74只,請問分別有多少只雞和多少只兔子?”“一支股票今天漲10%,明天跌10%,請問賺還是賠?”等問題,星火也迅速給出了正確回答。
「商業(yè)秀」將同樣的數理問題拋給了ChatGPT-3,在這方面,結果顯示ChatGPT-3的回答更有邏輯性。后者先給出了結論,再給出了具體實例,并且還會有延伸的問題,配合原問題答疑解惑。
星火還支持語音提問和輸出,即可通過語音提問,模型輸出的答案也能轉換為語音,并能通過持續(xù)對話調整語音風格。
「商業(yè)秀」通過語音詢問“雞兔同籠,籠里一共有35只,一共有94只腳,問一共有多少只雞和多少只兔子” “中國拿到網球大滿貫職業(yè)選手是誰”等問題。星火也準確識別了語音內容,并給出了相應的答案。
但這個操作,要求提問者的語速要很慢,并且能一字一句以標準普通話說出,否則星火可能無法準確識別出相應文字,或文字識別不準確導致回答有誤。
經過多輪測試,「商業(yè)秀」認為,星火具備了一定的大語言模型能力,并且能夠在某些特定領域輸出自己的商業(yè)價值。
在發(fā)布會上,科大訊飛還發(fā)布了一系列結合星火大模型的產品,例如訊飛智能辦公本能將語音實時轉寫與墨水屏紙感書寫相結合,對會議記錄內容形成一份精簡的會議紀要;“星火大模型+智能座艙”為數千個車型提供多輪、多人、多區(qū)域、多模態(tài)的語音交互;基于大模型的生成式RPA(機器人流程自動化),讓數字員工更智能……
但星火也不是沒有缺點,劉慶峰自己也在發(fā)布會上坦言,“大模型技術目前還存在不少待攻克的缺陷。包括新知識難以及時更新、事實類問答容易‘張冠李戴’,史實、傳統典籍等容易‘編造情節(jié)’等問題?!彼S之提及,上述問題在今年會有明顯的改進。
據了解,星火認知大模型始于2022年12月。彼時,科大訊飛啟動了“1+N”大模型技術攻關。其中,“1”是通用認知智能大模型算法研發(fā)及高效訓練方案底座平臺,“N”是將認知智能大模型技術應用在教育、醫(yī)療、人機交互、辦公、翻譯等多個行業(yè)領域。
不到半年時間,星火認知大模型正式面世,研發(fā)時間之短暫、模型發(fā)布之匆忙,這直接導致包括科大訊飛在內的很多企業(yè)被外界質疑。
確實,在這么短的時間內,星火的面世僅僅是一個開始,它仍需經過多輪迭代優(yōu)化。劉慶峰在發(fā)布會上公布了星火認知大模型的發(fā)展規(guī)劃:今年6月9日,星火大模型將突破開放式問答,多輪對話能力和數學能力再升級;8月15日,星火認知大模型將突破代碼能力,多模態(tài)交互再升級;10月24日,星火認知大模型通用模型將直接對標ChatGPT,其中中文能力超越后者,英文能力與后者相當。
從這份規(guī)劃日期來看,科大訊飛甚至細化到了哪一天,這從側面或許表明其急于想將大模型能力落地應用,從而推進商業(yè)化。業(yè)內認為,這或許與近幾年科大訊飛的商業(yè)化能力不佳有關。
02 急需大模型“提振信心”
此前,科大訊飛優(yōu)異的業(yè)績與賺錢能力常被業(yè)內稱贊,但在經歷了連續(xù)10年的增長后,神話基本結束于2022年。
科大訊飛2022年財報顯示,該公司實現營收188.2億元,同比微增2.77%;毛利為76.84億元,同比微增2%;歸母凈利潤5.61億元,同比下滑63.94%;扣非凈利潤4.18億元,同比下滑57.31%。
這還是科大訊飛錄入政府補貼后的數據,2022年,科大訊飛政府補貼金額為11億元。與此同時,這也是近五年來科大訊飛凈利潤同比增長率首次出現下滑。數據顯示,從2018年到2022年,科大訊飛的凈利潤增長率分別為24.71%、51.12%、66.48%、14.13%和﹣63.94%。
資本市場對這一成績單頗感失望,在財報發(fā)布后,科大訊飛股價下跌超9%。
對于業(yè)績出現如此大幅變動,科大訊飛方面給出了三個原因。
首先是大環(huán)境的影響,科大訊飛表示“受到去年12月份和今年1月份特殊的社會經濟客觀環(huán)境,以及春節(jié)假期影響,導致部分項目無法順利及時推進”。
其次,繼2019年被列入美國實體清單,2022年10月7日被再次極限施壓,由于調整供應鏈和相關合同簽署等工作影響了當季訂單節(jié)奏。
最后一點,與星火大模型有關??拼笥嶏w提到,去年12月啟動的“1+N認知智能大模型專項攻關”影響了當期利潤,這從側面印證科大訊飛在大模型上的投入很大。
來到今年,這三大原因仍持續(xù)影響科大訊飛的業(yè)績。
數據顯示,2023年一季度,科大訊飛實現營收28.88億元,同比下降17.64%;凈虧損5789.5萬元,上年同期凈利潤1.1億元;扣非后歸母凈虧損3.38億元,上年同期凈利潤1.46億元。
據界面新聞報道,科大訊飛總裁吳曉如透露,2022年和2023年一季度訊飛凈利潤下滑嚴重主要在于公司在教育、醫(yī)療等持續(xù)運營型業(yè)務的合作平臺拓展投入、新產品研發(fā)以及核心技術自主可控和國產化適配等方向新增投入約8億元。
不過,科大訊飛對業(yè)績下滑的情況似乎不太擔心。在業(yè)績會上表示目前基于在國產替代和業(yè)務開拓上的進展,預計從今年二季度開始將實現收入和毛利正向增長,并有信心實現全年高質量增長的目標。
科大訊飛的主營業(yè)務分別包括教育產品與服務、信息工程和開放平臺。其中教育產品是其主要營收來源,占到總營收比例的32.74%。
科大訊飛還構建了面向G端、B端和C端三類客戶的業(yè)務體系:G端主要是面向地市縣等區(qū)域,涵蓋區(qū)域內各類學校和用戶的因材施教解決方案;B端主要是面向學校的大數據精準教學、英語聽說課堂、智慧作業(yè)等;C端主要以面向家長的AI學習機、個性化學習手冊、課后服務課程服務等產品。
財報顯示,G端業(yè)務目前已累計在 50 多個市、區(qū)(縣)級應用;B端業(yè)務中的訊飛課后服務業(yè)務已覆蓋超300區(qū)縣、12000余所學校;C端的AI學習機該年銷售額增長超50%,但并未透露出具體銷售數量與金額。
而實際上,其業(yè)績與目標業(yè)績尚相差甚遠??拼笥嶏w曾在2022年初的公告中提到,各項根據地業(yè)務預計保持50%的增長。同時提到,2022年個性化學習手冊業(yè)務預計營收增長超70%,AI學習機收入目標增長200%+,目標十四五做到年收入100 億元。
除了主營業(yè)務未達預期外,科大訊飛的智慧城市、開放平臺及消費者業(yè)務、智慧汽車、智慧醫(yī)療等業(yè)務表現也較為一般。
財報顯示,智慧城市下屬的信息工程、數字政府行業(yè)應用、智慧政法行業(yè)應用三大板塊與開放平臺業(yè)務均呈現同比下降態(tài)勢。智慧汽車、智慧醫(yī)療與智慧金融業(yè)務雖然呈同比增長態(tài)勢,例如智慧金融同比增長19.33%,但在整體營收規(guī)模中的占比實在少得可憐,智慧金融僅占比1.25%,智慧汽車與智慧醫(yī)療分別占比2.47%和2.48%。
如此看來,科大訊飛的主營業(yè)務表現不佳,創(chuàng)新業(yè)務又還遠未達到大規(guī)模營收的階段。此時的科大訊飛,必須要抓住大模型帶來的巨大價值,為各項業(yè)務增加更多商業(yè)競爭力。
但如今處于風口浪尖的大模型,能否幫助科大訊飛實現目標,還需要時間去驗證。
03 大模型狂潮祛魅時分
今年數月以來,全球的科技企業(yè)們處于一種近乎瘋狂當中。放眼國內外,圍繞大模型發(fā)布的浪潮迭起,尤其是國內的科技巨頭們接連推出了自己的大模型產品。
據「商業(yè)秀」不完全統計,目前已推出大模型產品的公司有百度文心一言、阿里通義千問、華為盤古、商湯日日新、昆侖萬維天工以及科大訊飛星火,同時王慧文、王小川等互聯網大佬創(chuàng)立的大模型公司也迅速獲得了融資。
但這么多大模型都能順利跑出來嗎?大模型的核心競爭價值到底是什么?大模型還能帶來哪些顛覆性機會?
瘋狂的大模型浪潮,也該到了理性審視的祛魅階段。
“現在涌現出很多大模型產品,但圍繞大模型的訓練和調試成本投入非常高,一般公司真燒不起,同時對中小企業(yè)來說自研經濟性較低,未來競爭更大可能發(fā)生在巨頭之間?!蹦筹L投機構投資經理董浩對「商業(yè)秀」表示。
英偉達的研究表示,GPT3最大規(guī)模的模型需要使用到175 Billions的參數量,需要使用512顆V100顯卡訓練7個月時間,或者使用1024顆A100芯片訓練長達一個月的時間。每月大模型訓練成本在數百萬美元以上量級。
上月,由中國人工智能學會主辦的人工智能大模型技術高峰論壇上,華為云人工智能領域首席科學家田奇發(fā)表的演講中也提到,大模型開發(fā)和訓練的單次費用高達1200萬美元。
大模型開發(fā)成本如此高昂,但應用成本(收費)很低。OpenAI在今年3月開放API(應用程序接口),允許第三方開發(fā)者通過API將ChatGPT集成至應用程序和服務中。其將接口服務定價為0.002美元/每1000 tokens,這一定價較GPT 3.5模型便宜約90%。
從經濟角度考慮,這一定價很難將巨額研發(fā)投入賺回來,更不用說盈利了。所以這終究不是中小企業(yè)耗得起的生意,只有巨頭才有資金、資源投入,搶占未來的一席之地。
或許正因如此,目前已發(fā)布大模型產品的企業(yè),都將大模型能力內置到了自身已有的成熟產品中?!斑@一做法既能提高現有產品的AI能力,又可吸引更多客戶為具體產品買單,而不是僅收取接口服務費?!币晃粯I(yè)內人士告訴「商業(yè)秀」。
但即便如此,國內大模型的競爭也極為激烈。作為大模型應用較為成熟的辦公領域,就有多家企業(yè)推出了相關產品,如百度“文心一言”具備制作PPT的能力;釘釘接入阿里“通義千問”后可喚起10多項AI能力;字節(jié)跳動旗下辦公應用飛書也將上線AI助手“MY AI”;金山辦公也推出“WPS AI”應用等。
這一次,科大訊飛在星火大模型發(fā)布會上也發(fā)布了錄音筆、翻譯筆、辦公本等辦公產品,意在搶占更多辦公場景的用戶。但是否真的能掘金成功,還要看接下來用戶的實際反饋情況。
“雖然大模型競爭主要在巨頭之間,但巨頭也難以做到一家獨大,這其中的關鍵就在于數據。不同玩家積累的數據不一,就可能在特定領域建立自己的核心優(yōu)勢與獨有場景。”董浩進一步表示。
舉例來說,阿里有天貓、淘寶的電商數據,菜鳥系的物流數據,這是其他企業(yè)無法獲取的獨有數據,同樣科大訊飛在教育領域深耕多年,也積累了自己的獨有數據。這些數據,或許就是真正拉開企業(yè)差距的關鍵。
也就是說,那些沒有持續(xù)資金支持的中小公司,或許很難做出真正的通用大模型產品,而各個大廠推出的通用大模型產品,已經在急于考慮商業(yè)變現,缺乏研發(fā)耐心與技術突破。
董浩直言,“這一切都來得太快了,還沒幾個月,各家大模型似乎都成熟可商用了,但事實上這其中必然存在諸多泡沫。”
眼下這場狂熱的大模型競賽才剛剛開始,在巨頭和企業(yè)瘋狂入局與廝殺的同時,不少業(yè)內人士也疾呼:是時候該回歸初心,對技術保持敬畏,對商業(yè)保持探索,而不是一味追求速度、規(guī)模與效率,才能迎來大模型最好的時代。
(文中對話者均為化名)