界面新聞記者 | 姜菁玲
5月6日,科大訊飛正式對外發(fā)布了訊飛星火認(rèn)知大模型,并公布了基于大模型的“1+N”產(chǎn)品路徑,“1”指通用認(rèn)知智能大模型,“N”指大模型在教育、辦公、汽車、人機(jī)交互等各個領(lǐng)域的落地。
發(fā)布會現(xiàn)場,科大訊飛提取出了訊飛星火認(rèn)知大模型的七大核心能力,即文本生成、語言理解,知識問答、邏輯推理、數(shù)學(xué)能力、代碼能力、多模態(tài)能力。
界面新聞記者從現(xiàn)場看到,訊飛大模型能夠較好地完成中英文論文、品宣文案、以及故事內(nèi)容等內(nèi)容形式的撰寫。
同時,該大模型能夠在中文特殊語境下表現(xiàn)良好,可以對俗語進(jìn)行解讀,能夠有“情商”地回答情感問題。輸入一個中學(xué)水平的數(shù)學(xué)題,AI能夠迅速完成常規(guī)計(jì)算、幾何、情景應(yīng)用等問題的解答。
大模型支持多模態(tài),能夠支持對英文菜單圖片進(jìn)行直接翻譯,用自然語言輸入要求,即可生成一個虛擬人實(shí)時播報的視頻段落。
值得注意的是,與其他大模型廠商不同,除了強(qiáng)調(diào)訊飛大模型將對開發(fā)者進(jìn)行開放,訊飛著重公布和介紹了大模型在訊飛內(nèi)部產(chǎn)品體系中的落地運(yùn)用。
根據(jù)科大訊飛董事長劉慶峰的介紹,訊飛大模型將重塑訊飛辦公、教育、醫(yī)療、汽車、人機(jī)交互等業(yè)務(wù),大大提升原有業(yè)務(wù)的實(shí)際效果。
教育業(yè)務(wù)方面,搭載大模型后,AI學(xué)習(xí)機(jī)能夠像老師一樣批改作文,像口語老師一樣實(shí)景對話。相比于傳統(tǒng)學(xué)習(xí)機(jī)只能針對字詞標(biāo)點(diǎn)糾錯、識別句式修辭錯誤這些基礎(chǔ)批改,AI學(xué)習(xí)機(jī)能夠圍繞寫作要求、分析全篇結(jié)構(gòu)和文采的深度高階批改。
辦公方面,訊飛原本的傳統(tǒng)業(yè)務(wù)語音轉(zhuǎn)寫,搭載大模型后,能夠?qū)崿F(xiàn)自動會議紀(jì)要,并且將冗雜的錄音轉(zhuǎn)寫后進(jìn)行語篇規(guī)整,并且根據(jù)指定的主題,一鍵生成新聞稿或其他內(nèi)容類型。
并且,基于大模型,訊飛還對外展示了任務(wù)執(zhí)行方面的功能,基于自然語言生成業(yè)務(wù)流程和 RPA,幫助企業(yè)員工完成大量重復(fù)性工作?,F(xiàn)場以公司招聘事項(xiàng)為例,輸入指令后,系統(tǒng)即可自動按照事先設(shè)計(jì)的RPA腳本,操作計(jì)算機(jī)中的相應(yīng)軟件,實(shí)現(xiàn)業(yè)務(wù)流程的自動化操作并輸出結(jié)果,還能進(jìn)行數(shù)據(jù)分析。
劉慶峰在采訪中提到,整體看,訊飛在長文本生成和數(shù)理能力方面有一定優(yōu)勢。在長文本生成上,大模型在國內(nèi)明顯領(lǐng)先,在中文方面超過了ChatGPT,英文方面則還有一定差距。
科大訊飛研究院院長劉聰告訴界面新聞記者,相比于阿里以及百度等公司,科大訊飛在大模型算法上具有一定優(yōu)勢,訊飛自2014年從“訊飛超腦”計(jì)劃開始在大模型上進(jìn)行投入,團(tuán)隊(duì)經(jīng)驗(yàn)相對成熟。另外,由于訊飛此前將教育、醫(yī)療等垂直行業(yè)列為根據(jù)地,因此在相關(guān)行業(yè)累積了大量數(shù)據(jù),并且訊飛開放平臺以及重要的專業(yè)機(jī)構(gòu)合作,為訊飛大模型提供了大量且專業(yè)的中文訓(xùn)練語料。
不過,劉慶峰直言,當(dāng)前大模型技術(shù)仍有待攻克的缺陷,比如新知識難以及時更新、事實(shí)類問答容易“張冠李戴”,史實(shí)、傳統(tǒng)典籍等容易“編造情節(jié)”等,但這些問題在今年會有明顯的改進(jìn)。
同時,劉慶峰公布了年內(nèi)大模型技術(shù)持續(xù)升級的三個關(guān)鍵里程碑節(jié)點(diǎn):6月9日,將突破開放式問答、多輪對話能力明顯提升、數(shù)學(xué)能力再升級;8月15日,代碼能力升級以及多模態(tài)交互能力提升;10月24日,將實(shí)現(xiàn)通用模型對標(biāo)ChatGPT,中文超越ChatGPT的當(dāng)前版本,英文能做到相當(dāng)水平,并在教育、醫(yī)療等領(lǐng)域做到業(yè)界領(lǐng)先。