界面新聞?dòng)浾?| 查沁君
教育公司也“卷”入了大模型浪潮中。
7月26日,網(wǎng)易有道(NYSE: DAO)正式對(duì)外發(fā)布國(guó)內(nèi)首個(gè)教育領(lǐng)域垂直大模型“子曰”,并推出基于“子曰”大模型研發(fā)的六大應(yīng)用——“LLM翻譯”、“虛擬人口語(yǔ)教練”、“AI作文指導(dǎo)”、“語(yǔ)法精講”、“AI Box”以及“文檔問(wèn)答”。
目前,AI Box和文檔問(wèn)答已經(jīng)在有道翻譯中上線,口語(yǔ)教練、作文輔導(dǎo)和語(yǔ)法精講下月初搭載在新學(xué)習(xí)硬件上線,大模型翻譯將在今年三季度上線。
大語(yǔ)言模型誕生于2018年,谷歌的BERT是最早模型,自去年11月ChatGPT將大模型產(chǎn)品化后,它開(kāi)始展示巨大的革命性力量,一時(shí)間,大模型成為全新風(fēng)口,國(guó)內(nèi)外巨頭相繼涌入。
“每個(gè)月、每個(gè)星期都刷新行業(yè)對(duì)AI技術(shù)未來(lái)可能性的想象?!本W(wǎng)易有道CEO周楓在發(fā)布會(huì)現(xiàn)場(chǎng)表示。過(guò)去半年,其團(tuán)隊(duì)也在持續(xù)進(jìn)行產(chǎn)品研發(fā)和迭代,并推出一系列小規(guī)模用戶(hù)實(shí)驗(yàn)。
在他看來(lái),大模型給教育領(lǐng)域帶來(lái)的最大機(jī)會(huì),就是助力因材施教,包括以下三大關(guān)鍵機(jī)會(huì):
第一,個(gè)性化分析和指導(dǎo)。大模型具有強(qiáng)大的生產(chǎn)能力,且能進(jìn)行定制化的反饋,比如面對(duì)一道作文題,大模型在理解題目含義后,可給出寫(xiě)作指導(dǎo),也可以對(duì)學(xué)生的寫(xiě)作進(jìn)行個(gè)性化的反饋。
第二,引導(dǎo)式學(xué)習(xí)。通過(guò)不斷提問(wèn),讓學(xué)生培養(yǎng)自我學(xué)習(xí)的能力,提高批判化思維。
第三,全學(xué)科教學(xué)。通過(guò)掌握海量知識(shí),從而實(shí)現(xiàn)跨學(xué)科的搜索和語(yǔ)言生成能力。
相比通用大模型,“子曰”大模型的定位是以“場(chǎng)景為先”的教育垂類(lèi)大模型。作為基座模型支持諸多下游任務(wù),向所有下游場(chǎng)景提供語(yǔ)義理解、知識(shí)表達(dá)等基礎(chǔ)能力。
發(fā)布會(huì)現(xiàn)場(chǎng),有道詞典業(yè)務(wù)負(fù)責(zé)人與虛擬人口語(yǔ)教練Echo進(jìn)行了對(duì)話,Echo能根據(jù)對(duì)話者的發(fā)言和對(duì)上下文的理解,及時(shí)反饋。對(duì)話結(jié)束后,Echo還會(huì)給出發(fā)音、語(yǔ)法等建議。
周楓在群訪中坦言,對(duì)這位口語(yǔ)教練“寄予厚望”,畢竟其背后指向的是口語(yǔ)陪練這個(gè)百億市場(chǎng)。該項(xiàng)目采取會(huì)員付費(fèi)制,較真人口語(yǔ)教練花費(fèi)更低。
AI口語(yǔ)陪練并非新事物,大模型出現(xiàn)以前,就已有大量相關(guān)產(chǎn)品,基于大模型的虛擬人口語(yǔ)陪練有何不同?
“以前AI口語(yǔ)陪練產(chǎn)品所給出的對(duì)話,是基于提前設(shè)定的模板,AI基于模板進(jìn)行微調(diào),給出對(duì)話內(nèi)容?!本W(wǎng)易有道首席科學(xué)家段亦濤在群訪中解釋?zhuān)?/span>大模型的生成能力更強(qiáng),并具有了一定的推理能力。
不僅如此,周楓還透露:“內(nèi)部調(diào)研中,‘子曰’大模型的翻譯能力已經(jīng)優(yōu)于ChatGPT、超過(guò)了市面上所有主流翻譯引擎。”
但“子曰”大模型翻譯目前僅支持中英文互譯,尚未開(kāi)發(fā)其他語(yǔ)種?!昂苤匾脑蚴谴竽P鸵娴挠?jì)算量大,比原有引擎貴20倍?!敝軛鞣Q(chēng)。
這指向了大模型背后的一個(gè)關(guān)鍵問(wèn)題,即投入產(chǎn)出比和商業(yè)化。
相比接入通用大模型,自研模型在數(shù)據(jù)采集和處理、訓(xùn)練資源和時(shí)間、算法和模型架構(gòu)、模型評(píng)估和調(diào)優(yōu)上,所耗費(fèi)的成本和資源是一筆不小的賬單。如果不能有效完成商業(yè)化,則很難收回成本,后續(xù)的迭代、更新、升級(jí)更是難題。
恰逢近日Meta宣布將推出開(kāi)源大型語(yǔ)言模型Llama2,免費(fèi)用于研究和商業(yè)用途。這意味著,企業(yè)和個(gè)人可以在Llama2的基礎(chǔ)上以較低的成本開(kāi)發(fā)自己的專(zhuān)屬大模型。
“這也是我們內(nèi)部非常關(guān)心的問(wèn)題,我們非常擁抱開(kāi)源?!敝軛髟谌涸L中稱(chēng),“但我們做AI的重點(diǎn),永遠(yuǎn)是盯著最后的應(yīng)用落地?!敝赃x擇自研,也是因?yàn)楝F(xiàn)有模型暫時(shí)不能滿(mǎn)足需求,尤其是像語(yǔ)法、答疑等深度需求。不排除“哪一天開(kāi)源項(xiàng)目很成熟,我們也會(huì)用”。
周楓還認(rèn)為,世界上大部分的大模型都將會(huì)免費(fèi),因?yàn)槠溥呺H成本非常低,復(fù)制模型其實(shí)不需要成本。商業(yè)公司會(huì)從多個(gè)角度推動(dòng)大模型免費(fèi)、開(kāi)源,比如為了增強(qiáng)公司影響力、構(gòu)建生態(tài),或者純粹為了惠及公眾。
在這趟由大模型驅(qū)動(dòng)的新一輪“AI技術(shù)快車(chē)”上,網(wǎng)易有道并非唯一的教育企業(yè)。
在國(guó)外,可汗學(xué)院、多鄰國(guó)(NASDAQ:DUOL)、Chegg(NYSE:CHGG)等教育機(jī)構(gòu)相繼宣布推出接入GPT-4的學(xué)習(xí)輔助工具,且有一定的商業(yè)化考量。
以多鄰國(guó)推出的新產(chǎn)品“Duolingo Max”為例,Max訂閱服務(wù)收費(fèi)30美元/月、168美元/年,目前僅限于iPhone平臺(tái),主要面向?qū)W習(xí)西班牙語(yǔ)和法語(yǔ)的英語(yǔ)用戶(hù)。
在國(guó)內(nèi),和網(wǎng)易有道一樣,好未來(lái)(NYSE: TAL)瞄準(zhǔn)的也是垂類(lèi)大模型,并利用自身基因和資源強(qiáng)項(xiàng),研發(fā)數(shù)學(xué)大模型MathGPT,預(yù)計(jì)于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。
周楓也提到研發(fā)數(shù)學(xué)大模型的難點(diǎn)所在,“數(shù)學(xué)光喂內(nèi)容沒(méi)用,因?yàn)樗窃韱?wèn)題,現(xiàn)有技術(shù)沒(méi)法做到套一下就能使用(的地步)。”相反,如果是文字語(yǔ)言型的應(yīng)用,不需要特別強(qiáng)的推理。
近日,美國(guó)研究人員評(píng)估了ChatGPT模型在不同時(shí)期版本的表現(xiàn)能力,發(fā)現(xiàn)GPT-3.5和GPT-4的某些性能正在變差,尤其是GPT-4求解數(shù)學(xué)問(wèn)題的能力,GPT-4在3月表現(xiàn)出的97.6%準(zhǔn)確率到6月降至2.4%。
科大訊飛(002230.SZ)也于近期對(duì)外展示其自研的“星火認(rèn)知大模型”,明確將通用AI大模型的能力推向?qū)W習(xí)機(jī)、錄音轉(zhuǎn)寫(xiě)工具“訊飛聽(tīng)見(jiàn)”等產(chǎn)品,上線了中英文作文類(lèi)人批改、數(shù)學(xué)類(lèi)人互動(dòng)輔學(xué)、英語(yǔ)類(lèi)人口語(yǔ)陪練等功能。
6月初,作業(yè)幫也傳出消息,稱(chēng)其研發(fā)的教育大模型在內(nèi)測(cè)階段,正在進(jìn)行相關(guān)評(píng)估及備案等工作。
無(wú)論是教育垂類(lèi)大模型的研發(fā),還是通用大模型在教育領(lǐng)域的落地,都并非易事,不僅需要強(qiáng)大的技術(shù)實(shí)力,還需要雄厚的資金投入。對(duì)于尚處早期的大模型來(lái)說(shuō),跑通商業(yè)模型尚需時(shí)日,這也意味著,教育企業(yè)在相當(dāng)長(zhǎng)的一段時(shí)間內(nèi)還難獲得回報(bào)。