界面新聞記者 | 查沁君
數(shù)字人的風吹到了教育領域。
日前,高途(NYSE:GOTU)推出AI考研數(shù)字人——文勇老師;中公教育(002607.SZ)也首次公開其虛擬數(shù)字講師小鹿,并發(fā)布首款AI課程,由小鹿全程授課。
ChatGPT引發(fā)大模型浪潮,也為數(shù)字人的內(nèi)容輸出增添更多互動性和想象力。過去以CG動作捕捉技術為主的虛擬主播模式,正進入AI驅動的3.0時代。
據(jù)前瞻產(chǎn)業(yè)研究院數(shù)據(jù),中國虛擬數(shù)字人市場規(guī)模預計2030年達2700億元,其中身份型虛擬人市場規(guī)模占比有望達2/3。但在教育領域,數(shù)字人的應用案例還比較稀缺。
“從課程產(chǎn)品的角度來說,這是一個很大的進步?!备咄敬髮W生業(yè)務負責人劉文勇在接受界面教育專訪時稱。
數(shù)字人背后的運行邏輯較簡單,只要給到文字內(nèi)容,就可通過技術轉化成語音,再配合形象即時生成視頻。
相對難的是互動,不過如今在大模型的加持下,能通過機器自我學習,實時生成文字,互動效率也在大幅提升。
目前大家對于通用大模型的使用仍比較謹慎,尤其是教育行業(yè)對準確性的要求較高,一般會輸入專業(yè)內(nèi)容、設置信息圍欄,讓回答更加精確。
是選擇自研大模型,還是基于市面已有大模型進行應用開發(fā)?高途選擇的是后者。
劉文勇認為,ChatGPT之所以火爆,正因為它是通用大模型,從技術邏輯上看,強者會越來越強,所有人都要在其身上生成專業(yè)化內(nèi)容,而垂直的專業(yè)化模型可能在特定范圍內(nèi)的結果略優(yōu)于通用模型,卻無法在交互效率上勝出。
騰訊教育企業(yè)總經(jīng)理楊暉在接受界面教育采訪時提到,教育企業(yè)最關心數(shù)據(jù)安全,尤其是題庫等核心業(yè)務數(shù)據(jù),“例如高途的數(shù)據(jù)不會出它的服務器,我們也不會去要他們的數(shù)據(jù)?!?/p>
楊暉認為,行業(yè)大模型的未來趨勢,應當是科技公司提供基礎算力和工具,教育科技公司為數(shù)據(jù)提供方。
降本增效是教育行業(yè)應用AI數(shù)字人的一大底層邏輯。
教育行業(yè)重人力,尤其“雙減”前,據(jù)北京師范大學2020年數(shù)據(jù),僅K12頭部十余家在線教育機構輔導老師的數(shù)量就有近十萬。其承擔的工作量多且雜,不僅包括協(xié)助主講授課、課后答疑、批改作業(yè),甚至承擔銷售角色,溝通課程續(xù)報等。
據(jù)劉文勇透露,高途大學生業(yè)務線的輔導老師目前有100多人,70%碩士以上學歷,但仍有較重的服務壓力。
以考研英語的作文批改為例,每年考前9-11月是忙碌高峰期,由于工作量大,高途前幾年為輔導老師設置了幫“每位學生改十篇文章”的上限,如今有AIGC系統(tǒng)協(xié)助后,高途宣布刪掉所有答疑限制。輔導老師的角色從單一內(nèi)容創(chuàng)作者變成復合的內(nèi)容審核者。
在高途內(nèi)部,AI也被提升至戰(zhàn)略級高度。該公司今年九周年內(nèi)部講話中,創(chuàng)始人陳向東明確三大業(yè)務方向,分別是線上+線下+OMO、短視頻直播(含抖音、視頻號)、ChatGPT+教育。
陳向東還提及,作為戰(zhàn)略項目,將投入很大一筆資金深度探索GPT相關方向,內(nèi)部會組建多個探索團隊,不排除投資外部優(yōu)秀團隊。
“老師都希望能徹底因材施教,但沒有任何人真正做到過,因為勞動量完全不支持?!眲⑽挠路Q,“而AI似乎撕開了口子,這個事情好像變得有可能了?!?/p>
以下為部分對話內(nèi)容,有刪減。
界面教育:AI考研數(shù)字人項目怎么啟動的?其在高途內(nèi)部的優(yōu)先級如何?
劉文勇:受李開復老師影響,我在ChatGPT3.0時代就已關注,在此拐點之前,你能明顯感受到這不是真人,但如今GPT令人驚嘆,給的答案既準確且能理解人的意思。
于是,今年初我們開始產(chǎn)品化嘗試,人物形象已調(diào)試完,還需大量教研人員研發(fā)好上課內(nèi)容。只需文字稿,就能讓數(shù)字人講所有該講的話,包括語氣。
數(shù)字人能單獨教一些簡單課程,如詞匯課、晨讀課,目前已上線,一天大概售賣數(shù)十單。這在互聯(lián)網(wǎng)領域不算高,還在小范圍試跑階段。
當然,AIGC遠不能替代真實老師的情感與說服力,所以我們還是堅持以名師為核心、AI打配合。
Larry(高途創(chuàng)始人陳向東)也強調(diào),AI是我們?nèi)髴?zhàn)略目標之一,優(yōu)先級非常高。
大學生業(yè)務部正嘗試拓展線下,包括北京、鄭州、成都、沈陽,而且是AIGC協(xié)助下的新型線下OMO產(chǎn)品。不過我屬于步調(diào)慢的,必須是一個(地區(qū))盈利了,再做第二個。
界面教育:相比文娛業(yè)的虛擬主播、虛擬偶像、金融業(yè)的數(shù)字員工,教育行業(yè)的AI數(shù)字人是否相對晚?
劉文勇:李開復曾在《AI·未來》中描述AI的四波浪潮:第一波在數(shù)據(jù)最多的領域——互聯(lián)網(wǎng),涌現(xiàn)各種應用。
第二波浪潮,金融、教育等行業(yè)崛起。第三波浪潮,AI更加智能,不僅能聽、能看,還有觸感。第四波浪潮,AI機器人、無人工廠、無人倉儲、無人駕駛將逐漸普及。
我想這個預測應該是正確的,那些反饋及時、離錢特別近、替代完人力后能出現(xiàn)巨大成本優(yōu)勢的行業(yè),肯定是盡可能早的被替代,而相對傳統(tǒng)的(行業(yè))更難或更晚被替代。教育相對晚、也更謹慎。
界面教育:相較其它行業(yè),教育行業(yè)對內(nèi)容的容錯率更低,高途在應用大模型時如何保證這點?
劉文勇:互動性、準確性對教育行業(yè)來說非常重要。只要內(nèi)容生成速度足夠快,就能部分解決互動性問題。目前國內(nèi)外主流大模型生成速度都已基本達到正常人類應有的速度,甚至Bard的速度略勝一籌。
大模型在英語上的表現(xiàn)更好;ChatGPT4.0增加插件系統(tǒng)后,數(shù)學的正確率也大幅提高。
我們逐步做了整套跟GPT溝通的話術,譬如輔導老師會要求GPT回答某道題為何錯,背后哪些知識點有問題,并因材施教出題,每五題一組,一共25題,難度逐級遞增,每題附相應解析。
輔導老師只需在此基礎上進行審校,再輔導學生,學生會明顯感覺“老師”對他更attentive(細致關心),也更有針對性。
界面教育:成本方面,內(nèi)部有沒有算一筆賬?AI數(shù)字人從生成到后期運營,對比請真人老師,會便宜很多嗎?
劉文勇:會便宜,但不會很多,現(xiàn)在需要很多技術和運營人員來操作。長期來看,我們自己算過,肯定是有機會顛覆某些事情,才會花這么多時間精力。
隨著技術成熟,算力價格也肉眼可見地往下掉,再過幾年可能會非常便宜。很多素材第一次做的時候很貴,但都是可復用的,因此成本也在遞減。
我們現(xiàn)在的實驗性產(chǎn)品就賣幾十塊錢,主要是為調(diào)優(yōu)模型而做,肯定不掙錢,也不打算掙錢。這個模型如果跑通跑順了,在別的地方放大,想象空間就太大了。
例如教研端被AIGC放大,或將有十倍增速,這個市場是不是有可能成為一個千億的生意?但就目前而言還有很長驗證的路要走。
界面教育:一個行業(yè)共識是,數(shù)字人技術本身沒有太大差別,關鍵還是應用層,高途如果先跑通,其它教育公司跟進,未來會形成怎樣的競爭格局?
劉文勇:技術的應用本身沒有難度,它就是一個苦力活兒。得有人愿意去吃螃蟹,愿意去做研發(fā),把最新技術變成教學產(chǎn)品,包括若干瑣碎的細節(jié)和環(huán)節(jié)。
行業(yè)內(nèi)擁有技術能力的公司挺多,后面就比誰的動作快,兩年之內(nèi)一定會形成最開始在線直播大課時的(競爭狀態(tài)),拼運營效率和算力,誰能輸出內(nèi)容,誰愿意踏實做教研。
界面教育:銀行業(yè)預計,到2025年,80%的銀行會部署數(shù)字員工,承擔90%的客服和理財服務,教育行業(yè)何時能達到該程度?
劉文勇:面向大學生的產(chǎn)品應該在這三年就會有變化,然后是中小學生,整個過程五年內(nèi)一定會走完一個階段。商業(yè)變化是很快的,一旦走通,大家都會慢慢接受這個東西。
AI浪潮已經(jīng)來了,躲不過去的,你的目標就是跑得更快一點。