界面新聞記者 | 查沁君
界面新聞編輯 | 文姝琪
大模型正在教育領(lǐng)域加速落地。
7月12日,職教巨頭粉筆(02469.HK)推出公考行業(yè)內(nèi)首個自研的垂直大模型,并宣布將于8月1日上線粉筆AI老師“粉筆頭”。
在此之前,網(wǎng)易有道(NYSE:DAO)、好未來(NYSE:TAL)、作業(yè)幫、猿輔導(dǎo)等教企均已推出各自訓(xùn)練的教育大模型,并結(jié)合口語陪練、作文批改、個性化學(xué)習(xí)等場景,在學(xué)習(xí)機、詞典筆等硬件中落地。
此前業(yè)內(nèi)有觀點認為,隨著通用大模型能力的普遍增強,垂直領(lǐng)域的模型沒有存在的必要。對此,粉筆CTO陳建華有不同的看法。
據(jù)其介紹,粉筆從2023年一季度開始探索大模型和教育的結(jié)合。他發(fā)現(xiàn),某些場景里,通用大模型的表現(xiàn)不及預(yù)期,比如在回答行測這類客觀題時,正確率非常低。在命題方面,通用大模型只能做到模仿題目的形態(tài),在題目的難度、內(nèi)容和考點設(shè)置上無法滿足需求。
但通用大模型在面試點評環(huán)節(jié)這類受限的小場景下,效果非常好且可控。面試點評是學(xué)生備考的剛需,之前主要由老師人工完成,工作量大、效率低、單價高,如果借助于AI輔助老師進行面試點評,老師的點評時間可以從20分鐘縮短到5分鐘之內(nèi)。AI面試點評的可用率也可在90%以上。
面對通用大模型和垂直大模型之間的“紛爭”,好未來CTO田密也曾公開表示,現(xiàn)在通用大模型可以來解決很多尋常的通用問題,但在某個專項任務(wù)上只能解決到六七分的水平,如果想取得更好的結(jié)果,必須在垂直領(lǐng)域上做更專項的訓(xùn)練。
“大模型在B端(企業(yè))內(nèi)部提效方面會更容易落地?!?/span>陳建華稱,例如上述提到的面試點評場景,通過大模型給出點評的內(nèi)容,再由輔導(dǎo)老師把關(guān),輸出到學(xué)生端,可提高效率。
在他看來,對于準確性要求比較高的教育場景,C端(用戶)應(yīng)用的落地會面臨著非常大的挑戰(zhàn),其中最大的挑戰(zhàn)就是大模型的“幻覺”問題,例如在一些歷史人物類的嘗試問題中,可能會存在張冠李戴的效果,“這一點對教育行業(yè)來說是非常致命的”。
目前,粉筆的做法是借助于RAG(Retrieval-Augmented Generation)檢索增強生成的輔助來克服幻覺,同時利用CoT(思維鏈)讓大模型按照步驟一步步進行推理。
另一方面,采用分治法,嘗試將復(fù)雜的問題拆分成足夠簡單的任務(wù)再讓模型處理,陳建華稱,效果會遠遠好過于直接將整個復(fù)雜的任務(wù)交給模型處理。
“每個產(chǎn)品都值得用大模型技術(shù)重做一遍?!?/span>陳建華認為,這里的重做不是要推倒過去已有的成果,而是要借助于大模型從效率、過程和結(jié)果上重塑整個流程,以提供更多可能性。
在應(yīng)用場景上,粉筆AI老師已覆蓋學(xué)員的入班測試、理論學(xué)習(xí)、強化練習(xí)、模擬套卷,直到最后的沖刺階段。陳建華預(yù)計今年將上線申論AI老師。此外,面試AI老師、事業(yè)單位和教師項目的AI老師也在籌備中。
粉筆副總裁劉帥表示,粉筆AI老師將是未來粉筆主流的最高端的產(chǎn)品之一。
越來越多的AI老師上線,真人老師會失業(yè)嗎?
當(dāng)日發(fā)布會上,粉筆創(chuàng)始人、CEO張小龍對此予以否定,技術(shù)進步并不意味著就能取代行業(yè)人士,學(xué)習(xí)的過程不僅僅是知識學(xué)習(xí),與此同時還伴隨著老師提供的情緒價值。相反,技術(shù)解放了人之后,身體會變得越來越強,人也會變得越來越有智慧,更有趣、更有意識。
張小龍還表示,粉筆AI老師作為一款C端的AI產(chǎn)品,是“收費”且“收得起費”的。他同時呼吁:“中國科技領(lǐng)域的朋友們,不要都盯著通用大模型,可以多一些針對具體領(lǐng)域的具體服務(wù),早日實現(xiàn)商業(yè)化?!?/span>