文|多鯨資本 翟良
1956年8月,在美國韓諾斯小鎮(zhèn)達特茅斯學院中,約翰·麥卡錫等 5 名科學家聚在一起,討論著一個不食人間煙火的主題:用機器人來模仿人類學習以及其他方面的智能。
1956年也就成為了人工智能元年。
當人工智能走過了 67 年的發(fā)展歷程,一場以「 大規(guī)模 GPT 」為產(chǎn)業(yè)賽道的「 大戰(zhàn) 」一觸即發(fā)。2023 年 4 月是中國大模型「 狂飆 」的關鍵月,前有華為、商湯的大模型發(fā)布,后有科大訊飛星火認知大模型在眾行業(yè)的廣泛鏈接......一時間,整個產(chǎn)業(yè)圈爭先恐后,資本市場風起云涌。
5 月初,大型教育企業(yè)先后競相推出教育相關大模型產(chǎn)品,希望借由 AI 大模型技術,革新傳統(tǒng)的教育模式。其中包括,學而思面向全球數(shù)學愛好者和科研機構進行的數(shù)學大模型 MathGPT 的研發(fā);科大訊飛公布其自研的星火認知大模型等。陣勢如此之大,大模型會將智能化學習領域應用推向新紀元嗎?
01 大模型“狂飆”時代到來
2022 年末,Open AI 的「 ChatGPT 」宣告誕生,作為人工智能研發(fā)領域的「 新物種 」,引起國內(nèi)外人工智能產(chǎn)業(yè)界的軒然大波,隨后不到四個月的時間,一場「 大模型之戰(zhàn) 」席卷而來。據(jù)不完全統(tǒng)計,目前國內(nèi)已有 30 多個研發(fā)機構和企業(yè)紛紛推出自己的大模型產(chǎn)品,這自然少不了百度、阿里云等大公司參與其中。
中國社科院王宗琦教授指出,以大規(guī)模生成式語言模型為發(fā)展方向的研發(fā)與應用,可以在某一特定領域產(chǎn)生效率,但在需要強大邏輯推理能力的數(shù)學、醫(yī)學等領域會有明顯欠缺與不足,不論人工智能發(fā)展到何種程度,用在學科學習上,不僅需要大模型語言處理的能力,更需要其在數(shù)學學習中所具備的精細、準確的邏輯推理能力。
我們不難發(fā)現(xiàn),國內(nèi)各大企業(yè)發(fā)布的大模型產(chǎn)品,大部分的開展方向多集中在通用語言模型上,有報道稱這種模型更像是一個「文科生 」,在語言翻譯、摘要、理解和生成等任務上有出色的表現(xiàn),但在數(shù)學問題的解決、講解、問答和推薦方面則存在明顯不足。
大語言模型在文學創(chuàng)作、商業(yè)文案寫作、中文理解等使用場景能力突出,甚至在意圖理解力以及回答準確性、流暢性上都接近人類水平,但想在數(shù)學領域具備批判性思考的能力和使用科學方法去解決問題的能力,仍需研發(fā)新的大模型。
據(jù)悉,學而思正在進行自研數(shù)學大模型 MathGPT 的研發(fā),面向全球數(shù)學愛好者和科研機構,以數(shù)學領域的解題和講題算法為核心,在復雜邏輯條件下,完成數(shù)學學習多步驟推理任務,該項研發(fā)目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級應用。因此,學而思已經(jīng)啟動在美國硅谷的團隊建設,將成立一支海外算法和工程團隊,在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。
由于大語言模型的推理與計算能力有限,因此 MathGPT 需要結合大語言模型和計算引擎兩者的能力,大語言模型需要理解題目、分步解析,并在合適的步驟自行調(diào)用計算引擎。據(jù)了解,數(shù)學大模型 MathGPT 的研發(fā)需要極其巨大的計算資源和大量的數(shù)據(jù),以及更加復雜的算法和技術,學而思之所以用自己在數(shù)學和 AI 上的多年積累,面向全球范圍內(nèi)的數(shù)學愛好者和科研機構,進行數(shù)學大模型的研發(fā),最終是希望通過 MathGPT 攻克數(shù)學學習和科學研究上存在的「 解題出現(xiàn)錯誤、解題步驟不穩(wěn)定、解題方法機械化 」等諸多的問題。
著名教育家、課程專家李靜純先生認為,過去幾年我國數(shù)學教學一直沒放棄對數(shù)學建模的探索與實踐,但仍然停留在數(shù)學建模思想的探索范疇,實際應用并未取得突破性進展。建立數(shù)學大模型的過程是把錯綜復雜的實際問題轉化為合理的數(shù)學結構的問題,數(shù)學大模型是一種數(shù)學的思考方法。數(shù)學的特點不僅在于概念的抽象性、邏輯的嚴密性、結論的明確性和體系的完整性,而在于它應用的廣泛性。特別是現(xiàn)在,各種實際應用的題目越來越多,這就需要建立數(shù)學大模型。
專家認為,數(shù)學大模型強調(diào)如何把實際問題轉化為數(shù)學問題,學生需要應用數(shù)學思維、數(shù)學邏輯及相關知識對實際問題進行研究并經(jīng)過計算,進而解決這些問題,得出反映實際問題的最佳數(shù)學模型及模型最優(yōu)解。因此,在數(shù)學學習中融入數(shù)學大模型思想,鼓勵學生參與數(shù)學大模型的理論與實踐相結合,不但可以使學生學以致用,做到理論聯(lián)系實際,而且還會使他們感受到數(shù)學的生機與活力,激發(fā)求知的興趣和探索的欲望,數(shù)學修養(yǎng)自然而然得以培養(yǎng)及提高。
02 會解數(shù)學題的GPT如何誕生?
「 ChatGPT 」橫空出世,意味著人工智能迎來前所未有的技術革命,但研發(fā)大模型產(chǎn)品并非易事,又有多少企業(yè)具備數(shù)據(jù)、算力、人力、財力的條件和優(yōu)勢?大模型產(chǎn)品能否贏得市場,不僅要擁有豐富的行業(yè)知識和數(shù)據(jù),而且最關鍵的還要靠全面的開源技術體系作支撐;所以,有人說「 大模型 」是屬于「 大公司 」的「 盛宴 」。
對于國內(nèi)掀起的「 大模型 」產(chǎn)業(yè)風暴,復旦大學教授、上海市數(shù)據(jù)科學重點實驗室主任肖仰華指出,大模型的誕生宣告了整個人工智能進入全新的重工業(yè)時代,人類歷史上技術革命歷經(jīng)數(shù)次突破和發(fā)展,已經(jīng)從相對低級的「 手工作坊 」模式最終形成了成熟的重工業(yè)發(fā)展模式,而今天的大模型產(chǎn)業(yè)發(fā)展有三個鮮明的特征:大模型、大算力和大數(shù)據(jù)。
據(jù)了解,當前我國大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)方面是有優(yōu)勢的,在算力方面是有所缺乏的,是短期之內(nèi)難以跟上或者超越的。有專家認為,隨著大模型參數(shù)量的持續(xù)增長,大模型對于算力的需求越來越迫切。算力已經(jīng)成為大模型玩家的準入門檻,已經(jīng)成為制約大模型發(fā)展的主要瓶頸,這是需要付出巨大代價進行摸索的。
大模型產(chǎn)業(yè)的發(fā)展與競爭,歸根結底是算力的競爭,絕大多數(shù)大模型玩家都缺乏算力,靠買算力支撐大模型產(chǎn)品的研發(fā)。而如今,從某種程度上來看,學而思已經(jīng)完全實現(xiàn)了算力自主自控,為學而思啟動大模型 MathGPT 的研發(fā),提供開源算法體系的支持。
學而思數(shù)學大模型 MathGPT 究竟會對全球數(shù)學愛好者和科研機構帶來怎樣的影響?有報道稱,數(shù)學大模型 MathGPT,可以用來預測、分類、聚類、優(yōu)化等各種具有挑戰(zhàn)性的各種任務,可以運用深度學習算法來解決數(shù)學領域中各種復雜的問題,提高數(shù)學學習的高效性和準確性。當今數(shù)學在各個領域蓬勃發(fā)展,應用廣泛。學而思的數(shù)學大模型 MathGPT 在人工智能新的發(fā)展階段,或許會承擔更大的使命。
03 大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開始
大模型產(chǎn)業(yè)研究與發(fā)展,對社會各行業(yè)的發(fā)展產(chǎn)生了重大的影響,大模型的 AI 技術廣泛地鏈接到眾行業(yè)(教育、辦公、汽車、數(shù)字員工等),下沉到更多的應用場景,眾行業(yè)因此迎來了全新的變革。有業(yè)界人士認為,國內(nèi)大模型的發(fā)展,盡管呈現(xiàn)一片「 熱鬧 」景象,但也存在令人擔憂的地方。國內(nèi)人工智能產(chǎn)業(yè)的企業(yè)與研發(fā)機構要清醒地認識到,大模型應用模式也仍然面臨著若干問題,比如仍存在技術路線同質化嚴重、數(shù)據(jù)生態(tài)不完善、算力掣肘、模型創(chuàng)新有限等問題。仍需要企業(yè)與研發(fā)機構從數(shù)據(jù)共享、算力協(xié)作、開源生態(tài)、人才培養(yǎng)、評測體系、成本控制、應用探索與技術研究等各方面推動大模型發(fā)展。
據(jù)了解,在數(shù)學領域,目前市場上存在幾個主要流派。比如 Google 收購的 Photomath、微軟數(shù)學、Mathway、專注數(shù)學計算的 WolframAlpha 等產(chǎn)品,主要利用通用 LLM (大型語言模型)的 AI 技術加上數(shù)據(jù)庫的方式解決數(shù)學問題。盡管也產(chǎn)生了很大的變化,但本質上只是模型接受了更多數(shù)據(jù)的訓練 —— GPT-4 仍然不能保證計算結果的準確或給出清晰易懂的推理過程。
也就是說,盡管在數(shù)學領域存在著幾大大模型流派,但在實際應用場景中需要的復雜的決策能力、研判能力、綜合任務的拆解能力、不確定場景的邏輯推理能力仍十分的欠缺;所以從強大的語言處理能力到復雜的邏輯推理能力仍需要漫長的摸索的時間。
在大型語言模型不斷進化的浪潮下,不同的技術路線選擇孰優(yōu)孰劣,仍有待討論和驗證。學而思獨立自研的 MathGPT 大模型是否成立,是否能夠超越通用模型在數(shù)學任務上的表現(xiàn),是否更匹配不同人群的數(shù)學學習場景,這個問題還需要在創(chuàng)新實踐中尋找答案。