正在閱讀:

大模型能否將AI智能化學(xué)習(xí)推向新紀(jì)元?

掃一掃下載界面新聞APP

大模型能否將AI智能化學(xué)習(xí)推向新紀(jì)元?

大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開(kāi)始。

文|多鯨資本 翟良

1956年8月,在美國(guó)韓諾斯小鎮(zhèn)達(dá)特茅斯學(xué)院中,約翰·麥卡錫等 5 名科學(xué)家聚在一起,討論著一個(gè)不食人間煙火的主題:用機(jī)器人來(lái)模仿人類學(xué)習(xí)以及其他方面的智能。

1956年也就成為了人工智能元年。

當(dāng)人工智能走過(guò)了 67 年的發(fā)展歷程,一場(chǎng)以「 大規(guī)模 GPT 」為產(chǎn)業(yè)賽道的「 大戰(zhàn) 」一觸即發(fā)。2023 年 4 月是中國(guó)大模型「 狂飆 」的關(guān)鍵月,前有華為、商湯的大模型發(fā)布,后有科大訊飛星火認(rèn)知大模型在眾行業(yè)的廣泛鏈接......一時(shí)間,整個(gè)產(chǎn)業(yè)圈爭(zhēng)先恐后,資本市場(chǎng)風(fēng)起云涌。

5 月初,大型教育企業(yè)先后競(jìng)相推出教育相關(guān)大模型產(chǎn)品,希望借由 AI 大模型技術(shù),革新傳統(tǒng)的教育模式。其中包括,學(xué)而思面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)進(jìn)行的數(shù)學(xué)大模型 MathGPT 的研發(fā);科大訊飛公布其自研的星火認(rèn)知大模型等。陣勢(shì)如此之大,大模型會(huì)將智能化學(xué)習(xí)領(lǐng)域應(yīng)用推向新紀(jì)元嗎?

01 大模型“狂飆”時(shí)代到來(lái)

2022 年末,Open AI 的「 ChatGPT 」宣告誕生,作為人工智能研發(fā)領(lǐng)域的「 新物種 」,引起國(guó)內(nèi)外人工智能產(chǎn)業(yè)界的軒然大波,隨后不到四個(gè)月的時(shí)間,一場(chǎng)「 大模型之戰(zhàn) 」席卷而來(lái)。據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)已有 30 多個(gè)研發(fā)機(jī)構(gòu)和企業(yè)紛紛推出自己的大模型產(chǎn)品,這自然少不了百度、阿里云等大公司參與其中。

中國(guó)社科院王宗琦教授指出,以大規(guī)模生成式語(yǔ)言模型為發(fā)展方向的研發(fā)與應(yīng)用,可以在某一特定領(lǐng)域產(chǎn)生效率,但在需要強(qiáng)大邏輯推理能力的數(shù)學(xué)、醫(yī)學(xué)等領(lǐng)域會(huì)有明顯欠缺與不足,不論人工智能發(fā)展到何種程度,用在學(xué)科學(xué)習(xí)上,不僅需要大模型語(yǔ)言處理的能力,更需要其在數(shù)學(xué)學(xué)習(xí)中所具備的精細(xì)、準(zhǔn)確的邏輯推理能力。

我們不難發(fā)現(xiàn),國(guó)內(nèi)各大企業(yè)發(fā)布的大模型產(chǎn)品,大部分的開(kāi)展方向多集中在通用語(yǔ)言模型上,有報(bào)道稱這種模型更像是一個(gè)「文科生 」,在語(yǔ)言翻譯、摘要、理解和生成等任務(wù)上有出色的表現(xiàn),但在數(shù)學(xué)問(wèn)題的解決、講解、問(wèn)答和推薦方面則存在明顯不足。

大語(yǔ)言模型在文學(xué)創(chuàng)作、商業(yè)文案寫(xiě)作、中文理解等使用場(chǎng)景能力突出,甚至在意圖理解力以及回答準(zhǔn)確性、流暢性上都接近人類水平,但想在數(shù)學(xué)領(lǐng)域具備批判性思考的能力和使用科學(xué)方法去解決問(wèn)題的能力,仍需研發(fā)新的大模型。

據(jù)悉,學(xué)而思正在進(jìn)行自研數(shù)學(xué)大模型 MathGPT 的研發(fā),面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,在復(fù)雜邏輯條件下,完成數(shù)學(xué)學(xué)習(xí)多步驟推理任務(wù),該項(xiàng)研發(fā)目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。因此,學(xué)而思已經(jīng)啟動(dòng)在美國(guó)硅谷的團(tuán)隊(duì)建設(shè),將成立一支海外算法和工程團(tuán)隊(duì),在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。

由于大語(yǔ)言模型的推理與計(jì)算能力有限,因此 MathGPT 需要結(jié)合大語(yǔ)言模型和計(jì)算引擎兩者的能力,大語(yǔ)言模型需要理解題目、分步解析,并在合適的步驟自行調(diào)用計(jì)算引擎。據(jù)了解,數(shù)學(xué)大模型 MathGPT 的研發(fā)需要極其巨大的計(jì)算資源和大量的數(shù)據(jù),以及更加復(fù)雜的算法和技術(shù),學(xué)而思之所以用自己在數(shù)學(xué)和 AI 上的多年積累,面向全球范圍內(nèi)的數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),進(jìn)行數(shù)學(xué)大模型的研發(fā),最終是希望通過(guò) MathGPT 攻克數(shù)學(xué)學(xué)習(xí)和科學(xué)研究上存在的「 解題出現(xiàn)錯(cuò)誤、解題步驟不穩(wěn)定、解題方法機(jī)械化 」等諸多的問(wèn)題。

著名教育家、課程專家李靜純先生認(rèn)為,過(guò)去幾年我國(guó)數(shù)學(xué)教學(xué)一直沒(méi)放棄對(duì)數(shù)學(xué)建模的探索與實(shí)踐,但仍然停留在數(shù)學(xué)建模思想的探索范疇,實(shí)際應(yīng)用并未取得突破性進(jìn)展。建立數(shù)學(xué)大模型的過(guò)程是把錯(cuò)綜復(fù)雜的實(shí)際問(wèn)題轉(zhuǎn)化為合理的數(shù)學(xué)結(jié)構(gòu)的問(wèn)題,數(shù)學(xué)大模型是一種數(shù)學(xué)的思考方法。數(shù)學(xué)的特點(diǎn)不僅在于概念的抽象性、邏輯的嚴(yán)密性、結(jié)論的明確性和體系的完整性,而在于它應(yīng)用的廣泛性。特別是現(xiàn)在,各種實(shí)際應(yīng)用的題目越來(lái)越多,這就需要建立數(shù)學(xué)大模型。

專家認(rèn)為,數(shù)學(xué)大模型強(qiáng)調(diào)如何把實(shí)際問(wèn)題轉(zhuǎn)化為數(shù)學(xué)問(wèn)題,學(xué)生需要應(yīng)用數(shù)學(xué)思維、數(shù)學(xué)邏輯及相關(guān)知識(shí)對(duì)實(shí)際問(wèn)題進(jìn)行研究并經(jīng)過(guò)計(jì)算,進(jìn)而解決這些問(wèn)題,得出反映實(shí)際問(wèn)題的最佳數(shù)學(xué)模型及模型最優(yōu)解。因此,在數(shù)學(xué)學(xué)習(xí)中融入數(shù)學(xué)大模型思想,鼓勵(lì)學(xué)生參與數(shù)學(xué)大模型的理論與實(shí)踐相結(jié)合,不但可以使學(xué)生學(xué)以致用,做到理論聯(lián)系實(shí)際,而且還會(huì)使他們感受到數(shù)學(xué)的生機(jī)與活力,激發(fā)求知的興趣和探索的欲望,數(shù)學(xué)修養(yǎng)自然而然得以培養(yǎng)及提高。

02 會(huì)解數(shù)學(xué)題的GPT如何誕生?

「 ChatGPT 」橫空出世,意味著人工智能迎來(lái)前所未有的技術(shù)革命,但研發(fā)大模型產(chǎn)品并非易事,又有多少企業(yè)具備數(shù)據(jù)、算力、人力、財(cái)力的條件和優(yōu)勢(shì)?大模型產(chǎn)品能否贏得市場(chǎng),不僅要擁有豐富的行業(yè)知識(shí)和數(shù)據(jù),而且最關(guān)鍵的還要靠全面的開(kāi)源技術(shù)體系作支撐;所以,有人說(shuō)「 大模型 」是屬于「 大公司 」的「 盛宴 」。

對(duì)于國(guó)內(nèi)掀起的「 大模型 」產(chǎn)業(yè)風(fēng)暴,復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華指出,大模型的誕生宣告了整個(gè)人工智能進(jìn)入全新的重工業(yè)時(shí)代,人類歷史上技術(shù)革命歷經(jīng)數(shù)次突破和發(fā)展,已經(jīng)從相對(duì)低級(jí)的「 手工作坊 」模式最終形成了成熟的重工業(yè)發(fā)展模式,而今天的大模型產(chǎn)業(yè)發(fā)展有三個(gè)鮮明的特征:大模型、大算力和大數(shù)據(jù)。

據(jù)了解,當(dāng)前我國(guó)大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)方面是有優(yōu)勢(shì)的,在算力方面是有所缺乏的,是短期之內(nèi)難以跟上或者超越的。有專家認(rèn)為,隨著大模型參數(shù)量的持續(xù)增長(zhǎng),大模型對(duì)于算力的需求越來(lái)越迫切。算力已經(jīng)成為大模型玩家的準(zhǔn)入門(mén)檻,已經(jīng)成為制約大模型發(fā)展的主要瓶頸,這是需要付出巨大代價(jià)進(jìn)行摸索的。

大模型產(chǎn)業(yè)的發(fā)展與競(jìng)爭(zhēng),歸根結(jié)底是算力的競(jìng)爭(zhēng),絕大多數(shù)大模型玩家都缺乏算力,靠買算力支撐大模型產(chǎn)品的研發(fā)。而如今,從某種程度上來(lái)看,學(xué)而思已經(jīng)完全實(shí)現(xiàn)了算力自主自控,為學(xué)而思啟動(dòng)大模型 MathGPT 的研發(fā),提供開(kāi)源算法體系的支持。

學(xué)而思數(shù)學(xué)大模型 MathGPT 究竟會(huì)對(duì)全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)帶來(lái)怎樣的影響?有報(bào)道稱,數(shù)學(xué)大模型 MathGPT,可以用來(lái)預(yù)測(cè)、分類、聚類、優(yōu)化等各種具有挑戰(zhàn)性的各種任務(wù),可以運(yùn)用深度學(xué)習(xí)算法來(lái)解決數(shù)學(xué)領(lǐng)域中各種復(fù)雜的問(wèn)題,提高數(shù)學(xué)學(xué)習(xí)的高效性和準(zhǔn)確性。當(dāng)今數(shù)學(xué)在各個(gè)領(lǐng)域蓬勃發(fā)展,應(yīng)用廣泛。學(xué)而思的數(shù)學(xué)大模型 MathGPT 在人工智能新的發(fā)展階段,或許會(huì)承擔(dān)更大的使命。

03 大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開(kāi)始

大模型產(chǎn)業(yè)研究與發(fā)展,對(duì)社會(huì)各行業(yè)的發(fā)展產(chǎn)生了重大的影響,大模型的 AI 技術(shù)廣泛地鏈接到眾行業(yè)(教育、辦公、汽車、數(shù)字員工等),下沉到更多的應(yīng)用場(chǎng)景,眾行業(yè)因此迎來(lái)了全新的變革。有業(yè)界人士認(rèn)為,國(guó)內(nèi)大模型的發(fā)展,盡管呈現(xiàn)一片「 熱鬧 」景象,但也存在令人擔(dān)憂的地方。國(guó)內(nèi)人工智能產(chǎn)業(yè)的企業(yè)與研發(fā)機(jī)構(gòu)要清醒地認(rèn)識(shí)到,大模型應(yīng)用模式也仍然面臨著若干問(wèn)題,比如仍存在技術(shù)路線同質(zhì)化嚴(yán)重、數(shù)據(jù)生態(tài)不完善、算力掣肘、模型創(chuàng)新有限等問(wèn)題。仍需要企業(yè)與研發(fā)機(jī)構(gòu)從數(shù)據(jù)共享、算力協(xié)作、開(kāi)源生態(tài)、人才培養(yǎng)、評(píng)測(cè)體系、成本控制、應(yīng)用探索與技術(shù)研究等各方面推動(dòng)大模型發(fā)展。

據(jù)了解,在數(shù)學(xué)領(lǐng)域,目前市場(chǎng)上存在幾個(gè)主要流派。比如 Google 收購(gòu)的 Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計(jì)算的 WolframAlpha 等產(chǎn)品,主要利用通用 LLM (大型語(yǔ)言模型)的 AI 技術(shù)加上數(shù)據(jù)庫(kù)的方式解決數(shù)學(xué)問(wèn)題。盡管也產(chǎn)生了很大的變化,但本質(zhì)上只是模型接受了更多數(shù)據(jù)的訓(xùn)練 —— GPT-4 仍然不能保證計(jì)算結(jié)果的準(zhǔn)確或給出清晰易懂的推理過(guò)程。

也就是說(shuō),盡管在數(shù)學(xué)領(lǐng)域存在著幾大大模型流派,但在實(shí)際應(yīng)用場(chǎng)景中需要的復(fù)雜的決策能力、研判能力、綜合任務(wù)的拆解能力、不確定場(chǎng)景的邏輯推理能力仍十分的欠缺;所以從強(qiáng)大的語(yǔ)言處理能力到復(fù)雜的邏輯推理能力仍需要漫長(zhǎng)的摸索的時(shí)間。

在大型語(yǔ)言模型不斷進(jìn)化的浪潮下,不同的技術(shù)路線選擇孰優(yōu)孰劣,仍有待討論和驗(yàn)證。學(xué)而思獨(dú)立自研的 MathGPT 大模型是否成立,是否能夠超越通用模型在數(shù)學(xué)任務(wù)上的表現(xiàn),是否更匹配不同人群的數(shù)學(xué)學(xué)習(xí)場(chǎng)景,這個(gè)問(wèn)題還需要在創(chuàng)新實(shí)踐中尋找答案。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。

評(píng)論

暫無(wú)評(píng)論哦,快來(lái)評(píng)價(jià)一下吧!

下載界面新聞

微信公眾號(hào)

微博

大模型能否將AI智能化學(xué)習(xí)推向新紀(jì)元?

大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開(kāi)始。

文|多鯨資本 翟良

1956年8月,在美國(guó)韓諾斯小鎮(zhèn)達(dá)特茅斯學(xué)院中,約翰·麥卡錫等 5 名科學(xué)家聚在一起,討論著一個(gè)不食人間煙火的主題:用機(jī)器人來(lái)模仿人類學(xué)習(xí)以及其他方面的智能。

1956年也就成為了人工智能元年。

當(dāng)人工智能走過(guò)了 67 年的發(fā)展歷程,一場(chǎng)以「 大規(guī)模 GPT 」為產(chǎn)業(yè)賽道的「 大戰(zhàn) 」一觸即發(fā)。2023 年 4 月是中國(guó)大模型「 狂飆 」的關(guān)鍵月,前有華為、商湯的大模型發(fā)布,后有科大訊飛星火認(rèn)知大模型在眾行業(yè)的廣泛鏈接......一時(shí)間,整個(gè)產(chǎn)業(yè)圈爭(zhēng)先恐后,資本市場(chǎng)風(fēng)起云涌。

5 月初,大型教育企業(yè)先后競(jìng)相推出教育相關(guān)大模型產(chǎn)品,希望借由 AI 大模型技術(shù),革新傳統(tǒng)的教育模式。其中包括,學(xué)而思面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)進(jìn)行的數(shù)學(xué)大模型 MathGPT 的研發(fā);科大訊飛公布其自研的星火認(rèn)知大模型等。陣勢(shì)如此之大,大模型會(huì)將智能化學(xué)習(xí)領(lǐng)域應(yīng)用推向新紀(jì)元嗎?

01 大模型“狂飆”時(shí)代到來(lái)

2022 年末,Open AI 的「 ChatGPT 」宣告誕生,作為人工智能研發(fā)領(lǐng)域的「 新物種 」,引起國(guó)內(nèi)外人工智能產(chǎn)業(yè)界的軒然大波,隨后不到四個(gè)月的時(shí)間,一場(chǎng)「 大模型之戰(zhàn) 」席卷而來(lái)。據(jù)不完全統(tǒng)計(jì),目前國(guó)內(nèi)已有 30 多個(gè)研發(fā)機(jī)構(gòu)和企業(yè)紛紛推出自己的大模型產(chǎn)品,這自然少不了百度、阿里云等大公司參與其中。

中國(guó)社科院王宗琦教授指出,以大規(guī)模生成式語(yǔ)言模型為發(fā)展方向的研發(fā)與應(yīng)用,可以在某一特定領(lǐng)域產(chǎn)生效率,但在需要強(qiáng)大邏輯推理能力的數(shù)學(xué)、醫(yī)學(xué)等領(lǐng)域會(huì)有明顯欠缺與不足,不論人工智能發(fā)展到何種程度,用在學(xué)科學(xué)習(xí)上,不僅需要大模型語(yǔ)言處理的能力,更需要其在數(shù)學(xué)學(xué)習(xí)中所具備的精細(xì)、準(zhǔn)確的邏輯推理能力。

我們不難發(fā)現(xiàn),國(guó)內(nèi)各大企業(yè)發(fā)布的大模型產(chǎn)品,大部分的開(kāi)展方向多集中在通用語(yǔ)言模型上,有報(bào)道稱這種模型更像是一個(gè)「文科生 」,在語(yǔ)言翻譯、摘要、理解和生成等任務(wù)上有出色的表現(xiàn),但在數(shù)學(xué)問(wèn)題的解決、講解、問(wèn)答和推薦方面則存在明顯不足。

大語(yǔ)言模型在文學(xué)創(chuàng)作、商業(yè)文案寫(xiě)作、中文理解等使用場(chǎng)景能力突出,甚至在意圖理解力以及回答準(zhǔn)確性、流暢性上都接近人類水平,但想在數(shù)學(xué)領(lǐng)域具備批判性思考的能力和使用科學(xué)方法去解決問(wèn)題的能力,仍需研發(fā)新的大模型。

據(jù)悉,學(xué)而思正在進(jìn)行自研數(shù)學(xué)大模型 MathGPT 的研發(fā),面向全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,在復(fù)雜邏輯條件下,完成數(shù)學(xué)學(xué)習(xí)多步驟推理任務(wù),該項(xiàng)研發(fā)目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。因此,學(xué)而思已經(jīng)啟動(dòng)在美國(guó)硅谷的團(tuán)隊(duì)建設(shè),將成立一支海外算法和工程團(tuán)隊(duì),在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。

由于大語(yǔ)言模型的推理與計(jì)算能力有限,因此 MathGPT 需要結(jié)合大語(yǔ)言模型和計(jì)算引擎兩者的能力,大語(yǔ)言模型需要理解題目、分步解析,并在合適的步驟自行調(diào)用計(jì)算引擎。據(jù)了解,數(shù)學(xué)大模型 MathGPT 的研發(fā)需要極其巨大的計(jì)算資源和大量的數(shù)據(jù),以及更加復(fù)雜的算法和技術(shù),學(xué)而思之所以用自己在數(shù)學(xué)和 AI 上的多年積累,面向全球范圍內(nèi)的數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu),進(jìn)行數(shù)學(xué)大模型的研發(fā),最終是希望通過(guò) MathGPT 攻克數(shù)學(xué)學(xué)習(xí)和科學(xué)研究上存在的「 解題出現(xiàn)錯(cuò)誤、解題步驟不穩(wěn)定、解題方法機(jī)械化 」等諸多的問(wèn)題。

著名教育家、課程專家李靜純先生認(rèn)為,過(guò)去幾年我國(guó)數(shù)學(xué)教學(xué)一直沒(méi)放棄對(duì)數(shù)學(xué)建模的探索與實(shí)踐,但仍然停留在數(shù)學(xué)建模思想的探索范疇,實(shí)際應(yīng)用并未取得突破性進(jìn)展。建立數(shù)學(xué)大模型的過(guò)程是把錯(cuò)綜復(fù)雜的實(shí)際問(wèn)題轉(zhuǎn)化為合理的數(shù)學(xué)結(jié)構(gòu)的問(wèn)題,數(shù)學(xué)大模型是一種數(shù)學(xué)的思考方法。數(shù)學(xué)的特點(diǎn)不僅在于概念的抽象性、邏輯的嚴(yán)密性、結(jié)論的明確性和體系的完整性,而在于它應(yīng)用的廣泛性。特別是現(xiàn)在,各種實(shí)際應(yīng)用的題目越來(lái)越多,這就需要建立數(shù)學(xué)大模型。

專家認(rèn)為,數(shù)學(xué)大模型強(qiáng)調(diào)如何把實(shí)際問(wèn)題轉(zhuǎn)化為數(shù)學(xué)問(wèn)題,學(xué)生需要應(yīng)用數(shù)學(xué)思維、數(shù)學(xué)邏輯及相關(guān)知識(shí)對(duì)實(shí)際問(wèn)題進(jìn)行研究并經(jīng)過(guò)計(jì)算,進(jìn)而解決這些問(wèn)題,得出反映實(shí)際問(wèn)題的最佳數(shù)學(xué)模型及模型最優(yōu)解。因此,在數(shù)學(xué)學(xué)習(xí)中融入數(shù)學(xué)大模型思想,鼓勵(lì)學(xué)生參與數(shù)學(xué)大模型的理論與實(shí)踐相結(jié)合,不但可以使學(xué)生學(xué)以致用,做到理論聯(lián)系實(shí)際,而且還會(huì)使他們感受到數(shù)學(xué)的生機(jī)與活力,激發(fā)求知的興趣和探索的欲望,數(shù)學(xué)修養(yǎng)自然而然得以培養(yǎng)及提高。

02 會(huì)解數(shù)學(xué)題的GPT如何誕生?

「 ChatGPT 」橫空出世,意味著人工智能迎來(lái)前所未有的技術(shù)革命,但研發(fā)大模型產(chǎn)品并非易事,又有多少企業(yè)具備數(shù)據(jù)、算力、人力、財(cái)力的條件和優(yōu)勢(shì)?大模型產(chǎn)品能否贏得市場(chǎng),不僅要擁有豐富的行業(yè)知識(shí)和數(shù)據(jù),而且最關(guān)鍵的還要靠全面的開(kāi)源技術(shù)體系作支撐;所以,有人說(shuō)「 大模型 」是屬于「 大公司 」的「 盛宴 」。

對(duì)于國(guó)內(nèi)掀起的「 大模型 」產(chǎn)業(yè)風(fēng)暴,復(fù)旦大學(xué)教授、上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室主任肖仰華指出,大模型的誕生宣告了整個(gè)人工智能進(jìn)入全新的重工業(yè)時(shí)代,人類歷史上技術(shù)革命歷經(jīng)數(shù)次突破和發(fā)展,已經(jīng)從相對(duì)低級(jí)的「 手工作坊 」模式最終形成了成熟的重工業(yè)發(fā)展模式,而今天的大模型產(chǎn)業(yè)發(fā)展有三個(gè)鮮明的特征:大模型、大算力和大數(shù)據(jù)。

據(jù)了解,當(dāng)前我國(guó)大模型產(chǎn)業(yè)發(fā)展在數(shù)據(jù)方面是有優(yōu)勢(shì)的,在算力方面是有所缺乏的,是短期之內(nèi)難以跟上或者超越的。有專家認(rèn)為,隨著大模型參數(shù)量的持續(xù)增長(zhǎng),大模型對(duì)于算力的需求越來(lái)越迫切。算力已經(jīng)成為大模型玩家的準(zhǔn)入門(mén)檻,已經(jīng)成為制約大模型發(fā)展的主要瓶頸,這是需要付出巨大代價(jià)進(jìn)行摸索的。

大模型產(chǎn)業(yè)的發(fā)展與競(jìng)爭(zhēng),歸根結(jié)底是算力的競(jìng)爭(zhēng),絕大多數(shù)大模型玩家都缺乏算力,靠買算力支撐大模型產(chǎn)品的研發(fā)。而如今,從某種程度上來(lái)看,學(xué)而思已經(jīng)完全實(shí)現(xiàn)了算力自主自控,為學(xué)而思啟動(dòng)大模型 MathGPT 的研發(fā),提供開(kāi)源算法體系的支持。

學(xué)而思數(shù)學(xué)大模型 MathGPT 究竟會(huì)對(duì)全球數(shù)學(xué)愛(ài)好者和科研機(jī)構(gòu)帶來(lái)怎樣的影響?有報(bào)道稱,數(shù)學(xué)大模型 MathGPT,可以用來(lái)預(yù)測(cè)、分類、聚類、優(yōu)化等各種具有挑戰(zhàn)性的各種任務(wù),可以運(yùn)用深度學(xué)習(xí)算法來(lái)解決數(shù)學(xué)領(lǐng)域中各種復(fù)雜的問(wèn)題,提高數(shù)學(xué)學(xué)習(xí)的高效性和準(zhǔn)確性。當(dāng)今數(shù)學(xué)在各個(gè)領(lǐng)域蓬勃發(fā)展,應(yīng)用廣泛。學(xué)而思的數(shù)學(xué)大模型 MathGPT 在人工智能新的發(fā)展階段,或許會(huì)承擔(dān)更大的使命。

03 大模型產(chǎn)業(yè)所引發(fā)的人工智能變革,才剛剛開(kāi)始

大模型產(chǎn)業(yè)研究與發(fā)展,對(duì)社會(huì)各行業(yè)的發(fā)展產(chǎn)生了重大的影響,大模型的 AI 技術(shù)廣泛地鏈接到眾行業(yè)(教育、辦公、汽車、數(shù)字員工等),下沉到更多的應(yīng)用場(chǎng)景,眾行業(yè)因此迎來(lái)了全新的變革。有業(yè)界人士認(rèn)為,國(guó)內(nèi)大模型的發(fā)展,盡管呈現(xiàn)一片「 熱鬧 」景象,但也存在令人擔(dān)憂的地方。國(guó)內(nèi)人工智能產(chǎn)業(yè)的企業(yè)與研發(fā)機(jī)構(gòu)要清醒地認(rèn)識(shí)到,大模型應(yīng)用模式也仍然面臨著若干問(wèn)題,比如仍存在技術(shù)路線同質(zhì)化嚴(yán)重、數(shù)據(jù)生態(tài)不完善、算力掣肘、模型創(chuàng)新有限等問(wèn)題。仍需要企業(yè)與研發(fā)機(jī)構(gòu)從數(shù)據(jù)共享、算力協(xié)作、開(kāi)源生態(tài)、人才培養(yǎng)、評(píng)測(cè)體系、成本控制、應(yīng)用探索與技術(shù)研究等各方面推動(dòng)大模型發(fā)展。

據(jù)了解,在數(shù)學(xué)領(lǐng)域,目前市場(chǎng)上存在幾個(gè)主要流派。比如 Google 收購(gòu)的 Photomath、微軟數(shù)學(xué)、Mathway、專注數(shù)學(xué)計(jì)算的 WolframAlpha 等產(chǎn)品,主要利用通用 LLM (大型語(yǔ)言模型)的 AI 技術(shù)加上數(shù)據(jù)庫(kù)的方式解決數(shù)學(xué)問(wèn)題。盡管也產(chǎn)生了很大的變化,但本質(zhì)上只是模型接受了更多數(shù)據(jù)的訓(xùn)練 —— GPT-4 仍然不能保證計(jì)算結(jié)果的準(zhǔn)確或給出清晰易懂的推理過(guò)程。

也就是說(shuō),盡管在數(shù)學(xué)領(lǐng)域存在著幾大大模型流派,但在實(shí)際應(yīng)用場(chǎng)景中需要的復(fù)雜的決策能力、研判能力、綜合任務(wù)的拆解能力、不確定場(chǎng)景的邏輯推理能力仍十分的欠缺;所以從強(qiáng)大的語(yǔ)言處理能力到復(fù)雜的邏輯推理能力仍需要漫長(zhǎng)的摸索的時(shí)間。

在大型語(yǔ)言模型不斷進(jìn)化的浪潮下,不同的技術(shù)路線選擇孰優(yōu)孰劣,仍有待討論和驗(yàn)證。學(xué)而思獨(dú)立自研的 MathGPT 大模型是否成立,是否能夠超越通用模型在數(shù)學(xué)任務(wù)上的表現(xiàn),是否更匹配不同人群的數(shù)學(xué)學(xué)習(xí)場(chǎng)景,這個(gè)問(wèn)題還需要在創(chuàng)新實(shí)踐中尋找答案。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請(qǐng)聯(lián)系原著作權(quán)人。