正在閱讀:

大模型“閉源”

掃一掃下載界面新聞APP

大模型“閉源”

首先要解決數(shù)據(jù)質(zhì)量的問題,其次才是時間。

文|科技新知

大模型的開、閉源之戰(zhàn),開始得比想象中早上一些。

7月18日,F(xiàn)acebook母公司Meta表示,將發(fā)布其開源大模型Llama的商用版本,為初創(chuàng)企業(yè)和其他企業(yè)提供了一個強大的免費選擇,以取代OpenAI和谷歌出售的昂貴的專有模型。同時宣布,Llama將由微軟通過其Azure云服務分發(fā),并將在Windows操作系統(tǒng)上運行,并稱微軟是“我們的首選合作伙伴”。

一時間,有不少分析人士認為,Llama將改變AIGC的產(chǎn)業(yè)格局。Meta 副總裁、人工智能部門負責人楊立昆也趕來站臺,“Llama 2 將改變大語言模型市場的格局?!笔聦嵳娴娜绱藳]有懸念嗎?

開源(Open Source),即開放源代碼,最早起源于20世紀50、60年代的美國。早期開發(fā)互聯(lián)網(wǎng)技術和電信網(wǎng)絡協(xié)議時,研究人員需要進行開放式的協(xié)作環(huán)境。而1968年Internet的先驅(qū)阿帕網(wǎng)(ARPANET)的建立,成為了對開放源代碼可行性展示的標志。到了1985年,自由軟件運動領袖理查德·斯托曼(Richard Stallman),看到以專利軟件為手段的商業(yè)化逐漸取代實驗室中免費可自由流通的軟件后,發(fā)表了著名的GNU宣言,開啟了開源運動,最終導致了免費的Linux操作系統(tǒng)的誕生。

自ChatGPT爆火以來,將其開源的呼聲未曾斷絕??删驮贑hatGPT2發(fā)布之后,OpenAI選擇了閉源發(fā)展。這也未必完全出于規(guī)避競爭的考量,就算某天OpenAI真的完全open了,其他同行也不能簡單復制其成功的路徑。

因為ChatGPT能夠引發(fā)“iPhone時刻”的原因在于,強大的生成能力給予了人們不一樣的場景體驗。但這背后依賴OpenAI很長一段時間內(nèi)在算力、算法和數(shù)據(jù)方面的積累。實際上,在這場全球大模型軍備賽中,有關開源發(fā)展和閉源深耕的爭論將繼續(xù)下去不止不休。

開源or閉源

歷史的車輪總會重復碾過,在互聯(lián)網(wǎng)發(fā)展史上,有關開源和閉源的戰(zhàn)爭一直都在上演。

除了上文理查德·斯托曼的GNU宣言,打響對閉源的第一槍外,隨后的PC時代有關開閉源的爭論也沒停過。

PC剛興起之時,微軟內(nèi)部的研發(fā)團隊通過閉源開發(fā)Windows操作系統(tǒng),并開發(fā)配套的應用軟件如Office等,并在生態(tài)建設方面組局Inter形成 Wintel 聯(lián)盟,成功搶占了PC市場。而Linux在那個時期,則屬于自發(fā)的“民間組織”,由全球開發(fā)者共同參與建設,通過開源與微軟形成了一定的競爭。

到了移動互聯(lián)網(wǎng)時代,谷歌的Android和蘋果的iOS開閉源之爭,也是各自走出了不同的路徑?;贏ndroid的開放,誕生了一大批的定制化手機操作系統(tǒng),比如國內(nèi)小米的MIUI、OPPO的ColorOS等,就連車機端的比亞迪車機系統(tǒng)都是基于Android開發(fā)而來。當然,就商業(yè)成功的角度來看,微軟和蘋果的陣地一定時期內(nèi)更加牢靠。

在SaaS的發(fā)展史上,軟件的開源也與上同理。中科院院士、CCF開源發(fā)展委員會主任王懷民教授關于開閉源認為,在一個確定發(fā)展方向的時代中,閉源公司的推進效果是明顯的,競爭力也是極強的?!暗斠粋€不確定性的互聯(lián)網(wǎng)時代到來時,開源吸引了全球開發(fā)者參與其中的可能,使得后來的服務器操作系統(tǒng)、云操作系統(tǒng)、手機操作系統(tǒng)、物聯(lián)網(wǎng)操作系統(tǒng)都是以開源的Linux為基礎?!?/p>

國外有ChatGPT與Llama之爭,國內(nèi)的大模型廠商也各有千秋。

如阿里云、智譜和清華EKG、百川智能等,選擇了開源。阿里云公布1+4開源戰(zhàn)略,推出大模型方向的開源新勢力魔搭GPT。阿里巴巴達摩院高級算法工程師李晨亮,曾對外表示,“開源生態(tài)肯定是有助于大模型的繁榮。”反之,華為的盤古大模型就選擇了閉源,也是為了其數(shù)據(jù)隱私和商業(yè)收益的考慮。

價優(yōu)者勝?

大模型開源之后,會吸引更多的人才參與進入,加快技術進步,但想要實現(xiàn)突破,還需要從底層理解模型框架和算法基本原理。眾所周知,人工智能三要素是:算力、算法和數(shù)據(jù)。開源只是處于算法階段,之后還需要對其進行大量的算力支持和數(shù)據(jù)訓練,這背后的成本就相當高昂。

以OpenAI為例:業(yè)內(nèi)人士表示,大模型訓練和運行將耗費巨大的算力資源和數(shù)據(jù),僅是在 2022 年,OpenAI 總計花費就達到了 5.4 億美元,與之形成鮮明對比的,則是其產(chǎn)生的收入只有 2800 萬美元。

有行業(yè)消息透露,一家上市公司的人工智能部門打算用OpenAI的GPT-3.5開發(fā)功能,但迫于成本和定制開發(fā)以及不支持同一時間響應大量用戶請求的原因,選擇了參數(shù)量更小的Llama和一個國內(nèi)公司的開源大模型,在后期的訓練和部署的成本也會更低。

“開源模式的任何漸進式改進都在蠶食閉源模式的市場份額,因為你可以以更低的成本運行它們,而且依賴性更小?!?軟件開發(fā)平臺Replit的首席執(zhí)行官Amjad Masad表示。

開源也能讓其他新加入者更快適應AI產(chǎn)業(yè)。比如在谷歌泄漏的文件中就提到:幾乎任何人都能按照自己的想法實現(xiàn)模型微調(diào),到時候一天之內(nèi)的訓練周期將成為常態(tài)。以這樣的速度,微調(diào)的累積效應將很快幫助小模型克服體量上的劣勢。

更多的人進來使用,就會產(chǎn)生更多的數(shù)據(jù)。這些互聯(lián)網(wǎng)原生內(nèi)容的常態(tài)化訓練,遠比一家公司僅憑一己之力去做數(shù)據(jù)的采集和標注要簡單得多。

共享出Llama的Meta 表示,收集的數(shù)據(jù)代表著根據(jù)經(jīng)驗采樣的人類偏好,由人類標注員選擇自己更喜歡兩條模型輸出中的哪一條。人類給出的反饋意見隨后將用于訓練獎勵模型,該模型會不斷學習人類標注員的偏好模式,再據(jù)此自動執(zhí)行偏好決策。

開源的好處顯而易見,閉源的道理也邏輯扎實。

元創(chuàng)資本的研究顯示,相較于開源來說,閉源模型相對成熟、數(shù)據(jù)質(zhì)量更有保障,同時也省去了部署的麻煩,費用相對較低,僅需支付token的費用。

當然最重要的是,對于廠商來說, 閉源還有著商業(yè)的考量。根據(jù)權(quán)威雜志《Fast Company》預測,OpenAI 2023年的收入將達到2億美元,包括提供API數(shù)據(jù)接口服務、聊天機器人訂閱服務費等。

對壘剛開始

上個月,獵豹移動CEO傅盛與投資人朱嘯虎的口水戰(zhàn)引發(fā)熱議。核心沖突就在于行業(yè)對于大模型的價值思考,在于大模型能不能解決問題。

如今,以OpenAI為代表的大公司、強算力、強算法,共同砌成了一道普通創(chuàng)業(yè)者和開發(fā)人員難以突破的圍墻,以至于當市場上出現(xiàn)其他類似開源的應用時,人們都認為是大模型行業(yè)的壟斷要被打破了。

實際上,自OpenAI推出ChatGPT引發(fā)全球跟風以來,英偉達的股價便迎來了暴漲,主要源于廠商對算力芯片的強烈需求。換句話說,即使開源了人人都有大模型,那算力、算法和數(shù)據(jù)訓練的工作還是需要有人來做。并且開源也僅僅相當于開放了設計圖紙,你可以在圖紙上進行調(diào)優(yōu),但并不代表就能完整造出一幢建筑。

就比如一些大模型產(chǎn)品剛上線時,經(jīng)常出現(xiàn)語義理解不準確,產(chǎn)出結(jié)果令人啼笑皆非的現(xiàn)象。背后原因就是對高質(zhì)量數(shù)據(jù)的篩選和訓練得過少,導致數(shù)據(jù)的準確性直接影響人工智能的產(chǎn)出結(jié)果。

但訓練數(shù)據(jù)并不是一時的,涉及到數(shù)據(jù)的采集、清洗、標注的另一條產(chǎn)業(yè)鏈。在過去的很長一段時間內(nèi),這個環(huán)節(jié)都是由專門的數(shù)據(jù)處理公司來做,也就是說,需要進行長期的人力投入。

有業(yè)內(nèi)的數(shù)據(jù)優(yōu)化工程師表達了類似看法,大模型本身的泛化能力仍受限于數(shù)據(jù)。如果說ChatGPT要替代某個職業(yè)或崗位的話,最簡單的一個判定標準即是,是否具備數(shù)量足夠多、質(zhì)量非常好的數(shù)據(jù)。同理,想要通過開源去打破壟斷的模型,還需要對數(shù)據(jù)進行足夠的優(yōu)化,對基礎設施的投入足夠得多。

大模型的開閉源之爭,終究不會是靠某一個或幾個產(chǎn)品的出現(xiàn)而終結(jié),更多的還要頂尖人才參與、技術迭代和資金支持。想要打破壟斷,還需要考慮時間的因素以及對高質(zhì)量數(shù)據(jù)的篩選。

開或閉,從來不是最根本的問題,產(chǎn)品體驗與市場需求的匹配,才是起決定作用的勝負手。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

大模型“閉源”

首先要解決數(shù)據(jù)質(zhì)量的問題,其次才是時間。

文|科技新知

大模型的開、閉源之戰(zhàn),開始得比想象中早上一些。

7月18日,F(xiàn)acebook母公司Meta表示,將發(fā)布其開源大模型Llama的商用版本,為初創(chuàng)企業(yè)和其他企業(yè)提供了一個強大的免費選擇,以取代OpenAI和谷歌出售的昂貴的專有模型。同時宣布,Llama將由微軟通過其Azure云服務分發(fā),并將在Windows操作系統(tǒng)上運行,并稱微軟是“我們的首選合作伙伴”。

一時間,有不少分析人士認為,Llama將改變AIGC的產(chǎn)業(yè)格局。Meta 副總裁、人工智能部門負責人楊立昆也趕來站臺,“Llama 2 將改變大語言模型市場的格局?!笔聦嵳娴娜绱藳]有懸念嗎?

開源(Open Source),即開放源代碼,最早起源于20世紀50、60年代的美國。早期開發(fā)互聯(lián)網(wǎng)技術和電信網(wǎng)絡協(xié)議時,研究人員需要進行開放式的協(xié)作環(huán)境。而1968年Internet的先驅(qū)阿帕網(wǎng)(ARPANET)的建立,成為了對開放源代碼可行性展示的標志。到了1985年,自由軟件運動領袖理查德·斯托曼(Richard Stallman),看到以專利軟件為手段的商業(yè)化逐漸取代實驗室中免費可自由流通的軟件后,發(fā)表了著名的GNU宣言,開啟了開源運動,最終導致了免費的Linux操作系統(tǒng)的誕生。

自ChatGPT爆火以來,將其開源的呼聲未曾斷絕。可就在ChatGPT2發(fā)布之后,OpenAI選擇了閉源發(fā)展。這也未必完全出于規(guī)避競爭的考量,就算某天OpenAI真的完全open了,其他同行也不能簡單復制其成功的路徑。

因為ChatGPT能夠引發(fā)“iPhone時刻”的原因在于,強大的生成能力給予了人們不一樣的場景體驗。但這背后依賴OpenAI很長一段時間內(nèi)在算力、算法和數(shù)據(jù)方面的積累。實際上,在這場全球大模型軍備賽中,有關開源發(fā)展和閉源深耕的爭論將繼續(xù)下去不止不休。

開源or閉源

歷史的車輪總會重復碾過,在互聯(lián)網(wǎng)發(fā)展史上,有關開源和閉源的戰(zhàn)爭一直都在上演。

除了上文理查德·斯托曼的GNU宣言,打響對閉源的第一槍外,隨后的PC時代有關開閉源的爭論也沒停過。

PC剛興起之時,微軟內(nèi)部的研發(fā)團隊通過閉源開發(fā)Windows操作系統(tǒng),并開發(fā)配套的應用軟件如Office等,并在生態(tài)建設方面組局Inter形成 Wintel 聯(lián)盟,成功搶占了PC市場。而Linux在那個時期,則屬于自發(fā)的“民間組織”,由全球開發(fā)者共同參與建設,通過開源與微軟形成了一定的競爭。

到了移動互聯(lián)網(wǎng)時代,谷歌的Android和蘋果的iOS開閉源之爭,也是各自走出了不同的路徑?;贏ndroid的開放,誕生了一大批的定制化手機操作系統(tǒng),比如國內(nèi)小米的MIUI、OPPO的ColorOS等,就連車機端的比亞迪車機系統(tǒng)都是基于Android開發(fā)而來。當然,就商業(yè)成功的角度來看,微軟和蘋果的陣地一定時期內(nèi)更加牢靠。

在SaaS的發(fā)展史上,軟件的開源也與上同理。中科院院士、CCF開源發(fā)展委員會主任王懷民教授關于開閉源認為,在一個確定發(fā)展方向的時代中,閉源公司的推進效果是明顯的,競爭力也是極強的?!暗斠粋€不確定性的互聯(lián)網(wǎng)時代到來時,開源吸引了全球開發(fā)者參與其中的可能,使得后來的服務器操作系統(tǒng)、云操作系統(tǒng)、手機操作系統(tǒng)、物聯(lián)網(wǎng)操作系統(tǒng)都是以開源的Linux為基礎?!?/p>

國外有ChatGPT與Llama之爭,國內(nèi)的大模型廠商也各有千秋。

如阿里云、智譜和清華EKG、百川智能等,選擇了開源。阿里云公布1+4開源戰(zhàn)略,推出大模型方向的開源新勢力魔搭GPT。阿里巴巴達摩院高級算法工程師李晨亮,曾對外表示,“開源生態(tài)肯定是有助于大模型的繁榮?!狈粗?,華為的盤古大模型就選擇了閉源,也是為了其數(shù)據(jù)隱私和商業(yè)收益的考慮。

價優(yōu)者勝?

大模型開源之后,會吸引更多的人才參與進入,加快技術進步,但想要實現(xiàn)突破,還需要從底層理解模型框架和算法基本原理。眾所周知,人工智能三要素是:算力、算法和數(shù)據(jù)。開源只是處于算法階段,之后還需要對其進行大量的算力支持和數(shù)據(jù)訓練,這背后的成本就相當高昂。

以OpenAI為例:業(yè)內(nèi)人士表示,大模型訓練和運行將耗費巨大的算力資源和數(shù)據(jù),僅是在 2022 年,OpenAI 總計花費就達到了 5.4 億美元,與之形成鮮明對比的,則是其產(chǎn)生的收入只有 2800 萬美元。

有行業(yè)消息透露,一家上市公司的人工智能部門打算用OpenAI的GPT-3.5開發(fā)功能,但迫于成本和定制開發(fā)以及不支持同一時間響應大量用戶請求的原因,選擇了參數(shù)量更小的Llama和一個國內(nèi)公司的開源大模型,在后期的訓練和部署的成本也會更低。

“開源模式的任何漸進式改進都在蠶食閉源模式的市場份額,因為你可以以更低的成本運行它們,而且依賴性更小。” 軟件開發(fā)平臺Replit的首席執(zhí)行官Amjad Masad表示。

開源也能讓其他新加入者更快適應AI產(chǎn)業(yè)。比如在谷歌泄漏的文件中就提到:幾乎任何人都能按照自己的想法實現(xiàn)模型微調(diào),到時候一天之內(nèi)的訓練周期將成為常態(tài)。以這樣的速度,微調(diào)的累積效應將很快幫助小模型克服體量上的劣勢。

更多的人進來使用,就會產(chǎn)生更多的數(shù)據(jù)。這些互聯(lián)網(wǎng)原生內(nèi)容的常態(tài)化訓練,遠比一家公司僅憑一己之力去做數(shù)據(jù)的采集和標注要簡單得多。

共享出Llama的Meta 表示,收集的數(shù)據(jù)代表著根據(jù)經(jīng)驗采樣的人類偏好,由人類標注員選擇自己更喜歡兩條模型輸出中的哪一條。人類給出的反饋意見隨后將用于訓練獎勵模型,該模型會不斷學習人類標注員的偏好模式,再據(jù)此自動執(zhí)行偏好決策。

開源的好處顯而易見,閉源的道理也邏輯扎實。

元創(chuàng)資本的研究顯示,相較于開源來說,閉源模型相對成熟、數(shù)據(jù)質(zhì)量更有保障,同時也省去了部署的麻煩,費用相對較低,僅需支付token的費用。

當然最重要的是,對于廠商來說, 閉源還有著商業(yè)的考量。根據(jù)權(quán)威雜志《Fast Company》預測,OpenAI 2023年的收入將達到2億美元,包括提供API數(shù)據(jù)接口服務、聊天機器人訂閱服務費等。

對壘剛開始

上個月,獵豹移動CEO傅盛與投資人朱嘯虎的口水戰(zhàn)引發(fā)熱議。核心沖突就在于行業(yè)對于大模型的價值思考,在于大模型能不能解決問題。

如今,以OpenAI為代表的大公司、強算力、強算法,共同砌成了一道普通創(chuàng)業(yè)者和開發(fā)人員難以突破的圍墻,以至于當市場上出現(xiàn)其他類似開源的應用時,人們都認為是大模型行業(yè)的壟斷要被打破了。

實際上,自OpenAI推出ChatGPT引發(fā)全球跟風以來,英偉達的股價便迎來了暴漲,主要源于廠商對算力芯片的強烈需求。換句話說,即使開源了人人都有大模型,那算力、算法和數(shù)據(jù)訓練的工作還是需要有人來做。并且開源也僅僅相當于開放了設計圖紙,你可以在圖紙上進行調(diào)優(yōu),但并不代表就能完整造出一幢建筑。

就比如一些大模型產(chǎn)品剛上線時,經(jīng)常出現(xiàn)語義理解不準確,產(chǎn)出結(jié)果令人啼笑皆非的現(xiàn)象。背后原因就是對高質(zhì)量數(shù)據(jù)的篩選和訓練得過少,導致數(shù)據(jù)的準確性直接影響人工智能的產(chǎn)出結(jié)果。

但訓練數(shù)據(jù)并不是一時的,涉及到數(shù)據(jù)的采集、清洗、標注的另一條產(chǎn)業(yè)鏈。在過去的很長一段時間內(nèi),這個環(huán)節(jié)都是由專門的數(shù)據(jù)處理公司來做,也就是說,需要進行長期的人力投入。

有業(yè)內(nèi)的數(shù)據(jù)優(yōu)化工程師表達了類似看法,大模型本身的泛化能力仍受限于數(shù)據(jù)。如果說ChatGPT要替代某個職業(yè)或崗位的話,最簡單的一個判定標準即是,是否具備數(shù)量足夠多、質(zhì)量非常好的數(shù)據(jù)。同理,想要通過開源去打破壟斷的模型,還需要對數(shù)據(jù)進行足夠的優(yōu)化,對基礎設施的投入足夠得多。

大模型的開閉源之爭,終究不會是靠某一個或幾個產(chǎn)品的出現(xiàn)而終結(jié),更多的還要頂尖人才參與、技術迭代和資金支持。想要打破壟斷,還需要考慮時間的因素以及對高質(zhì)量數(shù)據(jù)的篩選。

開或閉,從來不是最根本的問題,產(chǎn)品體驗與市場需求的匹配,才是起決定作用的勝負手。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。