正在閱讀:

4萬字告訴你ChatGPT到底是什么?(下)

掃一掃下載界面新聞APP

4萬字告訴你ChatGPT到底是什么?(下)

人工智能系統(tǒng)開發(fā)是一個系統(tǒng)工程,需要協(xié)同各個方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點。

文 | 星船知造 錢鴻生

編輯 | 唐曉園

上周我們發(fā)布了報告上篇 《4萬字告訴你ChatGPT到底是什么(上)》,今天的下篇我們將繼續(xù)節(jié)選報告第三章中的“我國人工智能發(fā)展中存在的主要問題”、第四章《ChatGPT對資本市場影響的分析與研判》和第五章《我國未來人工智能發(fā)展的展望》中部分核心內(nèi)容和觀點。

OpenAI推出ChatGPT后不久,微軟宣布將ChatGPT與搜索引擎Bing整合,谷歌宣布推出Bard應(yīng)對挑戰(zhàn),接著Meta官網(wǎng)公布了一款新的人工智能大型語言模型LLaMA。

此時,人們自然而然把目光轉(zhuǎn)向了中國相關(guān)企業(yè),他們何時宣布推出類似于ChatGPT人工智能發(fā)展的時間表。

人們特別關(guān)注的企業(yè)有百度、阿里巴巴以及人工智能企業(yè)科大訊飛等等一大批中國與人工智能有關(guān)聯(lián)企業(yè)的動向。

3.4.3 我國人工智能發(fā)展中存在的主要問題

我國發(fā)展人工智能面臨三方面技術(shù)難點如下:

第一,人工智能的AI算法

人工智能常見的算法技術(shù)的基礎(chǔ)性研究主要集中于國內(nèi)各大高校團隊,但在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展比較緩慢,較難實現(xiàn)從理論和技術(shù)向生產(chǎn)力的轉(zhuǎn)化。

目前以華為、阿里、騰訊等公司主導(dǎo)的人工智能技術(shù)研發(fā)團隊迅速崛起,將科研產(chǎn)品開發(fā)與算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)人工智能算法的技術(shù)成果轉(zhuǎn)化。

但是在算法的基礎(chǔ)理論研究層面,一直以來是我們發(fā)展人工智能技術(shù)的短板。沒有對大規(guī)模機器學(xué)習(xí)場景中強化學(xué)習(xí)算法模型、生成性預(yù)訓(xùn)練變換模型、分布式并行的研發(fā)投入,或者說由于受到資金投入與人才缺乏的影響,研究成果與世界發(fā)達企業(yè)還有很大的差距。

美國現(xiàn)有的人工智能系統(tǒng)的關(guān)鍵技術(shù)都是不開源的,系統(tǒng)深度學(xué)習(xí)框架、數(shù)據(jù)庫和工具集,均限內(nèi)部使用,部分僅對系統(tǒng)的應(yīng)用接口持開源的態(tài)度,使我們無法在短時間內(nèi)掌握世界最先進的人工智能系統(tǒng)的開發(fā)經(jīng)驗。

從市場的角度來看,我國目前的人工智能系統(tǒng)都是一些比較初級的數(shù)據(jù)采集與分析應(yīng)用系統(tǒng),類似于ChatGPT高度智能化的AI產(chǎn)品的研發(fā)還處于摸索與初級階段,在性能和穩(wěn)定性方面改善空間潛力巨大。

早在20世紀80年代,我國學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,中國多家高校有從事算法模型的研究,但大多都將算法模型應(yīng)用在人臉識別系統(tǒng),提高圖像識別精度方面。到目前為止算法模型在AI領(lǐng)域的價值還沒有被真正體現(xiàn),這可能受限于我們的芯片制造水平難以提供支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)訓(xùn)練需要的算力。

科研領(lǐng)域需要更大投入,要針對目前的已有算法進行深度優(yōu)化,或者另辟蹊徑,提出更為先進的算法理論。要打造出符合世界產(chǎn)業(yè)發(fā)展最新技術(shù)水平,具有全球市場競爭力的人工智能產(chǎn)品,看來有相當(dāng)長的一段路要走。但也不排除彎道超車或換道超車奇跡的發(fā)生。

我國AI發(fā)展現(xiàn)狀任重而道遠。

第二,人工智能AI模型軟件

國內(nèi)的人工智能模型軟件開發(fā)已經(jīng)起步,開始對標世界先進的人工智能模型,培育自己的發(fā)展環(huán)境。人工智能模型是人工智能生態(tài)中最重要的因素之一,我國需要促進國產(chǎn)模型軟件的發(fā)展和推廣,擺脫國外的標準制約。ChatGPT就是基于“生成型預(yù)訓(xùn)練變換模型”開發(fā)出來的自然語言聊天機器人。

第三,人工智能開發(fā)環(huán)境

人工智能開發(fā)環(huán)境是指相關(guān)算法、數(shù)據(jù)庫、軟件開發(fā)工具、高性能的人工智能AI計算機芯片、云計算網(wǎng)絡(luò)的集合。國產(chǎn)AI模型開發(fā)需要和國產(chǎn)AI智能芯片及硬件進行相互適配、性能優(yōu)化和應(yīng)用推廣,才能夠形成面向行業(yè)應(yīng)用的軟硬件一體化人工智能平臺。

國際人工智能巨頭掌控著人工智能開發(fā)環(huán)境的關(guān)鍵技術(shù),我們目前還較難在短時間內(nèi)在AI芯片、算法、模型軟件、云數(shù)據(jù)庫服務(wù)等人工智能開發(fā)環(huán)境上有十分大的突破。

人工智能系統(tǒng)開發(fā)是一個系統(tǒng)工程,需要協(xié)同各個方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點。

3.4.4 AI芯片,人工智能繞不過去的坎

人工智能AI芯片是技術(shù)發(fā)展的關(guān)鍵之一,它是提供人工智能算力的靈魂和大腦,承載了為各種終端提供強大算力的重要任務(wù)。人工智能AI 芯片的出現(xiàn),極大提高數(shù)據(jù)處理的能力,尤其在處理海量數(shù)據(jù)時明顯優(yōu)于傳統(tǒng)CPU。

從技術(shù)架構(gòu)來看,AI芯片一般可以分為GPU、FPGA、ASIC和類腦芯片四大類——

GPU(Graphics Processing Unit,圖形處理器)

GPU是利用處理圖形任務(wù)的圖形處理器來計算原本由中央處理器CPU的通用計算任務(wù)。

GPU的關(guān)鍵性能是矩形并行計算,主流的GPU具有強大的計算能力,無論性能還是內(nèi)存帶寬均遠大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化組成,而 GPU 則擁有一個由數(shù)以千計的更小、更高效的核心(專為同時處理多重任務(wù)而設(shè)計)組成的大規(guī)模并行計算架構(gòu)。同時CPU相當(dāng)一部分時間在執(zhí)行外設(shè)的中斷、進程的切換等任務(wù),而GPU有更多的時間用于并行計算。

英偉達是AI芯片GPU(圖形處理器單元)的主要生產(chǎn)廠商,無論是OpenAI的ChatGPT、還是微軟的搜索引擎Bing、谷歌的人工智能系統(tǒng)LaMDA,都離不開英偉達提供的底層芯片GPU的算力支持,英偉達系列的A100和H100系列占全球AI芯片市場的80%以上的份額。

除了英偉達,還有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA現(xiàn)場可編程門陣列

FPGA(Field Programmable Gate Array)現(xiàn)場可編程門陣列,或稱半定制化芯片。它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物,可以根據(jù)算法需求,動態(tài)重構(gòu)計算架構(gòu)。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

全球知名的FPGA生產(chǎn)廠商有:Altera,Xilinx,Actel,Lattice,Atmel,我國廠商代表有深鑒科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC專用集成電路是針對特定用戶要求定制設(shè)計、制造的專門的應(yīng)用程序芯片。ASIC芯片廣泛應(yīng)用于人工智能設(shè)備、虛擬貨幣挖礦設(shè)備、耗材打印設(shè)備、軍事國防設(shè)備等智慧終端。

ASIC芯片還可以細分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片。ASIC芯片擁有面積小、集成度高等優(yōu)勢,被廣泛應(yīng)用于人工智能終端和網(wǎng)絡(luò)系統(tǒng)中。

類腦計算芯片(Brain-Inspired Chip)

類腦計算芯片是人工智能AI的一個重要組成部分,類腦芯片可模擬人類大腦信息處理方式,能以極低的功耗對信息進行并行和分布式處理,類腦計算芯片就是把微電子技術(shù)和新型神經(jīng)形態(tài)器件結(jié)合,突破傳統(tǒng)計算架構(gòu),實現(xiàn)存儲與計算的深度融合,大幅提升計算性能、提高集成度、降低能耗。對于現(xiàn)有的計算體系與系統(tǒng)做出變革,并實現(xiàn)在計算能耗、計算能力與計算效率等方面的大幅改進。

IBM已經(jīng)開始進行類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。

中國目前有清華大學(xué)的天機芯,浙江大學(xué)的Darwin2 (55nm)等一批研制類腦計算芯片機構(gòu)和企業(yè)。

ChatGPT對資本市場影響的研判

4.2 ChatGPT背后的技術(shù)壁壘和文化控制權(quán)

ChatGPT是一種自然語言處理技術(shù),一旦ChatGPT能從目前的實驗階段走向應(yīng)用成熟階段,將這標志著在人類活動中,人工智能將開始扮演重要角色并占據(jù)優(yōu)勢地位。

我們知道,在自然語言處理大模型技術(shù)上,由于受到各種因素的影響,我國的人工智能相比國外發(fā)展有一定的差距。

但在局部技術(shù)領(lǐng)域,我們還是具有很大優(yōu)勢的,比如在優(yōu)化大模型中的數(shù)據(jù)庫,在某些特定領(lǐng)域進行模型優(yōu)化和云數(shù)據(jù)庫建設(shè),以及在一些與自然語言處理關(guān)系密切的學(xué)科。在國家宏觀政策的指導(dǎo)下,發(fā)揮社會市場經(jīng)濟體制的優(yōu)勢,能集中力量辦大事的原則,完全可以進行基于大模型處理方法模型的應(yīng)用性研究,以適應(yīng)人工智能發(fā)展對拉動國家經(jīng)濟上行,滿足人們追求豐富多彩生活娛樂的需求。

4.3 ChatGPT可能引發(fā)的機遇與風(fēng)險

我們對ChatGPT要時刻保持清醒的認知,每一次技術(shù)迭代,都將改變?nèi)祟惿畹膬?nèi)涵和方式。ChatGPT是否屬于一次新的技術(shù)迭代這個問題還有進一步觀察,可是以ChatGPT為代表的人工智能技術(shù)的發(fā)展和自然語言處理技術(shù)的突破,一定會對現(xiàn)有產(chǎn)業(yè)發(fā)展格局帶來前所未有的重要影響。

從正面影響來看,ChatGPT可以幫助人們快速獲取信息和提高工作效率,擴展知識面,提供發(fā)展AI 產(chǎn)業(yè)新的思路和方法。 另一方面,某些低端和重復(fù)的工作可能被ChatGPT和 AI代替,導(dǎo)致勞動力市場的階段性動蕩和變化。

如果人們過度依賴AI,可能會降低人們一部分的操作技能水平和創(chuàng)新精神。某些行業(yè)可能會發(fā)生重組甚至消失,有可能在變化過程中引發(fā)社會矛盾等。

顛覆性創(chuàng)新理論的提出者克里斯滕森在《創(chuàng)新者的窘境》這本書中,將創(chuàng)新分為了延續(xù)性創(chuàng)新和破壞性創(chuàng)新兩種:破壞性創(chuàng)新難以評估市場規(guī)模增長的需求和未來的發(fā)展路徑;延續(xù)性創(chuàng)新則會將資源推向更容易帶來增長的方向。

總體而言,以ChatGPT為代表的人工智能的發(fā)展, 可能對人類的未來產(chǎn)生重要影響,需要積極開展相關(guān)的研究和管理,以確保國家經(jīng)濟技術(shù)發(fā)展不受制于人,保持社會的穩(wěn)定發(fā)展和保護大多數(shù)人的共同利益?! ?/p>

人工智能解決方案可以為企業(yè)和公民提供巨大的機會,但也可能帶來風(fēng)險,這就需要一個堅實的監(jiān)管框架來確保人工智能技術(shù)的健康發(fā)展。

4.4 ChatGPT的隱患與潛在危機

盡管目前的ChatGPT還是一個驗證的版本,強大的文本處理與聊天能力十分強大,但ChatGPT在短短的幾個月試運行中也暴露出了很多缺陷,甚至可能會引發(fā)危機。這些問題正隨著以ChatGPT為代表的生成型AI系統(tǒng)的推進逐漸浮出水面。人們也會更關(guān)注這些問題,并迅速采取防范措施。ChatGPT存在的缺陷與風(fēng)險主要體現(xiàn)在以下幾個方面:

4.1.1 ChatGPT在道德和法律方面的違規(guī)行為

人們在使用中發(fā)現(xiàn),ChatGPT對信息、數(shù)據(jù)來源無法進行核實、核查和驗證,可能存在個人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問題和提供虛假信息兩大隱患。

ChatGPT從網(wǎng)絡(luò)中獲取大量信息,依托海量數(shù)據(jù)庫分析運行,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,比如新聞工作者編寫的稿子,ChatGPT目前無法追溯到文字的來源,因此當(dāng)用戶輸入提問時,ChatGPT可能產(chǎn)生泄露個人數(shù)據(jù)或商業(yè)秘密等的風(fēng)險。

ChatGPT涉及的法律風(fēng)險不限于以下幾種:

著作權(quán):生成的內(nèi)容可能會侵犯他人的著作權(quán)。

隱私權(quán):使用ChatGPT 可能需要提供一些個人信息,因此存在泄露個人隱私的風(fēng)險。

信息誤導(dǎo):生成的內(nèi)容可能不準確或有誤導(dǎo)性和歧視性。

侵權(quán)違規(guī):ChatGPT生成的內(nèi)容可能侵犯他人的合法權(quán)益,如商標權(quán)、出版權(quán)、著作權(quán)、專利權(quán)等。

商標侵權(quán):ChatGPT 生成的圖像和視頻內(nèi)容可能涉及商標侵權(quán)。

人身攻擊:ChatGPT 生成的內(nèi)容可能涉及對宗教和人身攻擊,違反社會倫理道德。

侮辱誹謗:使用 ChatGPT 生成的內(nèi)容可能侮辱他人,可能涉及誹謗等法律問題。

最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測模型可以識別的特殊標記,以降低信息濫用的問題。

4.1.2 ChatGPT提供虛假信息

ChatGPT常常出現(xiàn)“一本正經(jīng)的胡說八道’”,這是ChatGPT目前被人詬病的一個主要缺點。對于有些虛假信息,需要具備一定專業(yè)知識的人才能辨別真?zhèn)?,這就為不法分子惡意“訓(xùn)練”或“誤導(dǎo)”人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內(nèi)容,損害公民人身和財產(chǎn)安全創(chuàng)造了有利條件。

4.1.3. ChatGPT信息監(jiān)管迫在眉睫

ChatGPT在建立語料庫、生成文本時,大量使用并非公開的開源代碼,或未辦理許可證申請,可能會導(dǎo)致侵權(quán)。對于一些受著作權(quán)或版權(quán)保護的文本、視頻、軟件代碼等,如果沒有經(jīng)過權(quán)利人的授權(quán),直接復(fù)制到自己的數(shù)據(jù)庫中,在此基礎(chǔ)上修改、拼湊,極有可能侵害他人的著作權(quán),因此對ChatGPT必須要考慮建立相關(guān)的監(jiān)管機制,防止產(chǎn)生不良的社會影響。

4.1.4. ChatGPT提供侵權(quán)信息

一位美國眾議院科學(xué)委員議員表示:“我對人工智能以及人工智能推動的社會進步感到興奮,但也為其不受限制和不受監(jiān)管感到擔(dān)憂?!?/p>

紐約大學(xué)認知科學(xué)名譽教授Gary Marcus對以深度學(xué)習(xí)為中心的 AI 持懷疑態(tài)度,他認為:“生成式 AI 對社會結(jié)構(gòu)構(gòu)成了真實而迫在眉睫的威脅”。

各國監(jiān)管機構(gòu)要有切實可行的風(fēng)險評估框架,并任命一個負責(zé)任的機構(gòu)。此外,人工智能倫理框架的建立將為所有部門創(chuàng)造一個良好的創(chuàng)新環(huán)境。

一位資深的網(wǎng)絡(luò)安全公司管理者認為:她的團隊能夠讓 ChatGPT 編寫網(wǎng)絡(luò)攻擊的程序,ChatGPT從編寫網(wǎng)絡(luò)釣魚電子郵件到編寫惡意代碼,再到規(guī)避常見的網(wǎng)絡(luò)安全檢查,實施對其他系統(tǒng)的攻擊,ChatGPT幾乎可以成為讓沒有軟件編碼技能的人成為網(wǎng)絡(luò)罪犯?! ?/p>

無數(shù)的教育工作者譴責(zé)有人使用 ChatGPT考試作弊,美國的多所學(xué)校已經(jīng)禁止學(xué)生用 ChatGPT聊天機器人答題,拒絕采用ChatGPT編寫的論文和答卷。

由于ChatGPT是一種人工智能工具,只要輸入提問,點擊鼠標,就可以完成任何的主題文章、詩歌和電子郵件。特別是學(xué)生用ChatGPT完成試題應(yīng)答和論文撰寫。在國外教育界引起了軒然大波。

為此OpenAI迫于社會壓力,趕緊開發(fā)出了防作弊應(yīng)用軟件,可以審查哪些試卷和論文是由ChatGPT提供的,以此防止學(xué)生作弊。

但是,這種新的檢測工具并沒有消除教師們的恐懼,反而讓科技界和教育界有些失望。據(jù)測試,該系統(tǒng)大約只有20%的準確性,不能完全檢出作弊的試卷答題。

2023年1月初,美國普林斯頓大學(xué)的學(xué)生愛德華·田(Edward Tian)開發(fā)了GPTZero工具,該工具的標語是“人類應(yīng)該知道真相”,該工具可以更準確鑒別由ChatGPT提供的文檔,相信不久國內(nèi)也會催生出這類的應(yīng)用軟件和工具。

人工智能領(lǐng)域的競爭焦點與差距

在以ChatGPT為代表的生成類AI大模型中,對于AI芯片的要求更高,包括要求更高速的內(nèi)存帶寬、更大的內(nèi)存容量以及更加高效的數(shù)據(jù)通信帶寬。

以O(shè)penAI的ChatGPT-3.5模型訓(xùn)練為例,微軟公司專門為Open AI 開發(fā)了一款定制的超級計算機,使用了上萬顆英偉達A100的AI芯片。

在國產(chǎn)AI芯片自主研發(fā)領(lǐng)域,國內(nèi)多家廠商奮起直追,成果喜人,為我國的人工智能發(fā)展奠定了堅實基礎(chǔ),令世界刮目相看。

OpenAI公司發(fā)展人工智能,在微軟投資100億美元拿到49%的股權(quán)之前,OpenAI在成立的七年多的時間里,總共收到了大約40億美元的風(fēng)險投資,就是在這樣巨額投資的情況下,根據(jù)OpenAI公司2022年財報顯示虧損仍高達5.45億美元(折合人民幣虧損額達到將近40億人民幣)。

微軟在入股OpenAI 后,為OpenAI部署了一個超級計算機,按照算力來說,該超級計算機可以進入全球超計算機的前五名。

2023年1月,微軟還承諾將繼續(xù)為OpenAI提供更多的超算中心的部署,讓它能夠更加高效完成下一代ChatGPT模型的訓(xùn)練。

根據(jù)OpenAI測算,目前訓(xùn)練一次ChatGPT模型的算力成本在450萬美元左右,這里還只是計算硬件投入的成本,還不包括人工成本、網(wǎng)絡(luò)寬帶成本、數(shù)據(jù)儲存、固定資產(chǎn)折舊等的綜合成本。

實際上訓(xùn)練一次ChatGPT模型,有時候人力成本和運維成本支出要占據(jù)總成本很大一部分,因此Open AI雇傭了第三世界國家的低成本外來外包員工來完成指定的優(yōu)化任務(wù),從而降低人工成本。

目前ChatGPT-3參數(shù)量在1750億參數(shù)左右。而以O(shè)penAI發(fā)布最新的ChatGPT-3.5B模型為例,數(shù)量將達到1.7萬億。預(yù)測成本就更夸張了,訓(xùn)練時間也將從之前的幾周變?yōu)閿?shù)月甚至幾個月的周期。

目前OpenAI公司有1000多名正式員工,人力成本也是非常龐大的一筆支出。因此AI產(chǎn)業(yè)研發(fā)成本支出是非常燒錢的行業(yè),對于一般發(fā)展中國家來說這是一筆巨資。同樣我們國家人工智能系統(tǒng)還處在研發(fā)階段,資本投入也是當(dāng)下面臨的一個重要課題。

隨著大模型訓(xùn)練體量的不斷增加,未來算力資源、人才資源、數(shù)據(jù)資源三者的投入不可小覷。

 ChatGPT引爆全球互聯(lián)網(wǎng)入口爭奪戰(zhàn)

從ChatGPT功能來看,還處在聯(lián)網(wǎng)驗證階段,就是在基本的功能方面還存在很多問題和不確定性,在有些功能上更是漏洞百出,在軟件編程方面還遠遠沒有達到顛覆軟件編程產(chǎn)業(yè)的程度。

但是全網(wǎng)熱潮背后一定有深層次的原因:經(jīng)過深度分析不難看出,其實ChatGPT引爆的不完全是AI里程碑式的技術(shù)革命,而是引爆一場全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)。

全球互聯(lián)網(wǎng)入口長期被谷歌占據(jù),谷歌的搜索引擎業(yè)務(wù)占到全球市場份額的97%,谷歌內(nèi)部有一個商業(yè)警戒系統(tǒng),只要公司業(yè)務(wù)受到威脅就會觸發(fā),其中最高級別是紅色告警。

谷歌(Google)公司1998年9月創(chuàng)立,自從公司成立以來,這個紅色警戒系統(tǒng)就從來沒有觸發(fā)過。然而2023年2月,谷歌瀏覽器的下載量從全球第一降到了第二,谷歌傳統(tǒng)的搜索引擎業(yè)務(wù)首次被微軟反超,系統(tǒng)自動觸發(fā)了紅色警戒系統(tǒng)。

微軟公司從誕生以來,從未在任何產(chǎn)品上投資超過100億,這次對Open AI 投資超過100個億,目的就是要把ChatGPT整合到微軟公司的所有產(chǎn)品中去。

微軟近期已經(jīng)宣布將ChatGPT整合入微軟的搜索引擎Bing,沒過幾天,又宣布會將ChatGPT整合進Office辦公套件中去。用戶使用Office時就能體驗ChatGPT的對話功能。很明顯微軟就是要利用ChatGPT先入為主的優(yōu)勢,爭奪谷歌搜索引擎的市場份額,目前第一階段目標已經(jīng)圓滿達到。

微軟一直都在厲兵秣馬,以前一直被谷歌、蘋果、亞馬遜壓得喘不動氣,現(xiàn)在終于開始了在全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)中的絕地反擊戰(zhàn)。

同樣的情況,在我國的互聯(lián)網(wǎng)企業(yè)中也有發(fā)生。在ChatGPT成功的示范效應(yīng)帶動下,以及國家支持數(shù)字經(jīng)濟發(fā)展兩個強力點的支撐下,相信不遠的將來,中國的AI 產(chǎn)品將像雨后春筍一樣拔地而起。

淺談未來我國人工智能發(fā)展趨勢

隨著科學(xué)技術(shù)的飛速發(fā)展,國家已經(jīng)把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè),作為新增長引擎加以扶持和培養(yǎng),人工智能的未來發(fā)展將會帶來更多的驚喜和機遇,下面就讓我們淺談一下我國人工智能發(fā)展趨勢。

在國家宏觀政策的大力支持下,我國的人工智能將迎來重大的發(fā)展機遇期,國內(nèi)的人工智能企業(yè),互聯(lián)網(wǎng)企業(yè),科研機構(gòu)應(yīng)當(dāng)抓住這個難得的機遇,為國家的數(shù)字經(jīng)濟轉(zhuǎn)型發(fā)展作出應(yīng)有的貢獻。

特別是華為、阿里巴巴,騰訊、百度、科大訊飛、字節(jié)跳動等等大型企業(yè)和科研單位,應(yīng)該發(fā)揮各自優(yōu)勢強強聯(lián)手,他們有義務(wù)、有責(zé)任,承擔(dān)起這個時代賦予的歷史使命。

強化企業(yè)在研發(fā)投入中的主體地位,繼續(xù)加大企業(yè)研發(fā)費用,建立起金融支持企業(yè)在AI領(lǐng)域的創(chuàng)新工作機制,打通科技、產(chǎn)業(yè)、金融的全產(chǎn)業(yè)鏈條。

人工智能產(chǎn)業(yè)屬于新型的高科領(lǐng)域,目前世界上尚未形成占絕對主導(dǎo)的技術(shù)路徑依賴。

在世界產(chǎn)業(yè)生態(tài)也沒有形成絕對壁壘的人工智能開創(chuàng)初期,我們要結(jié)合國情把軟硬件協(xié)同發(fā)展,作為提升人工智能發(fā)展的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足我國人工智能產(chǎn)業(yè)發(fā)展需求。

面對這一發(fā)展契機,我國應(yīng)強化人工智能產(chǎn)業(yè)發(fā)展的頂層設(shè)計,加強人工智能軟硬件協(xié)同布局。重點布局具有我國自主知識產(chǎn)權(quán)的“框架軟件+AI芯片”架構(gòu),構(gòu)建起有利于我國人工智能發(fā)展的生態(tài)環(huán)境,力爭在人工智能領(lǐng)域取得主導(dǎo)優(yōu)勢。

類腦芯片研發(fā)屬于AI芯片的前瞻性領(lǐng)域,我國類腦芯片的研究尚處于理論階段,涉及的企業(yè)不多,應(yīng)充分發(fā)揮國內(nèi)高校以及科研院所力量進行前沿布局。

國際龍頭企業(yè)還沒有形成明確的技術(shù)及知識產(chǎn)權(quán)壁壘,IBM研制的TrueNorth類人腦計算有突破性進展,隨著存儲、邏輯、傳感技術(shù)的改進,將來類腦計算芯片有望取得更大的發(fā)展,在AI領(lǐng)域?qū)l(fā)揮更大的作用。

結(jié)束語

總之,人工智能的未來發(fā)展將會是一個充滿機遇和挑戰(zhàn)的過程,隨著技術(shù)的不斷發(fā)展和成熟,人工智能已經(jīng)開始滲透到我們?nèi)粘I畹母鱾€方面,人工智能不僅可以幫助改善人們的生活品質(zhì)、豐富人們的娛樂生活,也將會在工業(yè)自動化、軍事裝備現(xiàn)代化、提高醫(yī)療診斷水平、提升教育能力,拓展學(xué)生的知識面等各個領(lǐng)域得到更加廣泛的應(yīng)用,從而幫助我們更好地解決問題、提高效率、改善生活。

我們也需要保持警惕,推動建立人工智能安全可控的治理體系,積極面對技術(shù)發(fā)展中出現(xiàn)的各種問題和挑戰(zhàn)。

讓我們以開放的心態(tài)迎接新技術(shù)的出現(xiàn),寬容新技術(shù)存在的不足之處,在國家宏觀政策的大力支持下,發(fā)揮舉國體制的優(yōu)勢,積極推動人工智能與經(jīng)濟社會深度融合,在重大應(yīng)用場景中錘煉技術(shù)、升級迭代、培育市場,從而使我國的人工智能技術(shù)能夠為全人類社會的進步和發(fā)展做出更加積極的貢獻。

參考資料:

[1].ChatGPT翻開了硬幣的哪一面?北京郵電大學(xué)人工智能學(xué)院教授鄧偉洪、中國信通院云大所內(nèi)容科技部副主任石霖

[2].采訪報道ChatGPT“火出圈”我們該“急眼”嗎?中國經(jīng)濟網(wǎng)2023年2月20日

[3].OpenAI官網(wǎng)(ChatGPT:優(yōu)化對話的語言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

4萬字告訴你ChatGPT到底是什么?(下)

人工智能系統(tǒng)開發(fā)是一個系統(tǒng)工程,需要協(xié)同各個方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點。

文 | 星船知造 錢鴻生

編輯 | 唐曉園

上周我們發(fā)布了報告上篇 《4萬字告訴你ChatGPT到底是什么(上)》,今天的下篇我們將繼續(xù)節(jié)選報告第三章中的“我國人工智能發(fā)展中存在的主要問題”、第四章《ChatGPT對資本市場影響的分析與研判》和第五章《我國未來人工智能發(fā)展的展望》中部分核心內(nèi)容和觀點。

OpenAI推出ChatGPT后不久,微軟宣布將ChatGPT與搜索引擎Bing整合,谷歌宣布推出Bard應(yīng)對挑戰(zhàn),接著Meta官網(wǎng)公布了一款新的人工智能大型語言模型LLaMA。

此時,人們自然而然把目光轉(zhuǎn)向了中國相關(guān)企業(yè),他們何時宣布推出類似于ChatGPT人工智能發(fā)展的時間表。

人們特別關(guān)注的企業(yè)有百度、阿里巴巴以及人工智能企業(yè)科大訊飛等等一大批中國與人工智能有關(guān)聯(lián)企業(yè)的動向。

3.4.3 我國人工智能發(fā)展中存在的主要問題

我國發(fā)展人工智能面臨三方面技術(shù)難點如下:

第一,人工智能的AI算法

人工智能常見的算法技術(shù)的基礎(chǔ)性研究主要集中于國內(nèi)各大高校團隊,但在科研成果轉(zhuǎn)化領(lǐng)域一直發(fā)展比較緩慢,較難實現(xiàn)從理論和技術(shù)向生產(chǎn)力的轉(zhuǎn)化。

目前以華為、阿里、騰訊等公司主導(dǎo)的人工智能技術(shù)研發(fā)團隊迅速崛起,將科研產(chǎn)品開發(fā)與算法技術(shù)結(jié)合,從產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)人工智能算法的技術(shù)成果轉(zhuǎn)化。

但是在算法的基礎(chǔ)理論研究層面,一直以來是我們發(fā)展人工智能技術(shù)的短板。沒有對大規(guī)模機器學(xué)習(xí)場景中強化學(xué)習(xí)算法模型、生成性預(yù)訓(xùn)練變換模型、分布式并行的研發(fā)投入,或者說由于受到資金投入與人才缺乏的影響,研究成果與世界發(fā)達企業(yè)還有很大的差距。

美國現(xiàn)有的人工智能系統(tǒng)的關(guān)鍵技術(shù)都是不開源的,系統(tǒng)深度學(xué)習(xí)框架、數(shù)據(jù)庫和工具集,均限內(nèi)部使用,部分僅對系統(tǒng)的應(yīng)用接口持開源的態(tài)度,使我們無法在短時間內(nèi)掌握世界最先進的人工智能系統(tǒng)的開發(fā)經(jīng)驗。

從市場的角度來看,我國目前的人工智能系統(tǒng)都是一些比較初級的數(shù)據(jù)采集與分析應(yīng)用系統(tǒng),類似于ChatGPT高度智能化的AI產(chǎn)品的研發(fā)還處于摸索與初級階段,在性能和穩(wěn)定性方面改善空間潛力巨大。

早在20世紀80年代,我國學(xué)術(shù)界就提出了相當(dāng)完善的AI算法模型,中國多家高校有從事算法模型的研究,但大多都將算法模型應(yīng)用在人臉識別系統(tǒng),提高圖像識別精度方面。到目前為止算法模型在AI領(lǐng)域的價值還沒有被真正體現(xiàn),這可能受限于我們的芯片制造水平難以提供支撐深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練和預(yù)訓(xùn)練需要的算力。

科研領(lǐng)域需要更大投入,要針對目前的已有算法進行深度優(yōu)化,或者另辟蹊徑,提出更為先進的算法理論。要打造出符合世界產(chǎn)業(yè)發(fā)展最新技術(shù)水平,具有全球市場競爭力的人工智能產(chǎn)品,看來有相當(dāng)長的一段路要走。但也不排除彎道超車或換道超車奇跡的發(fā)生。

我國AI發(fā)展現(xiàn)狀任重而道遠。

第二,人工智能AI模型軟件

國內(nèi)的人工智能模型軟件開發(fā)已經(jīng)起步,開始對標世界先進的人工智能模型,培育自己的發(fā)展環(huán)境。人工智能模型是人工智能生態(tài)中最重要的因素之一,我國需要促進國產(chǎn)模型軟件的發(fā)展和推廣,擺脫國外的標準制約。ChatGPT就是基于“生成型預(yù)訓(xùn)練變換模型”開發(fā)出來的自然語言聊天機器人。

第三,人工智能開發(fā)環(huán)境

人工智能開發(fā)環(huán)境是指相關(guān)算法、數(shù)據(jù)庫、軟件開發(fā)工具、高性能的人工智能AI計算機芯片、云計算網(wǎng)絡(luò)的集合。國產(chǎn)AI模型開發(fā)需要和國產(chǎn)AI智能芯片及硬件進行相互適配、性能優(yōu)化和應(yīng)用推廣,才能夠形成面向行業(yè)應(yīng)用的軟硬件一體化人工智能平臺。

國際人工智能巨頭掌控著人工智能開發(fā)環(huán)境的關(guān)鍵技術(shù),我們目前還較難在短時間內(nèi)在AI芯片、算法、模型軟件、云數(shù)據(jù)庫服務(wù)等人工智能開發(fā)環(huán)境上有十分大的突破。

人工智能系統(tǒng)開發(fā)是一個系統(tǒng)工程,需要協(xié)同各個方面的資源共同發(fā)力,才能在產(chǎn)業(yè)發(fā)展中占有制高點。

3.4.4 AI芯片,人工智能繞不過去的坎

人工智能AI芯片是技術(shù)發(fā)展的關(guān)鍵之一,它是提供人工智能算力的靈魂和大腦,承載了為各種終端提供強大算力的重要任務(wù)。人工智能AI 芯片的出現(xiàn),極大提高數(shù)據(jù)處理的能力,尤其在處理海量數(shù)據(jù)時明顯優(yōu)于傳統(tǒng)CPU。

從技術(shù)架構(gòu)來看,AI芯片一般可以分為GPU、FPGA、ASIC和類腦芯片四大類——

GPU(Graphics Processing Unit,圖形處理器)

GPU是利用處理圖形任務(wù)的圖形處理器來計算原本由中央處理器CPU的通用計算任務(wù)。

GPU的關(guān)鍵性能是矩形并行計算,主流的GPU具有強大的計算能力,無論性能還是內(nèi)存帶寬均遠大于同代的CPU。CPU 由專為順序串行處理而優(yōu)化組成,而 GPU 則擁有一個由數(shù)以千計的更小、更高效的核心(專為同時處理多重任務(wù)而設(shè)計)組成的大規(guī)模并行計算架構(gòu)。同時CPU相當(dāng)一部分時間在執(zhí)行外設(shè)的中斷、進程的切換等任務(wù),而GPU有更多的時間用于并行計算。

英偉達是AI芯片GPU(圖形處理器單元)的主要生產(chǎn)廠商,無論是OpenAI的ChatGPT、還是微軟的搜索引擎Bing、谷歌的人工智能系統(tǒng)LaMDA,都離不開英偉達提供的底層芯片GPU的算力支持,英偉達系列的A100和H100系列占全球AI芯片市場的80%以上的份額。

除了英偉達,還有AMD,ARM家的Mali,Imagination的PowerVR,Qualcomm的Adreno等。

基于FPGA現(xiàn)場可編程門陣列

FPGA(Field Programmable Gate Array)現(xiàn)場可編程門陣列,或稱半定制化芯片。它是在PAL、GAL、CPLD等可編程器件的基礎(chǔ)上進一步發(fā)展的產(chǎn)物,可以根據(jù)算法需求,動態(tài)重構(gòu)計算架構(gòu)。它是作為專用集成電路(ASIC)領(lǐng)域中的一種半定制電路而出現(xiàn)的,既解決了定制電路的不足,又克服了原有可編程器件門電路數(shù)有限的缺點。

全球知名的FPGA生產(chǎn)廠商有:Altera,Xilinx,Actel,Lattice,Atmel,我國廠商代表有深鑒科技DPU、百度XPU等。

ASIC(Application Specific Integrated Circuit)

ASIC專用集成電路是針對特定用戶要求定制設(shè)計、制造的專門的應(yīng)用程序芯片。ASIC芯片廣泛應(yīng)用于人工智能設(shè)備、虛擬貨幣挖礦設(shè)備、耗材打印設(shè)備、軍事國防設(shè)備等智慧終端。

ASIC芯片還可以細分為全定制ASIC芯片、半定制ASIC芯片及可編程ASIC芯片。ASIC芯片擁有面積小、集成度高等優(yōu)勢,被廣泛應(yīng)用于人工智能終端和網(wǎng)絡(luò)系統(tǒng)中。

類腦計算芯片(Brain-Inspired Chip)

類腦計算芯片是人工智能AI的一個重要組成部分,類腦芯片可模擬人類大腦信息處理方式,能以極低的功耗對信息進行并行和分布式處理,類腦計算芯片就是把微電子技術(shù)和新型神經(jīng)形態(tài)器件結(jié)合,突破傳統(tǒng)計算架構(gòu),實現(xiàn)存儲與計算的深度融合,大幅提升計算性能、提高集成度、降低能耗。對于現(xiàn)有的計算體系與系統(tǒng)做出變革,并實現(xiàn)在計算能耗、計算能力與計算效率等方面的大幅改進。

IBM已經(jīng)開始進行類腦智能算法與技術(shù)的探索,并已成功研制出TrueNorth芯片。

中國目前有清華大學(xué)的天機芯,浙江大學(xué)的Darwin2 (55nm)等一批研制類腦計算芯片機構(gòu)和企業(yè)。

ChatGPT對資本市場影響的研判

4.2 ChatGPT背后的技術(shù)壁壘和文化控制權(quán)

ChatGPT是一種自然語言處理技術(shù),一旦ChatGPT能從目前的實驗階段走向應(yīng)用成熟階段,將這標志著在人類活動中,人工智能將開始扮演重要角色并占據(jù)優(yōu)勢地位。

我們知道,在自然語言處理大模型技術(shù)上,由于受到各種因素的影響,我國的人工智能相比國外發(fā)展有一定的差距。

但在局部技術(shù)領(lǐng)域,我們還是具有很大優(yōu)勢的,比如在優(yōu)化大模型中的數(shù)據(jù)庫,在某些特定領(lǐng)域進行模型優(yōu)化和云數(shù)據(jù)庫建設(shè),以及在一些與自然語言處理關(guān)系密切的學(xué)科。在國家宏觀政策的指導(dǎo)下,發(fā)揮社會市場經(jīng)濟體制的優(yōu)勢,能集中力量辦大事的原則,完全可以進行基于大模型處理方法模型的應(yīng)用性研究,以適應(yīng)人工智能發(fā)展對拉動國家經(jīng)濟上行,滿足人們追求豐富多彩生活娛樂的需求。

4.3 ChatGPT可能引發(fā)的機遇與風(fēng)險

我們對ChatGPT要時刻保持清醒的認知,每一次技術(shù)迭代,都將改變?nèi)祟惿畹膬?nèi)涵和方式。ChatGPT是否屬于一次新的技術(shù)迭代這個問題還有進一步觀察,可是以ChatGPT為代表的人工智能技術(shù)的發(fā)展和自然語言處理技術(shù)的突破,一定會對現(xiàn)有產(chǎn)業(yè)發(fā)展格局帶來前所未有的重要影響。

從正面影響來看,ChatGPT可以幫助人們快速獲取信息和提高工作效率,擴展知識面,提供發(fā)展AI 產(chǎn)業(yè)新的思路和方法。 另一方面,某些低端和重復(fù)的工作可能被ChatGPT和 AI代替,導(dǎo)致勞動力市場的階段性動蕩和變化。

如果人們過度依賴AI,可能會降低人們一部分的操作技能水平和創(chuàng)新精神。某些行業(yè)可能會發(fā)生重組甚至消失,有可能在變化過程中引發(fā)社會矛盾等。

顛覆性創(chuàng)新理論的提出者克里斯滕森在《創(chuàng)新者的窘境》這本書中,將創(chuàng)新分為了延續(xù)性創(chuàng)新和破壞性創(chuàng)新兩種:破壞性創(chuàng)新難以評估市場規(guī)模增長的需求和未來的發(fā)展路徑;延續(xù)性創(chuàng)新則會將資源推向更容易帶來增長的方向。

總體而言,以ChatGPT為代表的人工智能的發(fā)展, 可能對人類的未來產(chǎn)生重要影響,需要積極開展相關(guān)的研究和管理,以確保國家經(jīng)濟技術(shù)發(fā)展不受制于人,保持社會的穩(wěn)定發(fā)展和保護大多數(shù)人的共同利益。  

人工智能解決方案可以為企業(yè)和公民提供巨大的機會,但也可能帶來風(fēng)險,這就需要一個堅實的監(jiān)管框架來確保人工智能技術(shù)的健康發(fā)展。

4.4 ChatGPT的隱患與潛在危機

盡管目前的ChatGPT還是一個驗證的版本,強大的文本處理與聊天能力十分強大,但ChatGPT在短短的幾個月試運行中也暴露出了很多缺陷,甚至可能會引發(fā)危機。這些問題正隨著以ChatGPT為代表的生成型AI系統(tǒng)的推進逐漸浮出水面。人們也會更關(guān)注這些問題,并迅速采取防范措施。ChatGPT存在的缺陷與風(fēng)險主要體現(xiàn)在以下幾個方面:

4.1.1 ChatGPT在道德和法律方面的違規(guī)行為

人們在使用中發(fā)現(xiàn),ChatGPT對信息、數(shù)據(jù)來源無法進行核實、核查和驗證,可能存在個人數(shù)據(jù)與商業(yè)秘密被泄露,引起竊取他人信息的道德問題和提供虛假信息兩大隱患。

ChatGPT從網(wǎng)絡(luò)中獲取大量信息,依托海量數(shù)據(jù)庫分析運行,其中包括大量的互聯(lián)網(wǎng)用戶自行輸入的信息,比如新聞工作者編寫的稿子,ChatGPT目前無法追溯到文字的來源,因此當(dāng)用戶輸入提問時,ChatGPT可能產(chǎn)生泄露個人數(shù)據(jù)或商業(yè)秘密等的風(fēng)險。

ChatGPT涉及的法律風(fēng)險不限于以下幾種:

著作權(quán):生成的內(nèi)容可能會侵犯他人的著作權(quán)。

隱私權(quán):使用ChatGPT 可能需要提供一些個人信息,因此存在泄露個人隱私的風(fēng)險。

信息誤導(dǎo):生成的內(nèi)容可能不準確或有誤導(dǎo)性和歧視性。

侵權(quán)違規(guī):ChatGPT生成的內(nèi)容可能侵犯他人的合法權(quán)益,如商標權(quán)、出版權(quán)、著作權(quán)、專利權(quán)等。

商標侵權(quán):ChatGPT 生成的圖像和視頻內(nèi)容可能涉及商標侵權(quán)。

人身攻擊:ChatGPT 生成的內(nèi)容可能涉及對宗教和人身攻擊,違反社會倫理道德。

侮辱誹謗:使用 ChatGPT 生成的內(nèi)容可能侮辱他人,可能涉及誹謗等法律問題。

最近,OpenAI表示,正考慮在ChatGPT中添加模型水印,即監(jiān)測模型可以識別的特殊標記,以降低信息濫用的問題。

4.1.2 ChatGPT提供虛假信息

ChatGPT常常出現(xiàn)“一本正經(jīng)的胡說八道’”,這是ChatGPT目前被人詬病的一個主要缺點。對于有些虛假信息,需要具備一定專業(yè)知識的人才能辨別真?zhèn)?,這就為不法分子惡意“訓(xùn)練”或“誤導(dǎo)”人工智能,使其提供詐騙信息、釣魚網(wǎng)站等內(nèi)容,損害公民人身和財產(chǎn)安全創(chuàng)造了有利條件。

4.1.3. ChatGPT信息監(jiān)管迫在眉睫

ChatGPT在建立語料庫、生成文本時,大量使用并非公開的開源代碼,或未辦理許可證申請,可能會導(dǎo)致侵權(quán)。對于一些受著作權(quán)或版權(quán)保護的文本、視頻、軟件代碼等,如果沒有經(jīng)過權(quán)利人的授權(quán),直接復(fù)制到自己的數(shù)據(jù)庫中,在此基礎(chǔ)上修改、拼湊,極有可能侵害他人的著作權(quán),因此對ChatGPT必須要考慮建立相關(guān)的監(jiān)管機制,防止產(chǎn)生不良的社會影響。

4.1.4. ChatGPT提供侵權(quán)信息

一位美國眾議院科學(xué)委員議員表示:“我對人工智能以及人工智能推動的社會進步感到興奮,但也為其不受限制和不受監(jiān)管感到擔(dān)憂?!?/p>

紐約大學(xué)認知科學(xué)名譽教授Gary Marcus對以深度學(xué)習(xí)為中心的 AI 持懷疑態(tài)度,他認為:“生成式 AI 對社會結(jié)構(gòu)構(gòu)成了真實而迫在眉睫的威脅”。

各國監(jiān)管機構(gòu)要有切實可行的風(fēng)險評估框架,并任命一個負責(zé)任的機構(gòu)。此外,人工智能倫理框架的建立將為所有部門創(chuàng)造一個良好的創(chuàng)新環(huán)境。

一位資深的網(wǎng)絡(luò)安全公司管理者認為:她的團隊能夠讓 ChatGPT 編寫網(wǎng)絡(luò)攻擊的程序,ChatGPT從編寫網(wǎng)絡(luò)釣魚電子郵件到編寫惡意代碼,再到規(guī)避常見的網(wǎng)絡(luò)安全檢查,實施對其他系統(tǒng)的攻擊,ChatGPT幾乎可以成為讓沒有軟件編碼技能的人成為網(wǎng)絡(luò)罪犯?! ?/p>

無數(shù)的教育工作者譴責(zé)有人使用 ChatGPT考試作弊,美國的多所學(xué)校已經(jīng)禁止學(xué)生用 ChatGPT聊天機器人答題,拒絕采用ChatGPT編寫的論文和答卷。

由于ChatGPT是一種人工智能工具,只要輸入提問,點擊鼠標,就可以完成任何的主題文章、詩歌和電子郵件。特別是學(xué)生用ChatGPT完成試題應(yīng)答和論文撰寫。在國外教育界引起了軒然大波。

為此OpenAI迫于社會壓力,趕緊開發(fā)出了防作弊應(yīng)用軟件,可以審查哪些試卷和論文是由ChatGPT提供的,以此防止學(xué)生作弊。

但是,這種新的檢測工具并沒有消除教師們的恐懼,反而讓科技界和教育界有些失望。據(jù)測試,該系統(tǒng)大約只有20%的準確性,不能完全檢出作弊的試卷答題。

2023年1月初,美國普林斯頓大學(xué)的學(xué)生愛德華·田(Edward Tian)開發(fā)了GPTZero工具,該工具的標語是“人類應(yīng)該知道真相”,該工具可以更準確鑒別由ChatGPT提供的文檔,相信不久國內(nèi)也會催生出這類的應(yīng)用軟件和工具。

人工智能領(lǐng)域的競爭焦點與差距

在以ChatGPT為代表的生成類AI大模型中,對于AI芯片的要求更高,包括要求更高速的內(nèi)存帶寬、更大的內(nèi)存容量以及更加高效的數(shù)據(jù)通信帶寬。

以O(shè)penAI的ChatGPT-3.5模型訓(xùn)練為例,微軟公司專門為Open AI 開發(fā)了一款定制的超級計算機,使用了上萬顆英偉達A100的AI芯片。

在國產(chǎn)AI芯片自主研發(fā)領(lǐng)域,國內(nèi)多家廠商奮起直追,成果喜人,為我國的人工智能發(fā)展奠定了堅實基礎(chǔ),令世界刮目相看。

OpenAI公司發(fā)展人工智能,在微軟投資100億美元拿到49%的股權(quán)之前,OpenAI在成立的七年多的時間里,總共收到了大約40億美元的風(fēng)險投資,就是在這樣巨額投資的情況下,根據(jù)OpenAI公司2022年財報顯示虧損仍高達5.45億美元(折合人民幣虧損額達到將近40億人民幣)。

微軟在入股OpenAI 后,為OpenAI部署了一個超級計算機,按照算力來說,該超級計算機可以進入全球超計算機的前五名。

2023年1月,微軟還承諾將繼續(xù)為OpenAI提供更多的超算中心的部署,讓它能夠更加高效完成下一代ChatGPT模型的訓(xùn)練。

根據(jù)OpenAI測算,目前訓(xùn)練一次ChatGPT模型的算力成本在450萬美元左右,這里還只是計算硬件投入的成本,還不包括人工成本、網(wǎng)絡(luò)寬帶成本、數(shù)據(jù)儲存、固定資產(chǎn)折舊等的綜合成本。

實際上訓(xùn)練一次ChatGPT模型,有時候人力成本和運維成本支出要占據(jù)總成本很大一部分,因此Open AI雇傭了第三世界國家的低成本外來外包員工來完成指定的優(yōu)化任務(wù),從而降低人工成本。

目前ChatGPT-3參數(shù)量在1750億參數(shù)左右。而以O(shè)penAI發(fā)布最新的ChatGPT-3.5B模型為例,數(shù)量將達到1.7萬億。預(yù)測成本就更夸張了,訓(xùn)練時間也將從之前的幾周變?yōu)閿?shù)月甚至幾個月的周期。

目前OpenAI公司有1000多名正式員工,人力成本也是非常龐大的一筆支出。因此AI產(chǎn)業(yè)研發(fā)成本支出是非常燒錢的行業(yè),對于一般發(fā)展中國家來說這是一筆巨資。同樣我們國家人工智能系統(tǒng)還處在研發(fā)階段,資本投入也是當(dāng)下面臨的一個重要課題。

隨著大模型訓(xùn)練體量的不斷增加,未來算力資源、人才資源、數(shù)據(jù)資源三者的投入不可小覷。

 ChatGPT引爆全球互聯(lián)網(wǎng)入口爭奪戰(zhàn)

從ChatGPT功能來看,還處在聯(lián)網(wǎng)驗證階段,就是在基本的功能方面還存在很多問題和不確定性,在有些功能上更是漏洞百出,在軟件編程方面還遠遠沒有達到顛覆軟件編程產(chǎn)業(yè)的程度。

但是全網(wǎng)熱潮背后一定有深層次的原因:經(jīng)過深度分析不難看出,其實ChatGPT引爆的不完全是AI里程碑式的技術(shù)革命,而是引爆一場全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)。

全球互聯(lián)網(wǎng)入口長期被谷歌占據(jù),谷歌的搜索引擎業(yè)務(wù)占到全球市場份額的97%,谷歌內(nèi)部有一個商業(yè)警戒系統(tǒng),只要公司業(yè)務(wù)受到威脅就會觸發(fā),其中最高級別是紅色告警。

谷歌(Google)公司1998年9月創(chuàng)立,自從公司成立以來,這個紅色警戒系統(tǒng)就從來沒有觸發(fā)過。然而2023年2月,谷歌瀏覽器的下載量從全球第一降到了第二,谷歌傳統(tǒng)的搜索引擎業(yè)務(wù)首次被微軟反超,系統(tǒng)自動觸發(fā)了紅色警戒系統(tǒng)。

微軟公司從誕生以來,從未在任何產(chǎn)品上投資超過100億,這次對Open AI 投資超過100個億,目的就是要把ChatGPT整合到微軟公司的所有產(chǎn)品中去。

微軟近期已經(jīng)宣布將ChatGPT整合入微軟的搜索引擎Bing,沒過幾天,又宣布會將ChatGPT整合進Office辦公套件中去。用戶使用Office時就能體驗ChatGPT的對話功能。很明顯微軟就是要利用ChatGPT先入為主的優(yōu)勢,爭奪谷歌搜索引擎的市場份額,目前第一階段目標已經(jīng)圓滿達到。

微軟一直都在厲兵秣馬,以前一直被谷歌、蘋果、亞馬遜壓得喘不動氣,現(xiàn)在終于開始了在全球互聯(lián)網(wǎng)入口的爭奪戰(zhàn)中的絕地反擊戰(zhàn)。

同樣的情況,在我國的互聯(lián)網(wǎng)企業(yè)中也有發(fā)生。在ChatGPT成功的示范效應(yīng)帶動下,以及國家支持數(shù)字經(jīng)濟發(fā)展兩個強力點的支撐下,相信不遠的將來,中國的AI 產(chǎn)品將像雨后春筍一樣拔地而起。

淺談未來我國人工智能發(fā)展趨勢

隨著科學(xué)技術(shù)的飛速發(fā)展,國家已經(jīng)把人工智能作為戰(zhàn)略性新興產(chǎn)業(yè),作為新增長引擎加以扶持和培養(yǎng),人工智能的未來發(fā)展將會帶來更多的驚喜和機遇,下面就讓我們淺談一下我國人工智能發(fā)展趨勢。

在國家宏觀政策的大力支持下,我國的人工智能將迎來重大的發(fā)展機遇期,國內(nèi)的人工智能企業(yè),互聯(lián)網(wǎng)企業(yè),科研機構(gòu)應(yīng)當(dāng)抓住這個難得的機遇,為國家的數(shù)字經(jīng)濟轉(zhuǎn)型發(fā)展作出應(yīng)有的貢獻。

特別是華為、阿里巴巴,騰訊、百度、科大訊飛、字節(jié)跳動等等大型企業(yè)和科研單位,應(yīng)該發(fā)揮各自優(yōu)勢強強聯(lián)手,他們有義務(wù)、有責(zé)任,承擔(dān)起這個時代賦予的歷史使命。

強化企業(yè)在研發(fā)投入中的主體地位,繼續(xù)加大企業(yè)研發(fā)費用,建立起金融支持企業(yè)在AI領(lǐng)域的創(chuàng)新工作機制,打通科技、產(chǎn)業(yè)、金融的全產(chǎn)業(yè)鏈條。

人工智能產(chǎn)業(yè)屬于新型的高科領(lǐng)域,目前世界上尚未形成占絕對主導(dǎo)的技術(shù)路徑依賴。

在世界產(chǎn)業(yè)生態(tài)也沒有形成絕對壁壘的人工智能開創(chuàng)初期,我們要結(jié)合國情把軟硬件協(xié)同發(fā)展,作為提升人工智能發(fā)展的主要手段,單純的數(shù)據(jù)與算法優(yōu)化已不能滿足我國人工智能產(chǎn)業(yè)發(fā)展需求。

面對這一發(fā)展契機,我國應(yīng)強化人工智能產(chǎn)業(yè)發(fā)展的頂層設(shè)計,加強人工智能軟硬件協(xié)同布局。重點布局具有我國自主知識產(chǎn)權(quán)的“框架軟件+AI芯片”架構(gòu),構(gòu)建起有利于我國人工智能發(fā)展的生態(tài)環(huán)境,力爭在人工智能領(lǐng)域取得主導(dǎo)優(yōu)勢。

類腦芯片研發(fā)屬于AI芯片的前瞻性領(lǐng)域,我國類腦芯片的研究尚處于理論階段,涉及的企業(yè)不多,應(yīng)充分發(fā)揮國內(nèi)高校以及科研院所力量進行前沿布局。

國際龍頭企業(yè)還沒有形成明確的技術(shù)及知識產(chǎn)權(quán)壁壘,IBM研制的TrueNorth類人腦計算有突破性進展,隨著存儲、邏輯、傳感技術(shù)的改進,將來類腦計算芯片有望取得更大的發(fā)展,在AI領(lǐng)域?qū)l(fā)揮更大的作用。

結(jié)束語

總之,人工智能的未來發(fā)展將會是一個充滿機遇和挑戰(zhàn)的過程,隨著技術(shù)的不斷發(fā)展和成熟,人工智能已經(jīng)開始滲透到我們?nèi)粘I畹母鱾€方面,人工智能不僅可以幫助改善人們的生活品質(zhì)、豐富人們的娛樂生活,也將會在工業(yè)自動化、軍事裝備現(xiàn)代化、提高醫(yī)療診斷水平、提升教育能力,拓展學(xué)生的知識面等各個領(lǐng)域得到更加廣泛的應(yīng)用,從而幫助我們更好地解決問題、提高效率、改善生活。

我們也需要保持警惕,推動建立人工智能安全可控的治理體系,積極面對技術(shù)發(fā)展中出現(xiàn)的各種問題和挑戰(zhàn)。

讓我們以開放的心態(tài)迎接新技術(shù)的出現(xiàn),寬容新技術(shù)存在的不足之處,在國家宏觀政策的大力支持下,發(fā)揮舉國體制的優(yōu)勢,積極推動人工智能與經(jīng)濟社會深度融合,在重大應(yīng)用場景中錘煉技術(shù)、升級迭代、培育市場,從而使我國的人工智能技術(shù)能夠為全人類社會的進步和發(fā)展做出更加積極的貢獻。

參考資料:

[1].ChatGPT翻開了硬幣的哪一面?北京郵電大學(xué)人工智能學(xué)院教授鄧偉洪、中國信通院云大所內(nèi)容科技部副主任石霖

[2].采訪報道ChatGPT“火出圈”我們該“急眼”嗎?中國經(jīng)濟網(wǎng)2023年2月20日

[3].OpenAI官網(wǎng)(ChatGPT:優(yōu)化對話的語言模型 (OpenAI.com))

[4].Interactive Learning from Policy-Dependent Human Feedback (MacGlashan et al. 2017)

[5].Deep Reinforcement Learning from Human Preferences (Christiano et al. 2017)

[6].ChatGPT: Optimizing Language Models for Dialogue (OpenAI 2022)

[7].Scaling Laws for Reward Model Overoptimization (Gao et al. 2022)

[8].Training a Helpful and Harmless Assistant with Reinforcement Learning from Human Feedback (Anthropic, 2022)

[9].Red Teaming Language Models to Reduce Harms: Methods, Scaling Behaviors, and Lessons Learned (Ganguli et al. 2022)

[10].Dynamic Planning in Open-Ended Dialogue using Reinforcement Learning (Cohen at al. 2022)

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。