99久久免费国产精品成人一区二区,国产V一区二区三区在线

文|阿爾法工場

10月17 日，在“2023百度世界大會”上，李彥宏正式發(fā)布了最新的文心大模型4.0版本。

一時間，各種測評紛涌而至，各大科技媒體從理解、生成、邏輯和記憶能力等方面，對模型進(jìn)行了全方位測評。

然而，除了被人反復(fù)談?wù)摰奈男?.0之外，在發(fā)布會上，另一個稍顯低調(diào)的功能，卻也冷不丁地顯示了未來大模型的發(fā)展趨勢。

這就是百度文心4.0的插件功能。

目前，文心4.0光是插件就有8個，包括一鏡流影（文字轉(zhuǎn)視頻）、說圖解畫（看圖說話）、E言易圖（可視化數(shù)據(jù)分析）等。

這些插件還可以自由組合，來完成更復(fù)雜的任務(wù)。

不僅如此，百度文心大模型插件開發(fā)平臺——靈境矩陣平臺，上線1個月已有2.7萬家開發(fā)者申請入駐，個人開發(fā)者占比超30%。

那么，百度為何如此重視插件？而插件生態(tài)的繁榮，對大模型又意味著什么？

01 插件，讓大模型如虎添翼

從某種程度上說，插件對于大模型，相當(dāng)于是另一大隱藏的“殺手锏?！?/p>

在不對模型算法、參數(shù)進(jìn)行改進(jìn)的情況下，僅僅憑借一個簡單的外接插件，模型能力就有可能得到顯著擴(kuò)展和提升。

此前，GPT-4就已經(jīng)通過插件功能實(shí)現(xiàn)了如虎添翼的效果。外界甚至將那次提升稱之為GPT-4.5的到來。

今年7月9號，OpenAI宣布將官方插件Code Interpreter（代碼解釋器）通過設(shè)置中的Beta面板向所有ChatGPT Plus 用戶提供。

那Code Interpreter具體能做什么？

簡單來說，它相當(dāng)于是GPT-4能力邊界的一次大擴(kuò)展，能讓GPT-4做到很多之前做不到的事。

例如，在該插件推出后，推特用戶@歸藏展示了用代碼解析器分析newsletter訂閱用戶數(shù)據(jù)的過程。

代碼解析器從分析數(shù)據(jù)到制圖，都不需要使用任何復(fù)雜軟件，只需要說出：“我想分析最近一個月訂閱用戶增長的趨勢”這類直白的prompt，就可以完成。

除外，人們還能直接用“人話”讓GPT通過數(shù)據(jù)制作一些可視化的GIF圖片。

例如人們?nèi)绻胫谱饕环菝绹鵁羲牡乩韴D標(biāo)，只需要上傳地理位置數(shù)據(jù)，GPT就能通過插件功能，自動制作如下的GIF動圖。

而即使是想通過圖片生成視頻，CodeInterpreter也能手到拈來。在啟用插件后，只需告訴GPT：“我想用這張圖片，制作一段從右往左的平移視頻?！?/p>

GPT就會根據(jù)你的要求，自動將Midjourney生成的圖片做成視頻。

甚至，不怎么有代碼和編程經(jīng)驗(yàn)的人，也能運(yùn)用CodeInterpreter插件，在5分鐘內(nèi)制作一個簡單的游戲。

總地來說，CodeInterpreter包括的功能，涵蓋了打破模態(tài)壁壘，轉(zhuǎn)換素材形態(tài)，進(jìn)行數(shù)據(jù)分析等多種不同的任務(wù)。

而該插件之所以有如此“逆天”的功能，則是因?yàn)槠浯蚱屏俗匀徽Z言和代碼語言之間的壁壘。

有了它，用戶就能刨去復(fù)雜的代碼過程，通過自然語言交互（所謂“人話”），直接完成各種跨領(lǐng)域、跨模態(tài)的任務(wù)。

也正因如此，有人驚呼這種讓模型能力倍增的插件，就是GPT-4.5的到來。

由此，我們便不難理解，為何百度會如此重視插件的發(fā)展。

對于大模型研發(fā)團(tuán)隊(duì)來說，讓一個模型囊括用戶的所有需求是不可能，也不現(xiàn)實(shí)的。因?yàn)樵贏I演化的過程中，用戶必定會產(chǎn)生更多新的，難以預(yù)料的想法、需求。

而這時，一個個多樣化的、靈巧的插件，就成了延申大模型能力的“義體”。

02 插件的百花齊放

除了OpenAI自帶的原生插件之外，當(dāng)下的AI賽道上，還涌現(xiàn)出了其他百花齊放的插件。

此處，我們將做一些簡單的列舉，看看這些功能各異的插件，將對大模型帶來哪些多樣化的擴(kuò)展。

ChatPDF

ChatPDF是一款功能強(qiáng)大的在線PDF工具，用戶只需上傳PDF文件到ChatPDF，ChatPDF便能夠快速使用AI解析PDF文件內(nèi)容，并生成準(zhǔn)確的答案來回答用戶的問題。

除了智能問答功能，ChatPDF還提供了在線編輯、轉(zhuǎn)換和文件壓縮功能。如果用戶想在PDF文件中添加或刪除一些元素，或者更改某些文本或圖像，ChatPDF 的在線編輯功能將會非常有用。

Monica

一個接入了ChatGPT的API接口的網(wǎng)頁側(cè)邊欄插件，啟動該插件后，在瀏覽任何網(wǎng)站時，Monica就能使用ChatGPT的能力，解讀任何信息或文本，或?qū)W(wǎng)頁內(nèi)容進(jìn)行探討，以及提供翻譯等。

值得一提的是，除了ChatGPT之外，Monica還集合了Claued、Bard等其他AI的接口，如果這還不夠，用戶還可以在其接入的AI庫中，自行搜索并添加其他AI工具，從而可以通過不同的AI滿足自己多樣化的需求。

ChatHub

這是一個可以在一個應(yīng)用程序中使用不同的聊天機(jī)器人的插件，目前支持ChatGPT和新的BingChat，并將來會集成Google Bard等更多聊天機(jī)器人。用戶可以同時與多個聊天機(jī)器人進(jìn)行交流，輕松比較它們的答案。

NoteGPT

這是一個使用ChatGPT對視頻進(jìn)行總結(jié)的插件。支持在視頻網(wǎng)站上一鍵截屏和記錄筆記。

啟動該插件后，面對某些時長較長的視頻時，用戶就可以快速地用ChatGPT獲取視頻內(nèi)容的關(guān)鍵信息，并生成摘要和總結(jié)，同時還可以在觀看視頻時一鍵截屏或記錄帶有時間戳的筆記。

智星AI助手

這是國內(nèi)首款支持插件的AI認(rèn)知模型產(chǎn)品，智星AI當(dāng)前已接入7個插件，包括天氣查詢、Bing搜索、Wolfram等，可以快速提供實(shí)時天氣信息，解答高等數(shù)學(xué)問題，進(jìn)行深度金融分析等。

相較而言，ChatGPT每次只能使用3個插件，而智星AI使用時沒有插件數(shù)量限制。

WPSAI

相當(dāng)于是國內(nèi)版的Microsoft365 Copilot，具備縮寫、擴(kuò)寫、續(xù)寫、轉(zhuǎn)變寫作風(fēng)格、總結(jié)概括文章要點(diǎn)，快速生成PPT大綱、一鍵制作PPT模板，智能化處理Excel表格等功能，并擁有語音交互新特性，可以在手機(jī)等小屏終端上進(jìn)行移動辦公。

03 插件里的雄心

除了上述種類各異的第三方插件功能外，各大科技巨頭在插件方向上，也呈現(xiàn)出了一種蓄勢待發(fā)的態(tài)勢。

例如，MicrosoftAI 插件平臺，就提供了一系列的工具和服務(wù)，讓開發(fā)者可以利用微軟的的ChatGPT和新必應(yīng)，創(chuàng)建和部署各種AI插件，包括能力模型類、數(shù)據(jù)類、應(yīng)用類等。其插件跨越了多個場景和產(chǎn)品，如Dynamics 365、Microsoft 365等。

而在國內(nèi)方面，百度也推出了號稱讓人人可開發(fā)AI插件的「靈境矩陣」平臺，試圖以文心一言為基礎(chǔ)，構(gòu)建一個龐大的插件生態(tài)。

而這種大布局的背后，至少顯露了巨頭們在兩方面的意圖：1、以插件為突破口，打通大規(guī)模商業(yè)化的路徑；2、以龐大的插件生態(tài)，構(gòu)筑類似英偉達(dá)的CUDA那樣的軟件壁壘。

關(guān)于第一點(diǎn)，為何大模型+插件模式，極有可能是AI大規(guī)模商業(yè)化的答案？

理由其實(shí)很簡單，此前的大模型，無論是AI生文、作圖，其賦能領(lǐng)域都只能局限在單一的、狹窄的范圍內(nèi)。

某個大模型也許寫作水平不錯，但它在現(xiàn)實(shí)中，該如何解決商品對比、財務(wù)分析這樣多門類的、具體的任務(wù)呢？

人們在生活中的需求是多樣化、多層次的，從這個角度上說，當(dāng)大模型打破了單一模態(tài)的限制，并滿足了這種多樣化需求的時候，就是其真正大規(guī)模商業(yè)化落地的開始。

而一個個外接的插件功能，就相當(dāng)于是大模型的？“眼”和“手”，讓其不再局限于單一領(lǐng)域、模態(tài)的范圍。

在未來，用戶可能只需要一個大模型入口，就能完成諸如訂票、點(diǎn)餐、叫外賣等任務(wù)。

而這也引出了第二點(diǎn)，即以插件為主的生態(tài)壁壘。

在當(dāng)下的大模型賽道上，盡管國內(nèi)外衍生的AI應(yīng)用已不勝枚舉，當(dāng)其中有相當(dāng)一部分，仍然是基于ChatGPT的“套殼”產(chǎn)品。

這樣的現(xiàn)實(shí)，也從一個側(cè)面反映出：在大模型的選擇上，大部分開發(fā)者和用戶，仍然只認(rèn)最強(qiáng)的幾個頭部產(chǎn)品。

著名投資機(jī)構(gòu)A16Z上月公布的流量前50的AI網(wǎng)站，其中相當(dāng)一部分是“套殼”應(yīng)用

換句話說，對于大模型，用戶只要遇到了一個最好用的，就不太會再用其他的。

在這樣的邏輯之下，眾多企業(yè)若是不想陷入重復(fù)造輪子的境地，最好的選擇必然是將重心轉(zhuǎn)向應(yīng)用端。

而歷史的經(jīng)驗(yàn)表明，在軟件、應(yīng)用端的競爭上，誰能為開發(fā)者提供一個低門檻的，友好的開發(fā)環(huán)境，誰就能率先建立起自身的生態(tài)壁壘。

在這方面，英偉達(dá)的CUDA可以說是做了一個極好的表率。

經(jīng)過持續(xù)的演進(jìn)，CUDA已然形成了一個豐富而成熟的龐大生態(tài)。英偉達(dá)也由此實(shí)現(xiàn)了軟硬件深度捆綁：用他的軟件就必須買他的硬件，買他的硬件使用CUDA可事半功倍。

而目前各大巨頭們在插件上的爭相布局，也頗與英偉達(dá)的CUDA有異曲同工之妙：開發(fā)者或用戶若想實(shí)現(xiàn)低門檻、快捷的AI應(yīng)用開發(fā)，就必須基于其大模型的能力。

反過來，應(yīng)用生態(tài)的繁榮，又會強(qiáng)化人們對其大模型的仰賴。

而誰若率先實(shí)現(xiàn)了這樣與應(yīng)用相互促進(jìn)，相輔相成的生態(tài)，誰就將有可能在AI時代率先豎立起自身的生態(tài)的壁壘。