正在閱讀:

微軟又投了一家大模型公司:“法國版OpenAI”剛剛發(fā)布新模型,對標GPT-4

掃一掃下載界面新聞APP

微軟又投了一家大模型公司:“法國版OpenAI”剛剛發(fā)布新模型,對標GPT-4

考慮到微軟投的另一家大模型OpenAI 就經(jīng)歷了從開源到閉源的轉(zhuǎn)移,不禁讓人遐想,同樣接受了微軟投資的Mistral AI,會不會走OpenAI的老路?

圖片來源:界面新聞| 匡達

文|烏鴉智能說  

昨晚,被稱為“法國版 OpenAI”的Mistral AI,發(fā)布了其最新的頂級文本生成模型 Mistral Large。相比此前的模型,這次 Mistral AI 發(fā)布的版本性能更強,甚至直接對標OpenAI 的 GPT-4。

在發(fā)布最新模型的同時,Mistral Large還宣布,與微軟達成深度合作。據(jù)外媒報道,微軟收購了少數(shù) Mistral AI 的股權(quán)。

這意味著,Mistral AI成為繼OpenAI后,微軟投資的第二家大模型公司,而Mistral AI 也將獲得 OpenAI 同等待遇,直接將模型資源放在微軟云當中售賣。

不過令人詫異的是,以開源公司出道的 Mistral AI ,此次并沒有將這款新旗艦?zāi)P烷_源。這也引發(fā)了外界對其模型路線改變的諸多猜想。

/ 01 / Mistral AI發(fā)布最新大模型,對標GPT-4

Mistral Large 是 Mistral AI 的最新旗艦版,特點是具備頂級的的推理能力,可用于處理復(fù)雜的多語言推理任務(wù),涵蓋文本理解、轉(zhuǎn)換和代碼生成等。

從官方披露的信息看,Mistral Large 在多項基準測試中表現(xiàn)優(yōu)異,并取得了81.2%的好成績,僅次于 GPT-4,并將Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B等其他主流模型甩在身后。與此同時,Mistral Large還 具有以下特點:

32K 的上下文窗口,精準提取大型文檔信息。

在英語、法語、西班牙語、德語和意大利語方面具有天然的流利度,對語法和文化背景有細膩的理解。

精確的指令跟隨能力,便于開發(fā)者定制審核策略。

支持函數(shù)調(diào)用和輸出模式限制,助力應(yīng)用開發(fā)規(guī)?;图夹g(shù)?,F(xiàn)代化。

在 MMLU、Hellas、WinoG 等多項常識和推理的基準測試中,Mistral Large 緊隨 GPT-4 之后,遠超其他模型。

多語言能力方面,Mistral Large在法語、德語、西班牙語和意大利語的 HellaSwag、Arc Challenge 和MMLU 基準測試中,表現(xiàn)大幅優(yōu)于 LLaMA 2 70B。

在編碼和數(shù)學(xué)任務(wù)中,Mistral Large 同樣表現(xiàn)出色。多項基準測試依然是遙遙領(lǐng)先。

從定價上看,Mistral Large的定價略低于GPT-4 ,其在 Azure AI 上的定價如下:

輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定價為:輸出為 0.03 美元/1000 token,輸入 0.01 美元/ 1000 token。

值得一提的是,在發(fā)布Mistral Large的同時,Mistral AI還發(fā)布了針對延遲和成本優(yōu)化的新模型Mistral Small,性能超越 Mixtral 8x7B,但延遲更低。Mistral AI 認為,Mistral Small 將成為介于開源模型和旗艦?zāi)P椭g的理想選擇。

目前,Mistral Large 已經(jīng)可以在 La Plateforme 和 Azure 平臺上使用,并集成到了 Le Chat 中。Le Chat是一個類似 ChatGPT 的 AI 聊天機器人,支持多語言交流。用戶可以在 Mistral Small、Mistral Large 以及 Mistral Next 三種不同的模型之間進行選擇。但目前Le Chat 仍然不支持實時聯(lián)網(wǎng)功能。

/ 02 / 微軟拿下“法國版 OpenAI”

在Mistral Large發(fā)布的同時,還有一則重磅消息曝出:繼OpenAI之后,微軟將Mistral也納入麾下,成為第二家在微軟 Azure 云計算平臺上提供商業(yè)語言模型的公司。

與OpenAI類似,Mistral也頗具傳奇色彩。Mistral AI 公司成立于 2023 年 5 月,總部位于法國巴黎,是大模型領(lǐng)域為數(shù)不多的歐洲選手。

Mistral AI 在 2023 年 9 月推出開源的 7B 模型,一度引爆了整個開源社區(qū)。原因在于,Mixtral 8x7B雖然只有 46.7B 的參數(shù)規(guī)模, 但在眾多基準測試中的表現(xiàn)卻能與 Llama 2 70B 和 GPT-3.5 媲美,甚至在某些測試中還略勝一籌。這也讓Mistral AI 成為開源、小模型領(lǐng)域的“尖子生”。

Mistral AI的團隊構(gòu)成很簡單,以年輕科學(xué)家為主,目前人數(shù)大概有數(shù)十人,其中管理層總共四人:

CEO Arthur Mensch 來自 Deepmind,參與了 Deepmind 的多個經(jīng)典的模型:Flamingo、Chinchilla、Gopher。CTO 和 首席科學(xué)家分別是 Llama & Llama2 的核心工程、研究角色。Chief Business Officer Florian 則由創(chuàng)始顧問,Alan 的 CEO 推薦加入。

算上這次融資,Mistral 已完成了三輪公開融資,總額超過6億美元,估值已經(jīng)超過20億美元。

2023 年 6 月,公司完成 1.05 億歐元(約合 1.13 億美元)的種子輪融資,由 Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投,投后估值 2.4 億歐元;

2023 年 12 月,Mistral 完成由 Andreessen Horowitz(a16z)領(lǐng)投,英偉達、Salesforce、法國巴黎銀行、美國風投機構(gòu) General Catalyst 等投資的 3.85 億歐元(約合 4.15 億美元)融資。

微軟對外證實了此次對Mistral AI 的投資,但表示不持有該公司的股權(quán)。此前,這家科技巨頭因向 OpenAI 提供巨額資金而受到歐洲和美國監(jiān)管機構(gòu)的審查。根據(jù)公告,微軟與 Mistral AI 的合作主要集中在三個核心領(lǐng)域:

超算基礎(chǔ)設(shè)施:微軟將通過 Azure AI 超級計算基礎(chǔ)設(shè)施支持 Mistral AI ,為 Mistral AI 旗艦?zāi)P偷?AI 訓(xùn)練和推理工作負載提供一流的性能和規(guī)模;

市場推廣:微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機器學(xué)習(xí)模型目錄中的模型即服務(wù)(MaaS)向客戶提供 Mistral AI 的高級模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業(yè)模型。

人工智能研發(fā):微軟和 Mistral AI 將探索為特定客戶訓(xùn)練特定目的模型的合作。

隨著與微軟合作的達成,不僅將有助于 Mistral AI 將自己的模型推向市場,也讓其有機會使用 Azure 的尖端 AI 基礎(chǔ)設(shè)施,以加速其下一代大型語言模型的開發(fā)和部署。

/ 03 / 從開源到閉源?

自成立以來,Mistral AI一直走的是開源路線,也曾在各種采訪中反復(fù)強調(diào)開源的重要性。

在Mistral AI CEO Arthur Mensch此前的采訪中明確表示,和閉源模型相比,開源的確更符合考慮到企業(yè)私有化使用模型的需求,并且開源模型能力也會逐步升級從而滿足更多需求。Arthur 在訪談中還提到,開源也能夠讓模型受到公眾監(jiān)督、更加安全。

而Mistral AI在2023年春天向投資者提出的最初方案中,批評了由美國公司主導(dǎo)的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。對于Mensch和他的合伙人來說,將他們的初始AI系統(tǒng)作為開源軟件發(fā)布,允許任何人免費使用或修改,這是一個重要的原則。

但有趣的是,這次以開源公司出道的 Mistral AI ,并沒有將這款新旗艦?zāi)P烷_源。不僅如此,有細心的網(wǎng)友發(fā)現(xiàn),新模型發(fā)布后,Mistral AI 官網(wǎng)還悄悄把所有有關(guān)開源社區(qū)義務(wù)的內(nèi)容全部刪了。

考慮到微軟投的另一家大模型OpenAI 就經(jīng)歷了從開源到閉源的轉(zhuǎn)移,不禁讓人遐想,同樣接受了微軟投資的Mistral AI,會不會走OpenAI的老路?

對此,Mistral CEO Mensch在接受《華爾街日報》采訪時回應(yīng)稱,Mistral AI 并未違背開源的初衷,而是采用同時推進商業(yè)化戰(zhàn)略和維持開源承諾的雙重策略。

“顯然,在構(gòu)建商業(yè)模式和保持我們的開源價值觀之間,我們需要找到一個細小的平衡點。我們希望發(fā)明新事物和新的架構(gòu),同時也希望向我們的客戶提供更多可銷售的產(chǎn)品?!?/p>

進入閉源模型,意味著Mistral AI將面臨更多的競爭,尤其是來自O(shè)penAI的挑戰(zhàn)。在Scaling Law的推動下,OpenAI在閉源模型上的優(yōu)勢越來越大,就連谷歌也毫無招架之力。而這顯然是接下來Mistral AI需要面對的事情。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。

OpenAI

  • 阿里云通義開源首個多模態(tài)推理模型QVQ
  • OpenAI已討論開發(fā)一款人形機器人

微軟

5.4k
  • 微軟據(jù)悉致力于在365 Copilot產(chǎn)品中添加非OpenAI模型
  • 微軟據(jù)悉為新的AI健康部門挖來多名DeepMind員工

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

微軟又投了一家大模型公司:“法國版OpenAI”剛剛發(fā)布新模型,對標GPT-4

考慮到微軟投的另一家大模型OpenAI 就經(jīng)歷了從開源到閉源的轉(zhuǎn)移,不禁讓人遐想,同樣接受了微軟投資的Mistral AI,會不會走OpenAI的老路?

圖片來源:界面新聞| 匡達

文|烏鴉智能說  

昨晚,被稱為“法國版 OpenAI”的Mistral AI,發(fā)布了其最新的頂級文本生成模型 Mistral Large。相比此前的模型,這次 Mistral AI 發(fā)布的版本性能更強,甚至直接對標OpenAI 的 GPT-4。

在發(fā)布最新模型的同時,Mistral Large還宣布,與微軟達成深度合作。據(jù)外媒報道,微軟收購了少數(shù) Mistral AI 的股權(quán)。

這意味著,Mistral AI成為繼OpenAI后,微軟投資的第二家大模型公司,而Mistral AI 也將獲得 OpenAI 同等待遇,直接將模型資源放在微軟云當中售賣。

不過令人詫異的是,以開源公司出道的 Mistral AI ,此次并沒有將這款新旗艦?zāi)P烷_源。這也引發(fā)了外界對其模型路線改變的諸多猜想。

/ 01 / Mistral AI發(fā)布最新大模型,對標GPT-4

Mistral Large 是 Mistral AI 的最新旗艦版,特點是具備頂級的的推理能力,可用于處理復(fù)雜的多語言推理任務(wù),涵蓋文本理解、轉(zhuǎn)換和代碼生成等。

從官方披露的信息看,Mistral Large 在多項基準測試中表現(xiàn)優(yōu)異,并取得了81.2%的好成績,僅次于 GPT-4,并將Claude 2、Gemini Pro、GPT-3.5、Llama 2-70B等其他主流模型甩在身后。與此同時,Mistral Large還 具有以下特點:

32K 的上下文窗口,精準提取大型文檔信息。

在英語、法語、西班牙語、德語和意大利語方面具有天然的流利度,對語法和文化背景有細膩的理解。

精確的指令跟隨能力,便于開發(fā)者定制審核策略。

支持函數(shù)調(diào)用和輸出模式限制,助力應(yīng)用開發(fā)規(guī)?;图夹g(shù)棧現(xiàn)代化。

在 MMLU、Hellas、WinoG 等多項常識和推理的基準測試中,Mistral Large 緊隨 GPT-4 之后,遠超其他模型。

多語言能力方面,Mistral Large在法語、德語、西班牙語和意大利語的 HellaSwag、Arc Challenge 和MMLU 基準測試中,表現(xiàn)大幅優(yōu)于 LLaMA 2 70B。

在編碼和數(shù)學(xué)任務(wù)中,Mistral Large 同樣表現(xiàn)出色。多項基準測試依然是遙遙領(lǐng)先。

從定價上看,Mistral Large的定價略低于GPT-4 ,其在 Azure AI 上的定價如下:

輸出為 0.024 美元 / 1000 token,輸入為 0.008 美元 / 1000 token。相比之下,128K 上下文窗口的 GPT-4 Turbo 定價為:輸出為 0.03 美元/1000 token,輸入 0.01 美元/ 1000 token。

值得一提的是,在發(fā)布Mistral Large的同時,Mistral AI還發(fā)布了針對延遲和成本優(yōu)化的新模型Mistral Small,性能超越 Mixtral 8x7B,但延遲更低。Mistral AI 認為,Mistral Small 將成為介于開源模型和旗艦?zāi)P椭g的理想選擇。

目前,Mistral Large 已經(jīng)可以在 La Plateforme 和 Azure 平臺上使用,并集成到了 Le Chat 中。Le Chat是一個類似 ChatGPT 的 AI 聊天機器人,支持多語言交流。用戶可以在 Mistral Small、Mistral Large 以及 Mistral Next 三種不同的模型之間進行選擇。但目前Le Chat 仍然不支持實時聯(lián)網(wǎng)功能。

/ 02 / 微軟拿下“法國版 OpenAI”

在Mistral Large發(fā)布的同時,還有一則重磅消息曝出:繼OpenAI之后,微軟將Mistral也納入麾下,成為第二家在微軟 Azure 云計算平臺上提供商業(yè)語言模型的公司。

與OpenAI類似,Mistral也頗具傳奇色彩。Mistral AI 公司成立于 2023 年 5 月,總部位于法國巴黎,是大模型領(lǐng)域為數(shù)不多的歐洲選手。

Mistral AI 在 2023 年 9 月推出開源的 7B 模型,一度引爆了整個開源社區(qū)。原因在于,Mixtral 8x7B雖然只有 46.7B 的參數(shù)規(guī)模, 但在眾多基準測試中的表現(xiàn)卻能與 Llama 2 70B 和 GPT-3.5 媲美,甚至在某些測試中還略勝一籌。這也讓Mistral AI 成為開源、小模型領(lǐng)域的“尖子生”。

Mistral AI的團隊構(gòu)成很簡單,以年輕科學(xué)家為主,目前人數(shù)大概有數(shù)十人,其中管理層總共四人:

CEO Arthur Mensch 來自 Deepmind,參與了 Deepmind 的多個經(jīng)典的模型:Flamingo、Chinchilla、Gopher。CTO 和 首席科學(xué)家分別是 Llama & Llama2 的核心工程、研究角色。Chief Business Officer Florian 則由創(chuàng)始顧問,Alan 的 CEO 推薦加入。

算上這次融資,Mistral 已完成了三輪公開融資,總額超過6億美元,估值已經(jīng)超過20億美元。

2023 年 6 月,公司完成 1.05 億歐元(約合 1.13 億美元)的種子輪融資,由 Lightspeed Venture Partners(光速創(chuàng)投)領(lǐng)投,投后估值 2.4 億歐元;

2023 年 12 月,Mistral 完成由 Andreessen Horowitz(a16z)領(lǐng)投,英偉達、Salesforce、法國巴黎銀行、美國風投機構(gòu) General Catalyst 等投資的 3.85 億歐元(約合 4.15 億美元)融資。

微軟對外證實了此次對Mistral AI 的投資,但表示不持有該公司的股權(quán)。此前,這家科技巨頭因向 OpenAI 提供巨額資金而受到歐洲和美國監(jiān)管機構(gòu)的審查。根據(jù)公告,微軟與 Mistral AI 的合作主要集中在三個核心領(lǐng)域:

超算基礎(chǔ)設(shè)施:微軟將通過 Azure AI 超級計算基礎(chǔ)設(shè)施支持 Mistral AI ,為 Mistral AI 旗艦?zāi)P偷?AI 訓(xùn)練和推理工作負載提供一流的性能和規(guī)模;

市場推廣:微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機器學(xué)習(xí)模型目錄中的模型即服務(wù)(MaaS)向客戶提供 Mistral AI 的高級模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業(yè)模型。

人工智能研發(fā):微軟和 Mistral AI 將探索為特定客戶訓(xùn)練特定目的模型的合作。

隨著與微軟合作的達成,不僅將有助于 Mistral AI 將自己的模型推向市場,也讓其有機會使用 Azure 的尖端 AI 基礎(chǔ)設(shè)施,以加速其下一代大型語言模型的開發(fā)和部署。

/ 03 / 從開源到閉源?

自成立以來,Mistral AI一直走的是開源路線,也曾在各種采訪中反復(fù)強調(diào)開源的重要性。

在Mistral AI CEO Arthur Mensch此前的采訪中明確表示,和閉源模型相比,開源的確更符合考慮到企業(yè)私有化使用模型的需求,并且開源模型能力也會逐步升級從而滿足更多需求。Arthur 在訪談中還提到,開源也能夠讓模型受到公眾監(jiān)督、更加安全。

而Mistral AI在2023年春天向投資者提出的最初方案中,批評了由美國公司主導(dǎo)的「正在形成的寡頭壟斷」,這些公司開發(fā)的是專有閉源模型。對于Mensch和他的合伙人來說,將他們的初始AI系統(tǒng)作為開源軟件發(fā)布,允許任何人免費使用或修改,這是一個重要的原則。

但有趣的是,這次以開源公司出道的 Mistral AI ,并沒有將這款新旗艦?zāi)P烷_源。不僅如此,有細心的網(wǎng)友發(fā)現(xiàn),新模型發(fā)布后,Mistral AI 官網(wǎng)還悄悄把所有有關(guān)開源社區(qū)義務(wù)的內(nèi)容全部刪了。

考慮到微軟投的另一家大模型OpenAI 就經(jīng)歷了從開源到閉源的轉(zhuǎn)移,不禁讓人遐想,同樣接受了微軟投資的Mistral AI,會不會走OpenAI的老路?

對此,Mistral CEO Mensch在接受《華爾街日報》采訪時回應(yīng)稱,Mistral AI 并未違背開源的初衷,而是采用同時推進商業(yè)化戰(zhàn)略和維持開源承諾的雙重策略。

“顯然,在構(gòu)建商業(yè)模式和保持我們的開源價值觀之間,我們需要找到一個細小的平衡點。我們希望發(fā)明新事物和新的架構(gòu),同時也希望向我們的客戶提供更多可銷售的產(chǎn)品。”

進入閉源模型,意味著Mistral AI將面臨更多的競爭,尤其是來自O(shè)penAI的挑戰(zhàn)。在Scaling Law的推動下,OpenAI在閉源模型上的優(yōu)勢越來越大,就連谷歌也毫無招架之力。而這顯然是接下來Mistral AI需要面對的事情。

本文為轉(zhuǎn)載內(nèi)容,授權(quán)事宜請聯(lián)系原著作權(quán)人。