界面新聞記者 | 慕澤
11月2日晚間,知名私募巨頭幻方量化宣布,公司旗下的DeepSeek已經(jīng)發(fā)布第一代大模型DeepSeed Coder,免費商用,完全開源。
據(jù)介紹,DeepSeek Coder已開源1B,7B,33B 全系列模型,包含Base模型和指令調(diào)優(yōu)模型。在國際權(quán)威數(shù)據(jù)集HumanEval編程多語言測試上,DeepSeek Coder在各個語言上的表現(xiàn)都領(lǐng)先已有的開源模型。
與之前最好的開源大模型CodeLlama相比,DeepSeek Coder在代碼生成任務(wù)上(使用標(biāo)準(zhǔn)數(shù)據(jù)集HumanEval、MBPP和DS-1000進(jìn)行評測)分別領(lǐng)先 9.3%、10.8% 和 5.9%。其中DeepSeek Coder的70億參數(shù)版本在代碼能力上達(dá)到了CodeLlama的340億參數(shù)水平。經(jīng)過指令調(diào)優(yōu)后的DeepSeek Coder模型更是全面超越了GPT3.5-Turbo。
除了代碼能力以外,DeepSeek Coder也展現(xiàn)了極強(qiáng)的數(shù)學(xué)和推理能力,不通過任何指令微調(diào),在數(shù)學(xué)推理評測上展現(xiàn)了極佳的性能。
此前,幻方量化曾在4月中旬宣布將集中資源和力量,全力投身到服務(wù)于全人類共同利益的人工智能技術(shù)之中,成立新的獨立的研究組織探索AGI的本質(zhì)。
隨后,北京深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡稱“北京深度求索”)和杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司(以下簡稱“杭州深度求索”)分別于5月中旬和7月中旬成立。
天眼查APP數(shù)據(jù)顯示,截至目前,北京深度求索由杭州深度求索100%控股,而幻方量化的實際控制人梁文鋒在杭州深度求索最終受益的股份比例達(dá)84.29%。
幻方量化是國內(nèi)最為知名的量化私募巨頭之一,旗下?lián)碛姓憬耪沦Y產(chǎn)和寧波幻方量化兩大百億私募平臺,目前總管理規(guī)模超過400億元。
事實上,幻方量化在AI領(lǐng)域布局已久。公開資料顯示,早在2016年10月公司第一個由深度學(xué)習(xí)算法模型生成的股票倉位便已上線實盤交易,至2017年底公司幾乎所有的量化策略都已經(jīng)采用AI模型計算。2019年12月,幻方AI即杭州幻方人工智能基礎(chǔ)研究有限公司正式成立,致力于AI的算法與基礎(chǔ)應(yīng)用研究,隨后公司斥巨資打造的「螢火一號」和「螢火二號」陸續(xù)交付。
今年4月幻方量化宣布成立新的獨立的研究組織探索AGI的本質(zhì)時,一度被外界解讀為要用AI來炒股,不過相關(guān)猜想隨后被幻方量化CEO陸政哲否認(rèn)。陸政哲回應(yīng)稱,“我們探索AGI不是用來炒股的,是做GTP相關(guān)的大模型,與金融無關(guān)。我們獨立于投資新成立了一個團(tuán)隊,相當(dāng)于二次創(chuàng)業(yè),從事的是科技方向,只是大家習(xí)慣把我們局限在投資領(lǐng)域?!?/p>
如今,DeepSeek Coder大模型的發(fā)布,意味著幻方量化探索AGI本質(zhì)的計劃在官宣半年之后已經(jīng)取得了階段性的成果。不過,幻方量化在這條路上最終究竟能夠走到哪里,目前尚未可知。
值得一提的是,除了在大模型領(lǐng)域的進(jìn)展以外,近期幻方量化還有其他兩件事引起了市場的關(guān)注。
其一是作為公司股東之一的徐進(jìn)被爆出“婚外情”風(fēng)波,對此幻方量化發(fā)布情況說明稱,公司團(tuán)隊成員徐進(jìn)對于個人家庭事務(wù)處理不當(dāng),引發(fā)負(fù)面輿論,對公司聲譽(yù)造成不良影響。經(jīng)團(tuán)隊討論,決定對徐進(jìn)作出停職處理。以上處理決定不影響公司基金正常運作。
其二是有消息稱“當(dāng)前幻方量化已經(jīng)暫停渠道募資”。對此,幻方量化市場人士曾回應(yīng)稱,幻方量化當(dāng)前的基金管理規(guī)模是400多億元,這個規(guī)模目前來看是策略比較合適的規(guī)模。