文丨游云庭( 上海大邦律師事務所高級合伙人,知識產(chǎn)權律師 )
近日,李開復投資的零一萬物公司被曝出其大模型“Yi”使用了Facebook母公司META的LLaMA大模型(全稱為"Large Language Model META AI")的開源代碼,對外卻沒有提及。套殼卻不說明的做法引來了大量質(zhì)疑。對此,該公司致歉稱:正在各開源平臺重新提交模型及代碼并補充LLaMA協(xié)議副本的流程中。該公司負責人表示公司不存在抄襲問題。今天就來跟大家聊聊,法律上,這種行為算不算抄襲?法律后果還有哪些?
先說結論。我國《著作權法》規(guī)定:署名權,即表明作者身份,在作品上署名的權利。所謂的抄襲,就是侵犯署名權的行為。零一萬物的軟件使用公司的源代碼卻不標來源,讓別人看起來這部分內(nèi)容是他們自己開發(fā)的,確實涉嫌侵犯署名權,也就是涉嫌抄襲。哪怕是他們是疏漏造成的,侵犯署名權也沒跑。至于法律后果,我們要切換一個視角,要從LLaMA的著作權人META公司看,他們被侵了哪些權,就知道了。
一、著作權人META公司的權利
META公司雖然公開了LLaMA2的代碼,但其在軟件協(xié)議中做了多項保留,摘幾點大家看看:
- 制作發(fā)行 LLaMA 材料或任何衍生作品,如果可供第三方使用,應向該第三方提供本協(xié)議的副本。并且公示權利標識:“LLaMA 2 已根據(jù) LLaMA 2 社區(qū)許可證獲得許可,版權所有 (c) META Platforms, Inc. 保留所有權利?!?/li>
- 不得使用將LLaMA用于改進任何其他大型語言模型,但LLaMA 2或其衍生作品除外。
- META對月活7億用戶的授權做了保留。如果被許可人使用LLaMA 2開發(fā)的軟件產(chǎn)品月度活躍用戶超過7億人的,則被許可人應在此前的一個月向META申請代碼許可授權,META有權自行決定是否進行授權,在META授權之前,被授權人無權行使任何權利。
以上條款是否有效?當然有效。LLaMA 2的軟件著作權屬于META,公開源代碼時對權利進行保留,只要不違反法律規(guī)定,也是其合法權利。另外,筆者查了一下,OpenAI 用戶協(xié)議和Claude用戶協(xié)議中均含有不得用其服務改進競爭對手產(chǎn)品的條款,但Google Bard 和文心一言的用戶協(xié)議則沒有此類條款。
因為對授權進行了限制,所以雖然META公開了LLaMa 2的源代碼,但開源軟件機構Open Source并不認為這種做法屬于開源,他們還特地發(fā)了個文章做了個說明:因為開源許可證不應歧視個人、團體或工作領域,而META對 LLaMa 模型和代碼的許可時對月活超過7億用戶的開發(fā)者,以及用LLaMa改進其他大型語言模型做了授權限制,因此不符合開源標準。
二、零一萬物公司有什么法律責任
筆者查了下零一萬物公司的用戶協(xié)議,其并未包含META對LLaMA 2軟件協(xié)議中的限制,其也沒有公示其大模型是使用LLaMA 2的代碼進行了改編(目前已做部分修改)。所以首先涉嫌侵犯署名權,這個前文已述。其次,LLaMA 2的軟件協(xié)議對被授權人授權的前提條件是要公示權利標識:“LLaMA 2已根據(jù)LLaMA 2社區(qū)許可證獲得許可,版權所有 (c) META Platforms, Inc. 保留所有權利?!?/p>
如果沒有公示的,可以視為被授權人沒有滿足授權條件,所以其二次開發(fā)及發(fā)布均涉嫌侵權,二次開發(fā)侵犯META公司的軟件修改權,發(fā)布修改后的源代碼及編譯后的目標程序,則侵犯META公司的軟件信息網(wǎng)絡傳播權。
同時,如果零一萬物公司不承認套殼的,也就不能算LLaMA 2的衍生作品,會同時違反“不得使用將 LLaMA用于改進任何其他大型語言模型,但LLaMA 2或其衍生作品除外”的用戶協(xié)議規(guī)定。
三、使用零一萬物代碼開發(fā)衍生作品者的法律風險
如果第三方開發(fā)者不了解情況,使用了零一萬物公司隱匿來源的代碼做再次開發(fā)的,同樣會因為受零一萬物公司的牽連,面臨侵權法律風險。定性上,零一萬物公司的法律風險,第三方開發(fā)者都有,只是如果不明知,侵權的性質(zhì)就沒有那么嚴重。
對零一萬物公司侵權代碼再次開發(fā)(含三次開發(fā)、四次開發(fā)……)的作品代碼如果包含LLaMA 2代碼的,首先會侵犯META的署名權,其次是META公司的軟件修改權,發(fā)布修改后的源代碼及編譯后的目標程序,則侵犯了META公司的軟件信息網(wǎng)絡傳播權。
LLaMA英文對應的是一種可愛的動物——美洲大羊駝,也就是中國網(wǎng)民俗稱的“草泥馬”。中文俗稱雖然有點粗俗,但LLaMA的軟件協(xié)議雖然對使用有限制,但規(guī)定其實并不嚴厲,如果像筆者之前介紹的《用GitHub上的開源代碼訓練人工智能違法嗎?》一文中提到的,是用了GPL協(xié)議項下的代碼而不標識的,法律風險會更大??傊覀儗_源代碼軟件的態(tài)度應該需要更加嚴謹,要用別人的代碼,就應該遵守別人的開源協(xié)議,否則,不但自己可能侵權,還會連累用你產(chǎn)品開發(fā)衍生產(chǎn)品的人。
(本文僅代表作者觀點。責編郵箱:yanguihua@jiemian.com。)