正在閱讀:

字節(jié)跳動大模型訓練被實習生攻擊,涉事者已被辭退

掃一掃下載界面新聞APP

字節(jié)跳動大模型訓練被實習生攻擊,涉事者已被辭退

界面新聞從知情人士處獲悉,此事發(fā)生在今年6月,起因是某高校的博士在字節(jié)跳動商業(yè)化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。

攝影:曾宇

界面新聞記者 | 肖芳

界面新聞編輯 | 文姝琪

10月18日,多個微信群流傳一則消息某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據(jù)稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。

界面新聞知情人士獲悉頭部大廠字節(jié)跳動。此事發(fā)生今年6月,起因高校博士字節(jié)跳動商業(yè)化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。

界面新聞字節(jié)跳動方面求證此事截至目前,官方進行回應

傳聞顯示,該田姓實習生利用了HF(huggingface的漏洞,在公司的共享模型里寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且AML團隊無法核查原因。但傳聞曝出之后,實習生還在某微信群里辟謠,自己發(fā)論文就從字節(jié)跳動離職這個當口有另一個人鉆漏洞改模型代碼,扣到自己頭上。

界面新聞知情人士了解,字節(jié)跳動內部已經調查明確此事田姓實習生所為。目前,該實習生已被辭退,字節(jié)跳動同時此事同步給陽光誠信聯(lián)盟和企業(yè)反舞弊聯(lián)盟,以及實習生所在學校。這名實習生被辭退后到處“辟謠”甩鍋,稱是其他人所為。

實習生攻擊并不是豆包大模型,而是商業(yè)化技術團隊的模型訓練任務,影響了技術團隊一些業(yè)務進展整體公司造成損失并沒有傳聞超過千萬美元那么大。

一位技術安全專家告訴界面新聞,HF漏洞產生肯定是單一性集中訓練,此事暴露字節(jié)跳動技術訓練存在安全管理問題。公司既沒做權限隔離,沒有做好共用代碼的審計。正常情況,每次大的代碼變動必須做審計無論誰做操作都有痕跡記錄,一個人想動代碼是不可能

上述技術安全專家表示,目前行業(yè)通用做法級隔離導向性部署,每一級只有鏡像,每次先掃描。調用按次算、必須密鑰。每一級完成后,才能進入下一級,而上一級自動刪除,進行分級訓練。

未經正式授權嚴禁轉載本文,侵權必究。

字節(jié)跳動

4.7k
  • 字節(jié)跳動據(jù)悉考慮在泰國新建數(shù)據(jù)中心
  • 字節(jié)跳動回應“實習生破壞大模型訓練”傳聞

評論

暫無評論哦,快來評價一下吧!

下載界面新聞

微信公眾號

微博

字節(jié)跳動大模型訓練被實習生攻擊,涉事者已被辭退

界面新聞從知情人士處獲悉,此事發(fā)生在今年6月,起因是某高校的博士在字節(jié)跳動商業(yè)化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。

攝影:曾宇

界面新聞記者 | 肖芳

界面新聞編輯 | 文姝琪

10月18日,多個微信群流傳一則消息某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據(jù)稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。

界面新聞知情人士獲悉,頭部大廠字節(jié)跳動。此事發(fā)生今年6月,起因高校博士字節(jié)跳動商業(yè)化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。

界面新聞字節(jié)跳動方面求證此事,截至目前,官方進行回應。

傳聞顯示該田姓實習生利用了HF(huggingface的漏洞,在公司的共享模型里寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產生預期的訓練效果,而且AML團隊無法核查原因。但傳聞曝出之后,實習生還在某微信群里辟謠自己發(fā)論文就從字節(jié)跳動離職,這個當口有另一個人鉆漏洞改模型代碼,扣到自己頭上

界面新聞知情人士了解,字節(jié)跳動內部已經調查明確此事田姓實習生所為。目前,該實習生已被辭退,字節(jié)跳動同時此事同步給陽光誠信聯(lián)盟和企業(yè)反舞弊聯(lián)盟,以及實習生所在學校。這名實習生被辭退后到處“辟謠”甩鍋,稱是其他人所為。

實習生攻擊并不是豆包大模型,而是商業(yè)化技術團隊的模型訓練任務,影響了技術團隊一些業(yè)務進展,整體公司造成損失并沒有傳聞超過千萬美元那么大。

一位技術安全專家告訴界面新聞HF漏洞產生肯定是單一性集中訓練,此事暴露字節(jié)跳動技術訓練存在安全管理問題。公司既沒做權限隔離沒有做好共用代碼的審計。正常情況每次大的代碼變動必須做審計,無論誰做操作都有痕跡記錄,一個人想動代碼是不可能

上述技術安全專家表示,目前行業(yè)通用做法級隔離導向性部署,每一級只有鏡像,每次先掃描。調用按次算、必須密鑰。每一級完成后,才能進入下一級,而上一級自動刪除,進行分級訓練。

未經正式授權嚴禁轉載本文,侵權必究。