11 月 27 日消息,據(jù)《南方都市報》今晚報道,字節(jié)跳動起訴前實習生田某某篡改代碼攻擊公司內部模型訓練一案,已獲北京市海淀區(qū)人民法院正式受理。字節(jié)跳動請求法院判令田某某賠償公司侵權損失 800 萬元及合理支出 2 萬元,并公開賠禮道歉。
報道稱,田某某本科畢業(yè)于北京航空航天大學軟件學院,研究生就讀于北京大學,研究興趣為深度學習的優(yōu)化與算法。字節(jié)跳動內部人士表示,之所以此時發(fā)起訴訟,是由于田某某為在讀博士,公司將其辭退后首先交由校方處理。但在事件處理期間,田某某多次對外否認,稱攻擊模型訓練任務的不是自己,而是別的實習生。考慮到田某某完全沒有意識到錯誤,且涉事行為已觸犯公司安全紅線,公司最終決定向法院起訴,以表明公司嚴肅態(tài)度、杜絕類似事件再次發(fā)生。
今年 10 月,業(yè)界消息稱,“某頭部大廠的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據(jù)稱遭到入侵的代碼注入了 8000 多張卡,帶來的損失可能超過千萬美元。”知情人士表示該公司為字節(jié)跳動。

根據(jù)傳聞,某高校的博士在字節(jié)跳動商業(yè)化技術團隊實習,因對團隊資源分配不滿,使用攻擊代碼破壞團隊的模型訓練任務。該田姓實習生利用了 HF 的漏洞,在公司的共享模型里寫入破壞代碼,導致模型的訓練效果忽高忽低,無法產(chǎn)生預期的訓練效果,而且 AML 團隊無法核查原因。但傳聞曝出之后,該實習生還在某微信群里辟謠稱,自己發(fā)完論文后就從字節(jié)跳動離職,這個當口有另一個人鉆漏洞改模型代碼,把鍋扣到自己頭上。
字節(jié)跳動后續(xù)發(fā)布《關于“實習生破壞大模型訓練”的事實澄清》:近期有媒體稱“字節(jié)跳動大模型訓練被實習生攻擊”,經(jīng)公司內部核實,確有商業(yè)化技術團隊實習生發(fā)生嚴重違紀行為,該實習生已被辭退。
- 涉事實習生惡意干擾商業(yè)化技術團隊研究項目的模型訓練任務,但并不影響商業(yè)化的正式項目及線上業(yè)務,也不涉及字節(jié)跳動大模型等其他業(yè)務。
- 網(wǎng)傳“涉及 8000 多卡、損失上千萬美元”嚴重夸大。
- 經(jīng)核實,涉事人一直在商業(yè)化技術團隊實習,并沒有 AI Lab 實習經(jīng)歷。其社交媒體個人簡介及部分媒體報道有誤。