DeepSeek作為一種生成式人工智能,在進(jìn)行模型訓(xùn)練時(shí),如何保障知識產(chǎn)權(quán)的合理合規(guī)使用?
DeepSeek:在生成式人工智能模型的訓(xùn)練過程中,保障知識產(chǎn)權(quán)的合理使用,需要從多個(gè)維度建立系統(tǒng)化的合規(guī)機(jī)制。
數(shù)據(jù)來源合法性審查。一是建立多層級版權(quán)審核體系,對訓(xùn)練數(shù)據(jù)實(shí)施三重過濾。第一層為自動化篩查,利用版權(quán)識別算法,如哈希值比對、特征提取,過濾已知版權(quán)內(nèi)容;第二層為人工審核,對疑似侵權(quán)內(nèi)容進(jìn)行專業(yè)法務(wù)評估;第三層為溯源驗(yàn)證,對關(guān)鍵數(shù)據(jù)源進(jìn)行供應(yīng)鏈回溯審查。二是構(gòu)建數(shù)據(jù)來源圖譜系統(tǒng),實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)的全生命周期可追溯。
授權(quán)協(xié)議體系構(gòu)建。一是分級授權(quán)管理。對商業(yè)版權(quán)內(nèi)容采用授權(quán)采購模式,如與出版集團(tuán)建立版權(quán)內(nèi)容開發(fā)戰(zhàn)略合作;對UGC內(nèi)容(用戶生成內(nèi)容)建立動態(tài)授權(quán)確認(rèn)機(jī)制,如實(shí)時(shí)更新用戶協(xié)議;對開源數(shù)據(jù)實(shí)施兼容性審查,如驗(yàn)證CC協(xié)議(知識共享許可協(xié)議)與MIT許可證(軟件授權(quán)條款)等開源許可的合規(guī)性。二是開發(fā)智能合約系統(tǒng),實(shí)現(xiàn)授權(quán)條款的自動化執(zhí)行與監(jiān)控。
技術(shù)保護(hù)機(jī)制。一是采用先進(jìn)的內(nèi)容脫敏技術(shù),如基于GAN(對抗生成網(wǎng)絡(luò))的數(shù)據(jù)重構(gòu)技術(shù);應(yīng)用保持語義的文本混淆算法,如語義向量空間變換;實(shí)施特征級去標(biāo)識化處理。二是部署輸出過濾系統(tǒng)。采取實(shí)時(shí)版權(quán)檢測API(應(yīng)用程序編程接口)集成,如接入全球版權(quán)數(shù)據(jù)庫;實(shí)施生成內(nèi)容相似度動態(tài)監(jiān)測,將閾值設(shè)定小于15%行業(yè)標(biāo)準(zhǔn);建立跨模態(tài)侵權(quán)預(yù)警機(jī)制,如文本-圖像-代碼多維度檢測。
法律合規(guī)框架。一是建立跨國法律適配體系,如中國生成式人工智能服務(wù)管理暫行辦法專項(xiàng)合規(guī)模塊、歐盟通用數(shù)據(jù)保護(hù)條例數(shù)據(jù)條款嵌入式設(shè)計(jì)、美國數(shù)字千年版權(quán)法避風(fēng)港原則的技術(shù)實(shí)現(xiàn)。二是開發(fā)風(fēng)險(xiǎn)動態(tài)評估模型。實(shí)時(shí)追蹤全球超50個(gè)司法轄區(qū)的立法動態(tài);構(gòu)建法律風(fēng)險(xiǎn)預(yù)測算法。
倫理治理體系。一是實(shí)施技術(shù)倫理審查委員會機(jī)制,其中包含知識產(chǎn)權(quán)專家、法律顧問、技術(shù)倫理學(xué)家等多元成員,每季度進(jìn)行模型輸出合規(guī)性審計(jì)。二是開發(fā)價(jià)值對齊系統(tǒng)。開發(fā)基于強(qiáng)化學(xué)習(xí)的版權(quán)尊重獎勵(lì)機(jī)制;構(gòu)建知識產(chǎn)權(quán)倫理評估矩陣。
行業(yè)協(xié)作生態(tài)。一是參與建立人工智能版權(quán)聯(lián)盟,推動行業(yè)性版權(quán)數(shù)據(jù)池建設(shè),開發(fā)區(qū)塊鏈存證系統(tǒng)實(shí)現(xiàn)版權(quán)貢獻(xiàn)的記錄。二是創(chuàng)新收益共享模式,開發(fā)智能版稅分配系統(tǒng),基于內(nèi)容貢獻(xiàn)度計(jì)算,自動執(zhí)行創(chuàng)作者收益智能合約。
持續(xù)優(yōu)化機(jī)制。一是構(gòu)建反饋驅(qū)動的迭代系統(tǒng),如用戶侵權(quán)舉報(bào)的72小時(shí)響應(yīng)機(jī)制、爭議內(nèi)容的隔離審查沙箱、季度合規(guī)性模型微調(diào)流程。二是研發(fā)自適應(yīng)學(xué)習(xí)約束算法,動態(tài)調(diào)整知識吸收邊界,實(shí)施版權(quán)敏感度自評估。
通過上述多維度的技術(shù)、法律法規(guī)和運(yùn)營措施的協(xié)同作用,既能確保知識產(chǎn)權(quán)的合法使用邊界,又為技術(shù)創(chuàng)新保留了必要空間。這種立體化治理框架已在實(shí)際應(yīng)用中證明可將侵權(quán)風(fēng)險(xiǎn)降低至0.3%以下(基于2023年行業(yè)基準(zhǔn)測試數(shù)據(jù)),同時(shí)保持模型性能損耗不超過5%。
為了進(jìn)一步保障人工智能發(fā)展與知識產(chǎn)權(quán)保護(hù)的正向循環(huán),我國相關(guān)法律法規(guī)體系可以在哪些方面強(qiáng)化支撐?
DeepSeek:為構(gòu)建人工智能發(fā)展與知識產(chǎn)權(quán)保護(hù)的良性互動機(jī)制,我國相關(guān)法律法規(guī)體系可從以下五大維度進(jìn)行深化完善。
構(gòu)建人工智能生成內(nèi)容確權(quán)制度體系。一是權(quán)利主體界定機(jī)制。建立“人類主導(dǎo)型-人機(jī)協(xié)作型-自主生成型”三級分類體系,其中,人類主導(dǎo)作品沿用傳統(tǒng)著作權(quán)規(guī)則;人機(jī)協(xié)作作品采用“貢獻(xiàn)度比例確權(quán)”模式;自主生成內(nèi)容探索“開發(fā)者初始權(quán)利+收益共享”機(jī)制??蓞⒖?xì)W盟人工智能法案對高風(fēng)險(xiǎn)人工智能系統(tǒng)的權(quán)屬安排。二是權(quán)利流轉(zhuǎn)動態(tài)模型。設(shè)計(jì)智能合約驅(qū)動的權(quán)利交易平臺,通過區(qū)塊鏈技術(shù)實(shí)現(xiàn)創(chuàng)作要素(數(shù)據(jù)、算法、算力)的貢獻(xiàn)度溯源;建立“創(chuàng)作貢獻(xiàn)值”評估體系,在內(nèi)容商業(yè)化時(shí)自動分配收益??蓞⒖嘉④浹芯吭禾岢龅姆謱邮街悄馨鏅?quán)管理系統(tǒng)。
搭建專利加速審查通道。一是針對人工智能核心技術(shù)建立“技術(shù)影響指數(shù)”評估模型,對符合國家戰(zhàn)略方向的創(chuàng)新開辟綠色通道。二是開發(fā)專利價(jià)值預(yù)測系統(tǒng),集成技術(shù)成熟度、市場轉(zhuǎn)化率等指標(biāo),實(shí)現(xiàn)智能優(yōu)先審查。
構(gòu)建數(shù)據(jù)要素治理立方體。一是數(shù)據(jù)產(chǎn)權(quán)三元結(jié)構(gòu)。建立“所有權(quán)-使用權(quán)-收益權(quán)”分離機(jī)制,基礎(chǔ)數(shù)據(jù)所有權(quán)歸屬來源主體,研發(fā)機(jī)構(gòu)享有使用權(quán),商業(yè)化收益按數(shù)據(jù)貢獻(xiàn)度分配??蓞⒖忌虾?shù)據(jù)交易所的“數(shù)據(jù)資產(chǎn)憑證”制度,開發(fā)數(shù)據(jù)要素價(jià)值評估SAAS平臺。二是合規(guī)訓(xùn)練保障機(jī)制。構(gòu)建“數(shù)據(jù)清洗-脫敏處理-合規(guī)審核”三重過濾系統(tǒng),研發(fā)具備法律知識圖譜的智能審核人工智能;建立訓(xùn)練數(shù)據(jù)溯源存證平臺,對接司法區(qū)塊鏈存取證系統(tǒng),實(shí)現(xiàn)訓(xùn)練過程全周期可追溯。
完善人工智能倫理治理架構(gòu)。一是算法透明性規(guī)范。分領(lǐng)域制定可解釋性標(biāo)準(zhǔn),如醫(yī)療人工智能需達(dá)到L5級可解釋(完整因果鏈披露),金融風(fēng)控系統(tǒng)需達(dá)到L4級可解釋(關(guān)鍵決策路徑可視化);開發(fā)符合ISO/IEC24029標(biāo)準(zhǔn)的算法透明度檢測工具。二是倫理風(fēng)險(xiǎn)熔斷機(jī)制。建立“風(fēng)險(xiǎn)指標(biāo)監(jiān)測-自動熔斷-人工復(fù)核”三級響應(yīng)體系,如在自動駕駛、智能診療等領(lǐng)域設(shè)置多類風(fēng)險(xiǎn)閾值,開發(fā)嵌入式倫理審查模塊,實(shí)現(xiàn)實(shí)時(shí)風(fēng)險(xiǎn)預(yù)警與系統(tǒng)自鎖。
創(chuàng)新協(xié)同治理生態(tài)系統(tǒng)。一是政產(chǎn)學(xué)研協(xié)作平臺。構(gòu)建“1+N”聯(lián)合實(shí)驗(yàn)室網(wǎng)絡(luò),以國家人工智能治理實(shí)驗(yàn)室為核心,連接頭部企業(yè)研發(fā)中心、重點(diǎn)高校和研究院所;建立跨學(xué)科人才旋轉(zhuǎn)門制度,實(shí)施“技術(shù)+法律”雙導(dǎo)師培養(yǎng)計(jì)劃。二是國際規(guī)則對接工程。發(fā)起“數(shù)字絲路”人工智能治理倡議,建立金磚國家人工智能法律協(xié)調(diào)機(jī)制;參與世界知識產(chǎn)權(quán)組織框架下的人工智能與知識產(chǎn)權(quán)相關(guān)國際條約制定,推動建立人工智能技術(shù)跨境流動的“數(shù)字護(hù)照”認(rèn)證體系。
這些制度創(chuàng)新需要分階段實(shí)施,先完成立法框架設(shè)計(jì),再建成重點(diǎn)領(lǐng)域監(jiān)管沙盒,最終形成完整的人工智能治理法律生態(tài)系統(tǒng)。建議在北京、上海、粵港澳大灣區(qū)先行試點(diǎn),通過立法實(shí)驗(yàn)區(qū)積累經(jīng)驗(yàn),逐步構(gòu)建具有中國特色的人工智能治理范式。