AIGC爆火之后:如何平衡數(shù)據(jù)流動共享與安全保護(hù)?

2023-03-18 09:05:15

21世紀(jì)經(jīng)濟(jì)報道記者鐘雨欣徐倩宜

南方財經(jīng)全媒體記者馮戀閣北京、廣州報道

生成式AI再次“引爆”全球輿論關(guān)注。3月15日凌晨,OpenAI 發(fā)布多模態(tài)預(yù)訓(xùn)練大模型 GPT-4.據(jù)官方介紹,GPT-4支持圖像和文本輸入,以文本形式輸出;文字輸入限制提升,能處理超過25000個單詞的文本;更具創(chuàng)造力和準(zhǔn)確性。


(資料圖)

AI浪潮席卷之下,國內(nèi)大廠奮起直追,一天后,百度發(fā)布國內(nèi)首款對標(biāo)ChatGPT的產(chǎn)品“文心一言”,并在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成等多個場景中展現(xiàn)了產(chǎn)品能力。

毫無疑問,AIGC(人工智能生成內(nèi)容)正在給人類社會帶來一場深刻的變革。而剝開其令人眼花繚亂的華麗外表,運行的核心離不開海量的數(shù)據(jù)支持。多位受訪專家表示,ChatGPT等AI技術(shù)在數(shù)據(jù)收集、處理、輸出等各環(huán)節(jié)都可能存在伴生風(fēng)險,如未經(jīng)授權(quán)收集信息、提供虛假信息、侵害個人隱私等等。監(jiān)管方和相關(guān)企業(yè)亟需從制度和技術(shù)方面共同發(fā)力,加強(qiáng)AIGC領(lǐng)域數(shù)據(jù)安全保護(hù)。

數(shù)據(jù)泄露、隱私侵害成隱憂

ChatGPT通過大量文本語料庫進(jìn)行訓(xùn)練,其深度學(xué)習(xí)能力很大程度上依賴于背后的數(shù)據(jù)。21世紀(jì)經(jīng)濟(jì)報道記者梳理發(fā)現(xiàn),出于對信息泄露的擔(dān)憂,目前已有多家公司和機(jī)構(gòu)發(fā)布“ChatGPT禁令”。

近日,軟銀、日立等日本企業(yè)已開始限制在商業(yè)運營中使用ChatGPT等互動人工智能服務(wù)。軟銀就使用ChatGPT和其他類似應(yīng)用警告員工稱:“不要輸入公司的可識別信息或機(jī)密數(shù)據(jù)”。日立則將考慮制定新的道德規(guī)則,以規(guī)范交互式人工智能的使用。

今年2月,摩根大通成為第一家在工作場所限制使用ChatGPT的華爾街投行。花旗集團(tuán)和高盛集團(tuán)緊隨其后,前者禁止員工在整個公司范圍內(nèi)訪問ChatGPT,后者則限制員工在交易大廳使用該產(chǎn)品。而在更早些時候,亞馬遜和微軟為防備員工在使用ChatGPT的過程中泄密,禁止他們向其分享敏感數(shù)據(jù),因為這些信息可能會被用作進(jìn)一步迭代的訓(xùn)練數(shù)據(jù)。

北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國互聯(lián)網(wǎng)協(xié)會研究中心副主任吳沈括在接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時表示,ChatGPT作為大語言模型,它的核心邏輯事實上是海量數(shù)據(jù)的收集、加工、處理和運算結(jié)果的輸出?!翱偟膩碚f,這幾個環(huán)節(jié)可能會在技術(shù)要素、組織管理、數(shù)字內(nèi)容三個方面伴生相關(guān)風(fēng)險。”

北京航空航天大學(xué)法學(xué)院副教授趙精武分析,在數(shù)據(jù)安全和個人信息保護(hù)領(lǐng)域,ChatGPT等AI技術(shù)的風(fēng)險主要表現(xiàn)為用戶輸入的數(shù)據(jù)存在泄露風(fēng)險,倘若用戶為了完成工作任務(wù),輸入了敏感個人信息、商業(yè)秘密等信息,這些信息有可能被AI服務(wù)提供者留存。

南開大學(xué)法學(xué)院副院長、中國新一代人工智能發(fā)展戰(zhàn)略研究院特約研究員陳兵教授進(jìn)一步指出,根據(jù)ChatGPT相關(guān)隱私政策可以看到,用戶在使用ChatGPT時,會被采集有關(guān)用戶訪問、使用或互動的信息。這意味著,包含用戶隱私以及用戶對話的數(shù)據(jù)可能會被OpenAI采集并存儲在其數(shù)據(jù)中心。

“雖然,ChatGPT表示,存儲訓(xùn)練和運行模型所需的數(shù)據(jù)會嚴(yán)格遵守隱私和安全政策,但在未來可能出現(xiàn)網(wǎng)絡(luò)攻擊和數(shù)據(jù)爬取等現(xiàn)象,仍存在不可忽視的數(shù)據(jù)安全隱患。特別是涉及國家核心數(shù)據(jù)、地方和行業(yè)重要數(shù)據(jù)以及個人隱私數(shù)據(jù)的抓取、處理以及合成使用等過程,需平衡數(shù)據(jù)安全保護(hù)與流動共享。”陳兵說。

除了數(shù)據(jù)與隱私泄露隱患外,同濟(jì)大學(xué)法學(xué)院副教授、上海市人工智能社會治理協(xié)同創(chuàng)新中心研究員陳吉棟指出,AI技術(shù)還存在著數(shù)據(jù)偏見、虛假信息、模型的難解釋性等問題,可能會導(dǎo)致誤解和不信任。

大成律師事務(wù)所高級合伙人肖颯則強(qiáng)調(diào)了AI技術(shù)“文本數(shù)據(jù)挖掘功能”潛藏的合規(guī)風(fēng)險。她表示,該功能不僅可以“主動”搜集和存儲數(shù)據(jù),并且能在不斷的數(shù)據(jù)處理過程中形成自己的處理模式。若其所搜集的數(shù)據(jù)(含個人信息)并未取得合法授權(quán),相關(guān)的處理活動就可能涉嫌違法違規(guī)。

國內(nèi)企業(yè)引入ChatGPT需注意數(shù)據(jù)跨境合規(guī)

隨著生成式AI受到科技界“熱捧”,不少企業(yè)試圖在自身業(yè)務(wù)中引入和使用ChatGPT服務(wù)。而根據(jù)ChatGPT運作原理,用戶在輸入端提問后,信息會傳輸?shù)絆penAI服務(wù)器上進(jìn)行運算,隨后得到相應(yīng)回答。

記者在手機(jī)應(yīng)用商店搜索發(fā)現(xiàn),不少App打著“AI聊天機(jī)器人”“基于GPT提供AI寫作”的口號提供服務(wù),有的直稱“可接入ChatGPT接口”。

肖颯指出,由于ChatGPT本身具備收集、存儲和使用數(shù)據(jù)的功能,且用戶與其對話的數(shù)據(jù)也會被記錄,國內(nèi)企業(yè)若引入ChatGPT服務(wù),可能被認(rèn)定為數(shù)據(jù)出境活動。

她介紹,在數(shù)據(jù)跨境合規(guī)方面,我國已經(jīng)初步形成了相關(guān)的法律體系,主要存在三種合規(guī)出境方式,即安全評估、個人信息保護(hù)認(rèn)證和個人信息出境標(biāo)準(zhǔn)合同。“相關(guān)企業(yè)必須依據(jù)《數(shù)據(jù)安全法》《個人信息保護(hù)法》等相關(guān)規(guī)定,管理數(shù)據(jù)出境活動,依法辦事?!?/strong>

在趙精武看來,如果國內(nèi)企業(yè)試圖引入ChatGPT服務(wù),其合規(guī)要點在于:一是輸入輸出數(shù)據(jù)應(yīng)當(dāng)留存于境內(nèi);二是需要經(jīng)由工信部等主管部門審核,獲得相應(yīng)的信息服務(wù)資質(zhì)認(rèn)證;三是若對用戶個人信息權(quán)益產(chǎn)生實質(zhì)性影響,需要進(jìn)行個人信息安全影響評估;四是如果國內(nèi)企業(yè)屬于關(guān)鍵信息基礎(chǔ)設(shè)施運營者,其引入ChatGPT服務(wù)還需要進(jìn)行網(wǎng)絡(luò)安全審查。

另外,在執(zhí)法方面,陳兵表示,對于AIGC涉及的數(shù)據(jù)跨境流通問題,應(yīng)當(dāng)在考慮國際通行標(biāo)準(zhǔn)和做法的基礎(chǔ)上,制定合理的跨境數(shù)據(jù)安全執(zhí)法規(guī)則,加強(qiáng)與其他國家和地區(qū)規(guī)則的銜接,促進(jìn)數(shù)據(jù)安全跨境執(zhí)法合作。

加強(qiáng)全流程數(shù)據(jù)合規(guī)管理

面對前述潛藏風(fēng)險,監(jiān)管方和相關(guān)企業(yè)如何從制度和技術(shù)層面加強(qiáng)AIGC領(lǐng)域的數(shù)據(jù)安全保護(hù)?

吳沈括建議監(jiān)管側(cè)關(guān)注三方面規(guī)則?!耙皇鞘袌龅臏?zhǔn)入和資質(zhì)規(guī)則,確保優(yōu)良主體進(jìn)入該市場領(lǐng)域。二是業(yè)務(wù)監(jiān)管規(guī)則,確保主體的運行符合既定的監(jiān)管框架要求。三是責(zé)任規(guī)則,要劃定行為紅線、責(zé)任紅線,明確各方主體的責(zé)任范圍,規(guī)范市場秩序?!?/p>

“相較于直接針對用戶終端采取限制使用等監(jiān)管措施,明確要求AI技術(shù)研發(fā)企業(yè)遵循科技倫理原則會更具成效,因為這些企業(yè)能夠在技術(shù)層面限定用戶的使用范圍?!壁w精武說。

肖颯表示,對于監(jiān)管方而言,針對AI這種獨特的數(shù)據(jù)處理方式,最好在現(xiàn)行法律體系之下制定特別的規(guī)章制度,以規(guī)制企業(yè)運用AI各類場景下的數(shù)據(jù)處理行為。

陳兵認(rèn)為,在制度層面,需要結(jié)合AIGC底層技術(shù)所需數(shù)據(jù)的特性和作用,建立健全數(shù)據(jù)分類分級保護(hù)制度。例如,可根據(jù)數(shù)據(jù)主體、數(shù)據(jù)處理程度、數(shù)據(jù)權(quán)利屬性等方面對訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行分類管理,根據(jù)數(shù)據(jù)對于數(shù)據(jù)權(quán)利主體的價值,以及數(shù)據(jù)一旦遭到篡改、破壞等對數(shù)據(jù)主體的危害程度進(jìn)行分級。在數(shù)據(jù)分類分級的基礎(chǔ)上,建立與數(shù)據(jù)類型和安全級別相配套的數(shù)據(jù)保護(hù)標(biāo)準(zhǔn)與共享機(jī)制。

目光投向企業(yè),陳兵建議加快推動“隱私計算”技術(shù)在AIGC領(lǐng)域的應(yīng)用?!斑@類技術(shù)能夠讓多個數(shù)據(jù)擁有者在不暴露數(shù)據(jù)本身的前提下,通過共享SDK或者開放SDK權(quán)限的方式,在進(jìn)行數(shù)據(jù)的共享、互通、計算、建模,在確保AIGC能夠正常提供服務(wù)的同時,保證數(shù)據(jù)不泄露給其他參與方?!?/p>

此外,多位專家在采訪中強(qiáng)調(diào)了“全流程合規(guī)管理”的重要性。

“企業(yè)首先應(yīng)關(guān)注其所運用的數(shù)據(jù)資源是否符合法律法規(guī)要求,其次要確保算法和模型運作的全流程合規(guī),另外,企業(yè)的創(chuàng)新研發(fā)應(yīng)最大限度地滿足社會公眾的倫理期待?!眳巧蚶ㄕf。

陳吉棟建議企業(yè)從數(shù)據(jù)收集、生產(chǎn)到應(yīng)用的全生命周期展開制度設(shè)計?!巴瑫r,技術(shù)是法律監(jiān)管的核心工具,能夠確保監(jiān)管的穿透性,需要用技術(shù)守住數(shù)據(jù)合規(guī)底線。”

肖颯也表達(dá)了相似看法。她指出,企業(yè)應(yīng)制定內(nèi)部管理規(guī)范,設(shè)立相關(guān)的監(jiān)督部門,對AI技術(shù)應(yīng)用場景的各個環(huán)節(jié)進(jìn)行數(shù)據(jù)監(jiān)督,確保數(shù)據(jù)來源合法、處理合法、輸出合法,從而保障自身的合規(guī)性。

(文章來源:21世紀(jì)經(jīng)濟(jì)報道)

標(biāo)簽:

關(guān)閉
新聞速遞