隨著數(shù)字化轉(zhuǎn)型深化,數(shù)據(jù)要素的流通、共享、分發(fā)頻次大幅提升,但與此同時,數(shù)據(jù)泄漏事件也是逐年增長。
根據(jù)《2024年中國政企機構(gòu)數(shù)據(jù)安全風險研究報告》,互聯(lián)網(wǎng)、政府及事業(yè)單位是數(shù)據(jù)泄露的重災(zāi)區(qū)。數(shù)據(jù)流通的“便利性”和“安全性”面臨嚴重的挑戰(zhàn)。
面對挑戰(zhàn),國家和行業(yè)已明確“亮劍” 。從國家數(shù)據(jù)局、發(fā)改委等部門聯(lián)合印發(fā)的《關(guān)于完善數(shù)據(jù)流通安全治理更好促進數(shù)據(jù)要素市場化價值化的實施方案》(簡稱“方案”) ,到國家衛(wèi)健委發(fā)布的《加強醫(yī)療機構(gòu)電子病歷信息使用管理的通知》 ,再到各地方數(shù)據(jù)條例 ,均明確要求或鼓勵建設(shè)數(shù)據(jù)溯源技術(shù)。
其中,數(shù)據(jù)水印因其出色的溯源與取證能力,被明確列為關(guān)鍵技術(shù)措施 。例如,方案提出:“要融合數(shù)字水印、區(qū)塊鏈等技術(shù),支撐數(shù)據(jù)流通過程中的取證定責。 ”衛(wèi)健委的通知中也明確提到“支持通過數(shù)字水印等技術(shù)手段,確保使用過程留痕” 。
真實的數(shù)據(jù)流通場景遠比想象的復(fù)雜 。
· 數(shù)據(jù)類型多樣: 涉及結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù) 。
· 流轉(zhuǎn)形式多樣: 包含庫表交換、API接口交換、數(shù)據(jù)導出、頁面查看等 。
· 涉及角色多樣: 數(shù)據(jù)運維人員、數(shù)據(jù)使用人員、數(shù)據(jù)訂閱人員等 。
· 風險無處不在: 數(shù)據(jù)訂閱方在查看訂閱數(shù)據(jù)時,通過頁面截圖方式造成數(shù)據(jù)泄露 ;運維人員可批量導出數(shù)據(jù)庫造成泄露 ;用戶也可通過API接口調(diào)用造成數(shù)據(jù)泄漏 。
顯然,單一的數(shù)據(jù)水印手段難以實現(xiàn)全場景覆蓋 。市場真正需要的是一套能夠全方位綜合防護的整體方案,必須整合 API 水印、數(shù)據(jù)動態(tài)水印、數(shù)據(jù)靜態(tài)水印、文檔水印等多種技術(shù)工具 。
針對上述復(fù)雜場景,一套全場景的數(shù)據(jù)水印防護方案應(yīng)運而生。

場景一:應(yīng)用系統(tǒng)批量導出結(jié)構(gòu)化數(shù)據(jù)
數(shù)據(jù)通過應(yīng)用程序?qū)С鰰r,調(diào)用數(shù)據(jù)靜態(tài)水印溯源系統(tǒng),自動對導出的數(shù)據(jù)嵌入水印信息。在此過程中,數(shù)據(jù)靜態(tài)水印溯源系統(tǒng)通過標準API接口與應(yīng)用系統(tǒng)數(shù)據(jù)導出流程對接,自動執(zhí)行水印嵌入任務(wù),不會影響數(shù)據(jù)導出人員的操作方式,更無法知道水印信息具體嵌入在什么數(shù)據(jù)上,規(guī)范業(yè)務(wù)人員數(shù)據(jù)使用行為。
場景二:應(yīng)用系統(tǒng)批量導出非結(jié)構(gòu)化數(shù)據(jù)
如果導出的是 Word、PDF 這類非結(jié)構(gòu)化文檔,可以利用文檔水印系統(tǒng)進行水印嵌入。文檔水印可以嵌入靜態(tài)可見水印,此種方式在文檔中固定顯示類似“內(nèi)部機密”文字;動態(tài)可見水印,顯示的內(nèi)容可以包含當前使用數(shù)據(jù)的人的用戶信息、終端信息等;不可見水印,通過修改文件本身特征,或者在文件里添加隱藏信息。
場景三:數(shù)據(jù)動態(tài)實時訪問
此類場景有兩種情況,一是前端通過API接口訪問應(yīng)用系統(tǒng)中的數(shù)據(jù),可利用應(yīng)用/API水印,對傳輸?shù)臄?shù)據(jù)嵌入字符水印,或者利用無損水印技術(shù),形成特征水印;一種是運維人員直連數(shù)據(jù)庫,實時訪問數(shù)據(jù)庫中的數(shù)據(jù),可利用數(shù)據(jù)動態(tài)水印溯源系統(tǒng),通過無損水印技術(shù)形成特征水印,便用事后追蹤溯源。
場景四:用戶通過數(shù)據(jù)應(yīng)用平臺WEB頁面訪問數(shù)據(jù)
此類場景下,用戶可以通過截圖、拍照等方式泄漏數(shù)據(jù),利用應(yīng)用/API水印可以在訪問頁面嵌入頁面水印。頁面水印的關(guān)鍵信息包括:訪問者用戶信息、訪問時間、客戶端信息等,而且水印的顏色、透明度、旋轉(zhuǎn)角度、橫縱向間距等參數(shù)可根據(jù)實際需求靈活調(diào)整,能做到既不影響查看,又能對用戶形成威懾。
場景五:數(shù)據(jù)通過共享數(shù)據(jù)庫對外共享
利用數(shù)據(jù)靜態(tài)水印溯源系統(tǒng)從源數(shù)據(jù)庫抽取數(shù)據(jù),嵌入相應(yīng)的水印信息后再保存到共享庫中,對外共享時,從共享庫中提取數(shù)據(jù)。如此,所有共享數(shù)據(jù)都攜帶有水印信息,一旦出現(xiàn)數(shù)據(jù)泄露,即可快速溯源、定位。

(全場景數(shù)據(jù)水印防護方案部署示意圖)
真正的數(shù)據(jù)水印防護,絕非“頭痛醫(yī)頭”。本方案覆蓋了結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù);針對結(jié)構(gòu)化水印有嵌入式水印、無損水印方式,非結(jié)構(gòu)化數(shù)據(jù)有可見水印、不可見水印方式;全面覆蓋了API接口調(diào)用、數(shù)據(jù)庫訪問、數(shù)據(jù)導出、數(shù)據(jù)查看等核心場景。我們的目標是數(shù)據(jù)流通的最終平衡—— “數(shù)據(jù)流得通、安全守得住”。

