在《數據安全管理辦法(征求意見稿)》中提到,在正常生產和使用過程中,很多環(huán)節(jié)需要對敏感數據進行共享和使用,這時候都是存在一些數據泄露風險的場景,這些場景中數據脫敏是必經環(huán)節(jié)。
法律法規(guī)和行業(yè)監(jiān)管要求,對數據脫敏有相應的脫敏程度,比如匿名化、去標識化。匿名化是指對個人信息處理之后,使得個人信息主體無法被識別;去標識化是指處理后不借助額外信息的情況下,無法識別個人信息主體的過程。
什么是數據脫敏?
數據脫敏是指對某些敏感信息通過脫敏規(guī)則進行數據的變形,實現敏感隱私數據的可靠保護。在涉及客戶安全數據或者一些商業(yè)性敏感數據的情況下,在不違反系統(tǒng)規(guī)則條件下,對真實數據進行改造并提供測試使用,如身份證號、手機號、卡號、客戶號等個人信息都需要進行數據脫敏。
數據脫敏是數據庫安全技術之一,數據庫安全技術主要包括:數據庫漏掃、數據庫加密、數據庫防火墻、數據脫敏、數據庫安全審計系統(tǒng)。脫敏技術中兩個比較重要的概念,一個是靜態(tài)脫敏,還有一個是動態(tài)脫敏。靜態(tài)脫敏是對數據進行批量化脫敏,一般用在測試開發(fā)或者是對外進行完整的數據集外發(fā)的場景中,主要特點是數據會發(fā)生批量的轉移。
動態(tài)脫敏一般是對數據進行實時脫敏,常用于對外提供訪問接口的時候,外部可以訪問我們的數據,實時獲取數據的場景。有的數據有很大的流量,但是單個脫敏的時候,數據量都是比較小的,它的技術實現一般是通過透明網關等中間件技術,使得脫敏方案在用戶無感知的情況下給用戶返回脫敏后的數據,另外還有改寫數據請求的這種方式。
數據脫敏技術的主要目標就是通過對敏感數據按照相應特定脫敏算法進行變形轉換,以降低數據的敏感程度,擴大數據可共享和被使用的范圍。一般脫敏算法有加解密、掩碼、替換和模糊等等。數據脫敏不僅要執(zhí)行數據漂白,抹去數據中的敏感內容,同時也需要保持原有的數據特征、業(yè)務規(guī)則和數據關聯性,保證開發(fā)、測試、培訓以及大數據類業(yè)務不會受到脫敏的影響,達成脫敏前后的數據一致性、有效性:
一是保持原有數據特征。數據脫敏前后必須保證數據特征的保持,例如:身份證號碼由十七位數字本體碼和一位校驗碼組成,分別為區(qū)域地址碼(6 位)、出生日期(8 位)、順序碼(3 位)和校驗碼(1 位)。那么身份證號碼的脫敏規(guī)就需要保證脫敏后依舊保持這些特征信息。
二是保持數據之間的一致性。在不同業(yè)務中,數據和數據之間具有一定的關聯性。例如:出生年月或年齡和出生日期之間的關系。同樣,身份證信息脫敏后仍需要保證出生年月字段和身份證中包含的出生日期之間的一致性。
三是保持業(yè)務規(guī)則的關聯性。保持數據業(yè)務規(guī)則的關聯性是指數據脫敏時數據關聯性以及業(yè)務語義等保持不變,其中數據關聯性包括:主、外鍵關聯性、關聯字段的業(yè)務語義關聯性等。特別是高度敏感的賬戶類主體數據往往會貫穿主體的所有關系和行為信息,因此需要特別注意保證所有相關主體信息的一致性。
四是多次脫敏之間的數據一致性。相同的數據進行多次脫敏,或者在不同的測試系統(tǒng)進行脫敏,需要確保每次脫敏的數據始終保持一致性,只有這樣才能保障業(yè)務系統(tǒng)數據變更的持續(xù)一致性以及廣義業(yè)務的持續(xù)一致性。
為什么要做數據脫敏?
數據脫敏通過對數據進行脫敏,在保證數據可用性的同時,也在一定范圍內保證惡意攻擊者無法將數據與具體用戶關聯到一起,從而保證用戶數據的隱私性。數據脫敏方案作為大數據平臺整體數據安全解決方案的重要組成部分,是構建安全可靠的大數據平臺必不可少的功能特性。
大數據平臺通過將所有數據整合起來,充分分析與挖掘數據的內在價值,為業(yè)務部門提供數據平臺,數據產品與數據服務。大數據平臺接入的數據中可能包括很多用戶的隱私和敏感信息,如用戶在酒店的入住紀錄、用戶支付信息等,這些數據存在可能泄漏的風險。
大數據平臺一般通過用戶認證、權限管理以及數據加密等技術保證數據的安全,但是這并不能完全從技術上保證數據的安全。嚴格的來說,任何有權限訪問用戶數據的人員,如ETL工程師或是數據分析人員等,均有可能導致數據泄漏的風險。
另一方面,沒有訪問用戶數據權限的人員,也可能有對該數據進行分析挖掘的需求,數據的訪問約束大大限制的充分挖掘數據價值的范圍。
如何進行數據脫敏?
最早數據脫敏的主要是針對數值和文本這種很基本的數據類型,現在對于圖片、對音頻、視頻都有脫敏的需要。值得一提的是,各行各業(yè)在實施數據脫敏及追求數據應用價值時,對數據脫敏業(yè)務合規(guī)性及高可用性,敏感數據的分布與管理,脫敏數據可用性,數據審計技術手段,業(yè)務操作便捷性以及項目實施周期極為關注。
針對以上訴求,國聯易安通過研發(fā)推出的數據庫安全脫敏系統(tǒng)是一款高性能、高擴展性的數據屏蔽和脫敏產品,既保護敏感數據,又滿足監(jiān)管合規(guī)的要求,可謂兩全其美。系統(tǒng)尤其實現了自動識別敏感數據和管理敏感數據,提供靈活的策略和脫敏方案配置,具備高效可并行的脫敏能力,可以幫助客戶快速實施敏感數據脫敏處理。系統(tǒng)同時可以保證數據的有效性和可用性,使脫敏后的數據能夠安全的應用于測試、開發(fā)、分析和第三方使用環(huán)境。
隨著信息時代的發(fā)展,我們對數據信息的安全要求越來越重視,比如對非生產環(huán)境下的敏感數據的脫敏保護。在金融、運營商、政府、能源等部門,非生產環(huán)境下數據脫敏已列入監(jiān)管部門的法規(guī)要求。非生產環(huán)境數據多用于開發(fā)、測試、培訓以及第三方數據分析、挖掘,如果不能有效實施敏感數據保護,極易造成敏感數據的泄露。所以,保證非生產數據的安全已經成為一個重要的課題,要求我們能夠通過對敏感信息進行脫敏、變形,實現有效的數據保護。
國聯易安自主研發(fā)的數據庫安全脫敏系統(tǒng),采用獨創(chuàng)的脫敏算法對敏感數據進行變形、屏蔽、替換、隨機化、加密等措施,將敏感數據轉化為仿真數據,脫敏后的數據保留原有數據的特征和分布,無需改變相應的業(yè)務系統(tǒng)邏輯而受到業(yè)界的認可和信賴。
參考文獻:
李呈祥,CSDN網,《大數據與數據脫敏》
Jacky,乾學院,《數據脫敏的處理方法及查詢》
王卓 ,安全內參網,《信通院專家:數據脫敏為什么如此重要》
佚名,天極網,《國聯易安:應用數據脫敏 發(fā)揮數據價值》
最新論文