
公司
入選IDC TechScape兩大技術曲線,智領數據安全未來
? //??
近年來,全球數據安全形勢愈發嚴峻,《數據安全法》《個人信息保護法》等一系列相關法律法規正式頒布,從國家層面明確了數據作為新時代重要生產資料的安全戰略地位。
8月26日,在IDC?2022 CSO全球網絡安全峰會(中國站)上,IDC重磅發布《IDC TechScape:中國數據安全發展路線圖,2022》,根據技術的市場影響以及各技術的發展階段將技術分為變革型技術、主導型技術以及機會型技術三大類別,安恒信息成功入選“變革型”技術曲線“AI賦能數據安全”技術推薦廠商和“主導型”技術曲線“數據脫敏”技術推薦廠商,彰顯安恒信息在數據安全新技術研究領域的杰出成果。報告認為,幫助用戶構建全方位數據安全治理體系將成為大趨勢,各項數據安全和密碼技術將在治理體系中作為重點能力模塊,賦能用戶實現數據安全治理目標。

根據IDC統計,2021年中國數據安全產品與服務的總市場規模(包含隱私計算與區塊鏈技術中的數據安全部分)達到12.43億美金,約合80.2億人民幣,創下歷史新高。由于數據具備了的廣泛性、分散性、多樣性、復雜性等特性,政企用戶在建設數據安全時,數據資產發現與梳理、數據分類分級、權限管控、數據合規、數據分析、數據流轉等成為了眾多用戶共同面臨的難題。
AI賦能數據安全

AI技術是賦能未來數據安全態勢感知的關鍵,也是未來的智能化運營里最重要的環節之一。安恒信息聚焦人工智能在數據安全市場的應用,在AI賦能數據安全異常行為分析模型方面,積累了各行業豐富的實踐結果,并獲得技術專利,發表多篇技術論文。其中安恒數盾數據安全管控平臺內置豐富的AI算法,包括up/down異常、daily周期性異常、weekly周期性異常、新出現實體異常、閾值異常和潛伏型異常、集成學習評分、以及強化學習、預測算法等算法。以敏感對象表元素頻度訪問、敏感對象的操作類型、訪問源的行為、去參數化的語句模板、去參數化的應用URL行為等,通過一定組合方式,形成多樣的數據分析模型,從而自動發現危險的用戶數據訪問行為。通過長期的AI技術研究,安恒信息形成大量的算法支持成果。
安恒信息將AI技術賦能數據安全,在敏感數據智能識別方面,囊括了三類智能算法:
(1)基于相似度識別技術:該技術主要用于非結構化數據的識別上,通過提取文檔指紋特征、敏感文件學習訓練、指紋抓取和指紋相似度比對等技術,準確識別各類非結構化文檔(如Word 、TXT、 PPT 、PDF 等)中存儲的敏感數據;
(2)非監督學習技術:基于無監督學習算法,無需通過人工打標簽,即能實現敏感數據的分類。通過聚類算法將敏感數據待分類的數目賦為聚類“簇”的個數,將輸入的樣本數據進行聚類,聚類完成形成不同“簇”的數據集合,人工對這些“簇”的部分樣本進行分析并確定相應“簇”的類別,比如敏感型、非敏感型。
(3)監督學習:該算法需收集一定數量的訓練樣本數據,并對數據進行人工打標簽,選擇監督學習算法,再對訓練數據進行模型訓練與調參。訓練完成,將輸出的模型應用在新的數據進行智能識別與預測,自動化輸出數據類型:敏感 / 非敏感數據。
數據脫敏

數據脫敏是數據安全領域中較為成熟、落地場景較為全面的技術市場,在防止數據泄露的同時保留數據源的可用性,為數據流通、交易提供基礎。安恒AiMask數據脫敏系統采用獨有的脫敏與水印溯源算法對敏感數據進行去標識化、匿名化處理,不改變現有業務邏輯的前提下,保證脫敏后的數據保留原有業務邏輯特征,同時保證數據的有效性和可用性,使脫敏后的數據可以安全地應用于測試、開發、分析(包含第三方大數據分析)等不同應用場景。
(1)敏感數據發現快、準、全基于全局隨機采樣+空值過濾+NLP算法,有效避免了臟數據的干擾,提高敏感數據識別的性能、準確性、全面性。
(2)強大的并發處理能力采用了多任務多線程并行處理的方式,針對主流數據庫進行了數據抽取和入庫性能方面的深度優化,大幅提高了脫敏性能,實現產品脫敏效率快速化、高效化,最高可達每小時100G。
數字經濟時代,數據意味著信息、意味著知識與財富,意味著企業甚至國家在科技浪潮中的核心競爭力,數據安全已與政治安全、經濟安全、文化安全等形成緊密連接。秉承“構建安全可信的數字世界”的企業使命,安恒信息多年來專注數據安全領域,面向合規、面向需求,已形成了以解決數據全生命周期安全為核心的體系化解決方案,助力用戶實現數據安全治理目標,在數字化轉型中筑牢網絡安全銅墻鐵壁。