데이터 익명화 란
데이터 익명화는 데이터베이스에서 개인 식별 정보를 삭제하거나 암호화하여 개인 또는 민감한 데이터를 보호하려고합니다. 데이터 익명화는 수집 및 공유 된 데이터의 무결성을 유지하면서 개인 또는 회사의 개인 활동을 보호하기 위해 수행됩니다. 데이터 익명화는 "데이터 난독 화", "데이터 마스킹"또는 "데이터 비 식별"이라고도합니다.
데이터 익명화 분석
기업은 정상적인 비즈니스 운영 과정에서 막대한 양의 민감한 데이터를 생성, 저장 및 처리합니다. 다양한 분야와 국가에서 생성되고 공유 된 데이터에서 발견 된 관련 정보로 인해 기술의 발전이 번성했습니다. 금융 기술 혁신 (fintech)은 소셜 미디어 및 전자 상거래 시설과 같은 부문에서 공유 된 데이터 덕분에 금융 서비스가 고객에게 맞춤화되는 방식에서 무한한 발전을 이루었습니다. 디지털 미디어와 전자 상거래 회사간에 데이터를 공유함으로써 두 부문 모두 사이트의 제품을 특정 사용자 나 소비자에게 더 잘 광고 할 수있었습니다. 그러나 데이터베이스에서 컴파일 된 클라이언트의 ID를 손상시키지 않고 공유 데이터를 유용하게 사용하려면 익명화를 사용해야합니다.
실제로 데이터 익명화
데이터 익명화는 의료, 금융 및 디지털 미디어 산업과 같은 민감한 정보를 다루면서 데이터 공유의 무결성을 증진시키는 대부분의 산업에서 수행됩니다. 데이터 익명화는 동일한 회사 내의 국가, 산업 및 부서간에 데이터를 공유 할 때 의도하지 않은 공개 위험을 줄입니다. 예를 들어, 환자의 기밀 데이터를 의료 연구소 또는 제약 회사와 공유하는 병원은 환자를 익명으로 유지하는 경우 윤리적으로 그렇게 할 수 있습니다. 이것은 연령, 질병, 키, 체중, 성별, 인종 등과 같은 의학 연구에 필요한 중요한 구성 요소를 남겨두고 공유 목록에서 환자의 이름, 사회 보장 번호, 생년월일 및 주소를 제거하여 수행 할 수 있습니다.
데이터 익명화 기법
데이터의 익명화는 삭제, 암호화, 일반화 및 기타 여러 가지를 포함하여 다양한 방식으로 수행됩니다. 회사는 수집 된 데이터에서 개인 식별 정보 (PII)를 삭제하거나 강력한 암호로이 정보를 암호화 할 수 있습니다. 기업은 데이터베이스에서 수집 된 정보를 일반화하기로 결정할 수도 있습니다. 예를 들어, 표에는 소매 부문에서 5 명의 CEO가 얻은 정확한 총 수입이 포함되어 있습니다. 기록 된 소득이 $ 520, 000, $ 230, 000, $ 109, 000, $ 875, 000 및 $ 124, 000이라고 가정 해 봅시다. 이 정보는“<$ 500, 000”및“≥ $ 500, 000”과 같은 범주로 일반화 할 수 있습니다. 데이터가 난독 화되어 있지만 사용자에게는 여전히 유용합니다.
데이터 익명화 추론
데이터 익명화는 분류 된 정보가 삭제되고 위반이 발생하는 경우 수집 된 데이터가 범인에게 쓸모없는 방식으로 마스킹되어야합니다. 잘못된 손에 들어간 분류 된 정보는 의도적으로 또는 의도하지 않게 오용 될 수 있으므로 모든 조직에서 데이터를 보호해야 할 필요성을 최우선으로 고려해야합니다. 민감한 고객 정보를 처리 할 때 민감도가 부족하면 규제 당국이 심각한 태만으로 단속하기 때문에 비즈니스에 큰 비용이 발생할 수 있습니다. PCI DSS (Payment Card Industry Data Security Standard)와 같은 법률 및 규정 준수 요구 사항은 신용 카드 위반시 금융 기관에 막대한 벌금을 부과합니다. 캐나다 법률 인 PIPEDA는 회사의 개인 정보 공개 및 사용에 적용됩니다. 조직의 개인 데이터 사용 또는 오용을 모니터링하기 위해 구성된 여러 규제 기관이 있습니다.
익명화 된 데이터 디코딩은 익명화 해제 (또는 "재 식별") 프로세스를 통해 가능합니다. 익명화 된 데이터를 해독하고 해독 할 수 있다는 사실 때문에 비평가들은 익명화가 잘못된 보안 감각을 제공한다고 믿습니다.