익명 해제 란 무엇입니까
비익 명화는 암호화 또는 일반화 된 정보를 다시 식별하는 데이터 마이닝 기술입니다. 데이터 재 식별이라고도하는 비익 명화는 개인, 그룹 또는 트랜잭션을 식별하기 위해 익명화 된 정보를 다른 사용 가능한 데이터와 상호 참조합니다.
익명화 해제
기술에 정통한 시대는 경제의 여러 부문에서 전통적인 방식으로 일을 방해하고 있습니다. 최근 몇 년 동안 금융 산업은 핀 테크 회사가 해당 분야에 많은 디지털 제품을 도입하는 것을 보았습니다. 이러한 혁신적인 제품은 기존의 금융 기관이 허용하는 것보다 적은 비용으로 더 많은 소비자가 금융 제품 및 서비스에 액세스 할 수 있도록 재무 통합을 촉진했습니다. 기술 구현의 증가로 인해 데이터 수집, 저장 및 사용이 증가했습니다. 소셜 미디어 플랫폼, 디지털 결제 플랫폼 및 스마트 폰 기술과 같은 기술 도구는 다양한 회사에서 소비자와의 상호 작용을 향상시키기 위해 사용하는 수많은 데이터를 공개했습니다. 이러한 많은 양의 데이터를 빅 데이터라고하며 개인 및 규제 당국이 사용자의 신원 및 개인 정보를 보호하는 더 많은 법률을 요구하는 우려의 원인입니다.
익명 해제 작동 방식
클라우드 컴퓨팅을 통해 사용자의 온라인 활동에 대한 민감한 정보가 순간적으로 공유되는 빅 데이터 시대에 데이터 익명화 도구를 사용하여 사용자의 신원을 보호했습니다. 익명화는 의료 서비스, 소셜 미디어 플랫폼, 전자 상거래 등과 같은 다양한 분야에서 거래하는 사용자의 개인 식별 정보 (PII)를 숨 깁니다. PII에는 생년월일, 사회 보장 번호 (SSN), 우편 번호 및 IP와 같은 정보가 포함됩니다. 주소. 온라인 활동에 의해 남겨진 디지털 추적을 숨겨야 할 필요성으로 인해 암호화, 삭제, 일반화 및 교란과 같은 익명화 전략이 구현되었습니다. 데이터 과학자는 이러한 전략을 사용하여 공유 데이터에서 민감한 정보를 분리하지만 여전히 원래 정보를 보존하여 재 식별 가능성을 열어줍니다.
비익 명화는 공유되지만 제한된 데이터 세트를 온라인에서 쉽게 액세스 할 수있는 데이터 세트와 일치시켜 익명화 프로세스를 취소합니다. 그런 다음 데이터 마이너는 사용 가능한 각 데이터 세트에서 일부 정보를 검색하여 개인의 신원 또는 거래를 구성 할 수 있습니다. 예를 들어, 데이터 마이너는 통신 회사, 소셜 미디어 사이트, 전자 상거래 플랫폼 및 공개적으로 사용 가능한 인구 조사 결과에서 공유하는 데이터 세트를 검색하여 사용자의 이름과 빈번한 활동을 결정할 수 있습니다.
익명 해제 사용 방법
새로운 정보가 공개되거나 익명화 전략이 제대로 수행되지 않으면 재 식별이 성공할 수 있습니다. 하루에 방대한 양의 데이터가 제공되고 시간이 제한되어 있으므로 데이터 분석가와 광부는 결정을 내리는 데 휴리스틱이라는 바로 가기를 구현하고 있습니다. 휴리스틱은 데이터 세트를 결합하는 데 귀중한 시간과 리소스를 절약하는 한편 잘못된 휴리스틱 도구가 구현 된 경우 활용할 수있는 간격을 만들 수도 있습니다. 이러한 차이는 법적 또는 불법적 목적으로 데이터 세트를 익명화하려는 데이터 마이너가 식별 할 수 있습니다.
익명화 해제 기술로 불법적으로 얻은 개인 식별 정보는 익명 플랫폼의 한 형태 인 지하 시장에서 판매 할 수 있습니다. 잘못된 손에 들어가는 정보는 강요, 강요 및 협박에 사용될 수 있으며, 개인 정보 보호 문제와 희생자 인 비즈니스에 막대한 비용을 초래할 수 있습니다.
비익 명화도 법적으로 사용될 수 있습니다. 예를 들어 불법 약물의 지하 시장 인 Silk Road 웹 사이트는 Tor라는 익명의 네트워크에 의해 호스팅되었으며, 이 네트워크는 양파 전략을 사용하여 사용자의 IP 주소를 난독 처리합니다. Tor 네트워크는 또한 총기, 도난 된 신용 카드 및 민감한 회사 정보에서 거래되는 몇 가지 다른 불법 시장을 호스팅합니다. 복잡한 익명화 도구를 사용하여 FBI는 실크로드와 아동 포르노 관련 사이트를 성공적으로 해체하고 종료했습니다.
재 식별 프로세스에서의 성공은 익명 성이 보장되지 않음을 증명했습니다. 오늘날 데이터를 마스킹하기 위해 획기적인 익명화 도구를 구현 했더라도 새로운 기술과 새로운 데이터 세트를 사용할 수있게되면 몇 년 안에 데이터를 다시 식별 할 수 있습니다.