데이터웨어 하우징이란?
데이터웨어 하우징은 비즈니스 또는 조직에서 대량의 정보를 전자적으로 저장하는 것입니다. 데이터웨어 하우징은 비즈니스 데이터에 대한 분석 기술을 사용하는 비즈니스 인텔리전스의 핵심 구성 요소입니다.
데이터웨어 하우징 개념은 IBM 연구원 인 Barry Devlin과 Paul Murphy에 의해 1988 년에 도입되었습니다. 컴퓨터 시스템이 더욱 복잡해지고 점점 더 많은 양의 데이터를 처리함에 따라 데이터웨어 하우스의 필요성이 발전했습니다. 데이터웨어 하우징에 대한 핵심 책은 WH Inmon의 "데이터웨어 하우스 구축"입니다.이 데이터웨어 하우스는 1990 년에 처음 출판되어 그 이후 여러 번 재 인쇄되었습니다.
데이터웨어 하우징 작동 방식
데이터웨어 하우징은 여러 이기종 소스에서 통합 된 데이터를 비교하여 회사의 성과에 대한 통찰력을 제공하는 데 사용됩니다. 데이터웨어 하우스는 트랜잭션 소스에서 파생 된 히스토리 데이터에 대해 쿼리 및 분석을 실행하도록 설계되었습니다.
데이터가웨어 하우스에 통합 된 후에는 데이터웨어 하우스가 시간이 지남에 따라 데이터의 변경 사항에 집중하여 이미 발생한 이벤트에 대한 분석을 실행하므로 변경되지 않으며 변경할 수 없습니다. 웨어 하우스 데이터는 안전하고 신뢰할 수 있으며 검색 및 관리가 쉬운 방식으로 저장해야합니다.
데이터웨어 하우스를 작성하기 위해 수행되는 특정 단계가 있습니다. 첫 번째 단계는 여러 소스 지점에서 많은 양의 데이터를 수집하는 데이터 추출입니다. 데이터가 컴파일 된 후에는 데이터 정리, 오류에 대해 데이터를 결합하고 발견 된 오류를 수정 또는 제외하는 프로세스를 거칩니다.
정리 된 데이터는 데이터베이스 형식에서웨어 하우스 형식으로 변환됩니다. 웨어 하우스에 저장되면 정렬, 통합, 요약 등을 통해 데이터를보다 조율하고 사용하기 쉽게 만듭니다. 시간이 지남에 따라 여러 데이터 소스가 업데이트됨에 따라 더 많은 데이터가웨어 하우스에 추가됩니다.
주요 테이크 아웃
- 데이터웨어 하우징은 비즈니스 또는 조직에서 대량의 정보를 전자적으로 저장하는 저장소로, 비즈니스 인텔리전스 및 데이터 마이닝을 위해 트랜잭션 소스에서 파생 된 기록 데이터에 대한 쿼리 및 분석을 실행하도록 설계되었습니다. 여러 이기종 소스에서 통합 된 데이터를 비교하여 회사의 성과에 대한 통찰력.
특별 고려 사항: 데이터 마이닝
기업은 탐색 및 데이터 마이닝에 사용하기 위해 데이터를웨어 하우스 화하여 비즈니스 프로세스를 개선하는 데 도움이되는 정보 패턴을 찾을 수 있습니다. 우수한 데이터웨어 하우징 시스템을 사용하면 회사 내의 여러 부서가 서로의 데이터에 쉽게 액세스 할 수 있습니다.
예를 들어, 데이터웨어 하우스를 통해 회사는 영업 팀의 데이터를 쉽게 평가하고 영업을 개선하거나 부서를 간소화하는 방법에 대한 결정을 내릴 수 있습니다. 비즈니스는 제품을보다 효과적으로 배치하고 판매를 늘리기 위해 고객의 소비 습관에 집중할 수 있습니다.
회사는 데이터웨어 하우징을 통해 과거 20 년 동안 고객의 지출 내역을 수집하고이 데이터에 대한 분석을 실행할 수 있습니다. 결과 정보는 소비자의 선호도에 대한 통찰력을 제공 할 수 있습니다. 판매량이 많은 시간, 월 또는 연도; 또는 가장 높은 지출 고객.
효과적인 데이터 저장 및 관리는 여행 예약 시작 및 현금 자동 입출금기 사용과 같은 프로세스를 가능하게합니다.
데이터 마이닝 프로세스는 5 단계로 나뉩니다.
- 조직은 데이터를 수집하여 데이터웨어 하우스에로드 한 다음 사내 서버 나 클라우드에 데이터를 저장하고 관리합니다. 비즈니스 분석가, 관리 팀 및 정보 기술 전문가는 데이터에 액세스하여 데이터를 구성 할 방법을 결정합니다. 그런 다음 응용 프로그램 소프트웨어는 사용자의 결과에 따라 데이터를 정렬합니다. 최종 사용자는 최종적으로 그래프 또는 테이블과 같이 공유하기 쉬운 형식으로 데이터를 표시합니다.
데이터웨어 하우징 및 데이터베이스
데이터웨어 하우스는 반드시 표준 데이터베이스와 동일한 개념 일 필요는 없습니다. 데이터베이스는 최신 데이터 만 사용할 수 있도록 실시간 데이터를 모니터링하고 업데이트하도록 설정된 트랜잭션 시스템입니다. 데이터웨어 하우스는 일정 기간 동안 구조화 된 데이터를 집계하도록 프로그래밍되어 있습니다. 예를 들어, 데이터베이스에는 고객의 최신 주소 만있을 수 있지만 데이터웨어 하우스에는 지난 10 년 동안 고객이 살았던 모든 주소가있을 수 있습니다.