데이터마이닝 (Datamining)

2011. 1. 26. 15:56

데이터마이닝 (Datamining) Work/Database General2011. 1. 26. 15:56

1. Overview

가. 정의

* 대용량의 숨겨진 데이터로 부터 유용한 정보 및 패턴을 추출하여 의사결정에 활용하는 과정

나. 통계적 분석과 데이터마이닝의 비교

2. 데이터마이닝 기법

* 예측적 모델(Predicative Mode) : 이미 알려진 졀과로 예측

* 탐색적 모델(Descriptive Mode) : 결과가 알려지지 않은 데이터로 예측

3. 데이터마이닝 절차 및 활용

가. 데이터 마이닝 절차

절차	내용	고려사항
요구분석	데이터마이닝 목적을 정의	불량 고객 최소화 신규 고객 창출
데이터 선택	필요한 데이터의 위치, 형태 파악 및 통합	DW 활용
데이터 정제	정확성을 높이기 위한 데이터 모호성, 중복성 제거 및 오류 데이터 보정	오류 데이터 보정 (9월 31일)
데이터 보강	데이터 양을 늘이기 위한 외부데이터 추가	외부 데이터 활용
데이터 변환	불필요한 데이터 제거 및 신규 파생데이터 생성	파생 데이터 생성 (월 소득 200 이상 ->'1')
마이닝 수행	비즈니스 목적에 맞는 마이닝 기법 선택 및 수행 (의사결정 나무, 신경망.. 등)	해석 가능한 모델 선택
해석 및 평가	마이닝 결과를 해석하고 실 업무에 적용하고 평가	Feedback

나. 데이터마이닝의 활용

4. 데이터마이닝의 기대효과 및 의견

가. 데이터마이닝의 기대효과

나. 의견

* OLAP, 지능현 Agent, Expert 시스템, KMS 등과 연계되어 주요 의사결정 지원 기술요소로 정착이 기대됨.

* 통계적 분석 등 경험이 필요하며, 전문가의 수준에서 이해가 가능한 알고리즘 등 보편적인 사용이 현실적으로 쉽지 않으나, Visualization 분야 및 신용카드 회사 등 마이닝이 잘 맞는 특정 산업을 중심으로 사용이 용히한 패키지 형태로 확산될 전망임.

Posted by Elick