본문 바로가기
자격증/ADsP

[ADsP 2과목] 데이터 분석 기획의 이해 정리 part 1- 분석기획 방향성 도출(최적화, 통찰, 솔루션, 발견/ 과제 중심적 접근, 장기적인 마스터 플랜/ 분석 기획시 고려사항)

by Gina Sim 2021. 8. 10.
차례

1. 분석기획의 특징
1.1. 분석기획
1.2. 데이터 사이언티스트의 역량

2. 분석 대상과 방법
2.1. 최적화, 통찰, 솔루션, 발견

3. 목표 시점 별 분석 기획 방안
3.1. 당면한 분석 주제의 해결 "과제 중심"
3.2. 지속적 분석 문화 내재화 "마스터 플랜"

4. 분석 기획시 고려사항
4.1. 가용 데이터
4.2. 적절한 유스케이스
4.3. 장애요소

+) 데이터 종류- 정형 데이터, 반정형 데이터, 비정형 데이터

1. 분석기획의 특징

1.1.분석기획?

  • 실제 분석을 시작하기에 앞서 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업
  • 분석 과제 및 프로젝트를 직접 수행하지 않으나 어떤 목표(What)를 달성하기 위해(Why) 어떠한 데이터를 가지고 어떤 방식(How)으로 수행할 지에 대한 일련의 계획을 수립하는 작업
  • 성공적인 분석 결과를 도출하기 위해 중요한 사전 작업

 

1.2. 데이터 사이언티스트의 역량

"분석을 기획한다는 것= 분석역량과 균형 잡힌 시각을 가지고 방향성 및 계획을 수립한다."

분석역량 

  • 문제 영역에 대한 전문성 역량
  • 수학/ 통계학적 지식 활용

균형잡힌 시각 

  • 분석의 도구인 데이터 및 프로그래밍 기술 역량에 대한 균형잡힌 시각

2. 분석 대상과 방법

다 알면 최적화, 다 모르면 발견
대상을 모르면 통찰, 방법을 모르면 솔루션
분석의 대상(What)  
Known Un-Known   분석의 방법(How)
Optimization(최적화) Insight(통찰) Known
Solution(솔루션) Discovery(발견) Un-Known

3. 목표 시점 별 분석 기획 방안

3.1. 과제 중심적인 접근 방식

"당면한 과제를 빠르게 해결"

  • 속도와 검사 (speed & test)
  • 즉각적인 실행을 통한 성과 도출 (Quick & Win)
  • 문제 해결 (Problem Solving)

3.2. 장기적인 마스터 플랜 방식

"지속적인 분석 문화 내재화"

  • 정확도와 전개 (Accuracy & Deploy)
  • 장기적인 관점 (Long Term View)
  • 문제 정의 (Problem Definition)

4. 분석 기획 시 고려사항

4.1. 가용한 데이터

  • 분석을 위한 데이터 확보
  • 데이터 유형에 대한 분석이 선행되어야 함
  • (데이터의 유형에 따라 적용 가능한 솔루션 및 분석 방법이 다르기 때문)

4.2. 적절한 유스케이스

  • 가치가 창출될 수 있는 적절한 활용방안과 활용 가능한 유스케이스 탐색
  • 기존에 잘 구현되어 활용되고 있는 유사 분석 시나리오 및 솔루션을 최대한 활용 ("바퀴를 재발명하지 마라")

4.3. 과제 분석 수행을 위한 장애요소

  • 분석 수행 시 발생하는 장애요소에 대한 사전 계획 수립
  • 사용자가 쉽게 이해하고 활용할 수 있도록 방안을 수립
  • 일회성 분석으로 그치지 않고 조직의 역량으로 내재화하기 위해서는 충분하고 계속적인 교육 및 활용방안 등의 변화 관리가 고려되어야 함

+) 데이터 종류 (정형, 반정형, 비정형)

정형 데이터 반정형 데이터 비정형 데이터
  • 형태 O, 연산 O
  • 데이터 자체로 분석 가능
  • 데이터 수집 난이도가 낮음
  • 주로 관계형 데이터 베이스(RDB)에 저장됨
  • 내부 시스템인 경우가 재부분
  • 파일 형태의 스프레드 시트라도 내부에 형식을 가지고 있어 처리가 쉬운 편
  • 예) 관계형 데이터베이스, 스프레드 시트, csv/ ERP, CRM, SCM 등 정보 시스템 등
  • 형태 O, 연산 X
    (스키마, 메타데이터)
  • 데이터로 분석이 가능하지만 해석이 불가능하여 메타 정보를 활용해야 해석 가능
  • 데이터 수집 난이도 중간
  • 주로 파일에 저장됨
  • 보통 API 형태로 제공되기 때문에 데이터 처리 기술이 요구됨
  • 예) XML, HTML, machine data/ 로그 데이터, 모바일 데이터, 센싱 데이터 등
  • 형태 X, 연산 X
  • 데이터 자체로 분석이 불가능
  • 데이터 수집 난이도 높음
  • 주로 NoSQL에 저장
  • 텍스트 마이닝 혹은 파일일 경우 파일을 데이터 형태로 파싱 해야 하기 때문에 수집 데이터 처리가 어려움
  • 특정한 처리 프로세스를 거쳐 분석 데이터로 변경 후 분석
  • 예) 소셜 데이터, e-mail, 보고서, GPS/ 영상, 음성, 문자 등
반응형

댓글