본문 바로가기
자격증/ADsP

[ADsP 2과목] 데이터 분석 기획의 이해 정리 part 3 - 분석 과제 발굴(하향식/ 상향식 접근법), 분석 프로젝트 관리 방안

by Gina Sim 2021. 8. 12.
차례

1. 분석 과제 발굴 방법론
1.1. 하향식 접근법
1.2. 상향식 접근법
1.3. 하향식 접근방식 VS 상향식 접근방식

2. 분석 과제 정의서

3. 분석 프로젝트 관리 방안
3.1. 분석 과제 관리를 위한 5가지 주요 영역
3.2. 분석 프로젝트 관리 방안

1. 분석과제 발굴 방법론

출처 https://blog.naver.com/2heewoong/221509203628

1.1. 하향식 접근법 (Top-Down Approach)

출처 https://acdongpgm.tistory.com/79

  • 문제가 주어지고 이에 대한 해법을 찾기 위해(Problem Solving) 각 과정이 체계적으로 단계화되어 수행하는 방식
  • 현황 분석을 통해 기회나 문제를 탐색(Problem Discovery)하고, 해당 문제를 정의(Problem Definition), 해결방안을 탐색(Solution Search) 한 후 데이터 분석의 타당성 평가(Feasibility Study)를 거쳐 분석 과제를 도출하는 과정으로 구성된다

 

1.2. 상향식 접근법 (Bottom-Up Approach)

  • 다양한 원천 데이터를 대상으로 분석을 수행하여 가치 있는 문제를 도출하는(Problem Creation) 일련의 과정
  • 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론
  • 비지도 학습과 지도 학습

 

1.3. 하향식 접근방식 VS 상향식 접근방식

하향식 접근 방법 상향식 접근방법
문제가 주어지고 이에 대한 해법을 찾기 위하여 각 과정이 체계적으로 단계화 되어 수행하는 방식 문제의 정의 자체가 어려운 경우 데이터를 기반으로 문제의 재정의 및 해결방안을 탐색하고 이를 지속적으로 개선하는 방식

1.1. 하향식 접근법

1단계 | 문제 탐색 단계

  • 무엇을(What) 어떤 목적으로(Why) 수행해야 하는지에 대한 관점

(1) 비즈니스 모델 기반 문제 탐색

출처 https://databonanza.tistory.com/58

  • 기업 내·외부 환경을 포괄하고 있는 비즈니스 모델이라는 틀(Frame)을 활용하여 비즈니스 모델 캔버스의 9가지 블록을 단순화
  • 비즈니스 모델 캔버스를 활용한 과제 발굴 방법 5가지: 업무(Operation), 제품(Product), 고객(Customer), 규제와 감사(Audit&Regulation), 지원 인프라(IT&Human Resource)

 

(2) 분석 기회 발굴의 범위 확장

출처 https://databonanza.tistory.com/58

(2)-1. 거시적 관점의 메가 트렌드 (STEEP)

  • 조직 및 해당 산업에 폭넓게 영향을 미치는 사회·경제적 요인을 요약
영역 내용
Social (사회) 전체 시장을 대상으로 사회적, 문화적, 구조적 트렌드 변화에 기반한 분석 기회를 도출 - 노령화
- 밀레니엄 세대 등장
- 저출산에 따른 사업모델 변화
Technological (기술) 최신 기술의 등장 및 변화에 따른 역량 내재화와 제품·서비스 개발에 대한 분석 기회 도출 - 나노 기술
- IT 융합 기술
- 로봇 기술의 고도화로 인한 제품의 smart화
Economic (경제) 산업과 금융 전반의 변동성 및 경제 구조 변화 동향에 다른 시장의 흐름 파악하고, 이에 대한 분석 기회 도출 - 원자재 가격, 환율, 금리 변동에 따른 구매전령의 변화 등
Environmental (환경) 환경과 관련된 정부, 사회단체, 시민사회의 관심과 규제 동향을 파악하고 이에 대한 분석 기회를 도출 - 탄소 배출 규제 및 거래 시장 등장에 따른 원가 절감 및 정보 가시화 등
Political (정치) 주요 정책방향, 정세, 지정학적 동향 등의 거시적인 흐름을 토대로 한 분석 기회 도출 - 대북관계 동향에 따른 원재자 구매 거래선의 다변화 등

(2)-2. 시장의 니즈 탐색 관점

  • 고객 (Customer) - 고객의 구매 동향 및 고객의 콘텍스트를 더욱 깊게 이해
  • 채널 (Channel) - 최종 고객에게 상품·서비스를 전달하는 것에 가능한 경로를 파악하여 해당 경로에 존재하는 채널별로 분석 기회를 확대하여 탐색
  • 영향자 (Influencer) - 기업 의사결정에 영향을 미치는 주주·투자자·협회 및 기타 이해 관계자의 주요 관심사항에 대해서 파악하고 분석 기회를 탐색

 

(3) 외부 참조 모델 기반 문제 탐색

  • 유사·동종 사례 벤치마킹을 통한 분석 기회 발굴
  • 기존에 수행한 분석 과제를 살펴봄으로써 중요한 시사점을 도출
  • "Quick&Easy" 방식으로 필요한 분석 기회가 무엇인지에 대한 아이디어 얻고, 기업에 적용할 분석 테마 후보 목록을 브레인스토밍을 통해 빠르게 도출

(4) 분석 유즈케이스

  • 풀어야 할 문제에 대한 상세한 설명 및 해당 문제를 해결했을 때 발생하는 효과를 명시
  • 향후 데이터 분석 문제로의 전환 및 적합성 평가에 활용하도록 함

 

2단계 | 문제 정의 단계

  • 식별된 비즈니스 문제를 데이터의 문제로 변환하여 정의
  • 해당 문제가 해결되었을 때 효용을 얻을 수 있는 최종 사용자(End User) 관점에서 데이터 분석 문제의 정의 및 요구사항이 이루어져야 함
  • 가능한 정확하게 분석의 관점으로 문제를 재정의 할 필요가 있다
  • 분석 문제(What)를 달성하기 위해서 필요한 데이터 및 기법(How)을 정의

< 비즈니스 문제를 분석 문제로 변환 >

출처 https://dsbook.tistory.com/122

 

3단계 | 해결방안 탐색

출처 https://needjarvis.tistory.com/528

  • 정의된 데이터 분석 문제를 해결하기 위한 다양한 방안 모색
  • 동일한 데이터 분석 문제라고 해도 어떤 데이터 또는 분석 시스템을 사용할 것인지에 따라서 소요되는 예산 및 활용 가능한 도구가 다르기 때문에 다각도로 고려할 필요가 있음

 

4단계 | 타당성 검토

  • 도출된 분석 문제나 가설에 대한 대안을 과제화하기 위해 다각적인 타당성 분석이 수행되어야 함

(1) 경제적 타당성

  • 비용 대비 편익 분석 관점의 접근
  • 비용 항목: 데이터, 시스템, 인력, 유지보수 등
  • 편익: 실질적 비용 절감, 추가적 매출과 수익 등의 경제적 가치

(2) 데이터 및 기술적 타당성

  • 데이터 분석에는 데이터 존재 여부, 분석 시스템 환경 , 분석 역량 필요

 

 

 

1.2. 상향식 접근법(Bottom up Approach)

(1) 기존 하향식 접근법의 한계를 극복하기 위한 분석 방법론

  • 답을 미리 내는 것이 아니라 사물을 있는 그대로 인식하는 'What' 관점에서 보아야 한다는 것
  • 객관적으로 존재하는 데이터 그 자체를 관찰하고 행동에 옮김으로써 대상을 더 잘 이해하는 방식으로 접근 수행

(2) 비지도 학습과 지도 학습

출처 http://ai4school.org/?page_id=2617

(2)-1. 비지도 학습(Unsupervised Learning)

  • 일반적으로 상향식 접근 방식의 데이터 분석은 비지도 학습에 의해 수행
  • 데이터 자체의 결합, 연관성, 유사성 등을 중심으로 데이터의 상태를 표현
  • 자료가 출력 변수 없이 입력 변수만 주어지고 입력 자료 값들 간의 관계를 탐색적으로 분석 
  • 목표 값을 사전에 정의하지 않고 데이터 자체만을 가지고 그룹들을 도출함으로써 새로운 유형의 인사이트를 도출하기에 유용
  • 예) 장바구니 분석, 군집분석(clustring), 기술 통계 및 프로파일링, 분류

(2)-2. 지도 학습(Supervised Learning)

  • 명확한 목적하에 데이터 분석을 실시하는 것
  • 분류, 추측, 예측, 최적화를 통해 사용자의 주도하에 분석을 실시하고 지식을 도출
  • 자료가 입력 변수와 출력 변수로 주어지고 입력 변수와 출력 변수의 함수적 의존 관계를 자료로부터 추정
  • 도출되는 값에 대하여 사전에 인지하고 어떠한 데이터를 넣었을 대 어떤 결과가 나올지 예측
  • 예) 예측, 분류(classification)

 

(3) 시행착오를 통한 문제 해결 (프로토타이핑 접근법)

  • 사용자가 요구사항이나 데이터를 정확히 규정하기 어렵고 데이터 소스도 명확히 파악하기 어려운 상황에서 일단 분석을 시도해보고 그 결과를 확인해 가면서 반복적으로 개선해 나가는 방법
  • 신속하게 해결책이나 모형을 제시함으로써 문제를 좀 더 명확하게 인식하고 필요한 데이터를 식별하여 구체화할 수 있다

2. 분석 과제 정의서

  • 향후 프로젝트 수행 계획의 입력물로 사용
  • 프로젝트의 방향을 설정하고 성공 여부를 판별할 수 있는 주요한 자료로써 명확하게 작성되어야 함
  • 분석 과제 정의서를 통해 분석 별로 필요한 소스 데이터, 분석방법, 데이터 입수 및 분석의 난이도, 분석 수행 주기, 분석 결과에 대한 검증 오너십, 상세 분석 과정 등을 정의
  • 분석 데이터 소스는 내·외부의 비구조적인 데이터와 소셜 미디어 및 오픈 데이터까지 범위를 확장하여 고려하고 분석 방법 또한 상세하게 정의한다.
  • 분석명 분석 정의
    해지 상담 접촉 패턴 분석 기 해지 계약건 발생 고객의 해지 시점 상담정보 분석을 통해 해지 고객의 상담 특성을 발굴하는 분석
    소스 데이터  데이터 입수 난이도 분석방법
    접촉채널, 건수, 접촉 평균 시간, 최종 접촉 이후 해지까지 시간, 상담인력 업무 능숙도 서비스 수준 유지 해지로 이어지는 해지 상담의 유의미한 속성을 요인 분석을 통해 발굴하고 클러스터링 분석을 통해 영향요인을 그룹핑하고, 그룹핑된 요인 그룹에 해지에 미치는 영향도를 회귀 분석함
    데이터 입수 사유
    N/A
    분석 적용 난이도 분석적용 난이 사유 분석 주기 분석 결과 검증 Owner
    접촉 로그 등의 비구조적 데이터 분석 필요 월별 업데이터 해지방어팀

3. 분석 프로젝트 관리 방안

3.1. 분석 과제 관리를 위한 5가지 주요 영역

  • 다른 프로젝트 유형처럼 분석, 일정, 품질, 리스크, 의사소통 등 영역별 관리가 수행되어야 함
  • 다양한 데이터에 기반한 분석기법을 적용하는 특성 때문에 5가지의 주요 속성을 고려한 추가적인 관리 필요

출처 http://naver.me/FlJ4l3Jn

(1) 데이터 크기(Data Size)

  • 분석하고자 하는 데이터의 양을 고려한 관리 방안 수립 필요

(2) 데이터 복잡성(Data Complexity)

  • 텍스트, 오디오, 비디오 등의 비정형 데이터 및 다양한 시스템에 산재되어 있는 원천 데이터 들을 통합해서 분석
  • 분석 프로젝트를 수행할 때 데이터에 잘 적용될 수 있는 분석 모델의 선정 등에 대한 사전 고려 필요

(3) 속도(Speed)

  • 실시간으로 사기(Fraud)
  • 를 탐지하거나 고객에게 개인화된 상품·서비스를 추천하는 경우에는 분석 모델의 적용 및 계산이 실시간으로 수행되어야 하기 때문에 프로젝트 수행 시 분석 모델의 성능 및 속도를 고려한 게임 및 텍스트가 수행되어야 함

 

(4) 분석 복잡성(Analytic Complexity)

  • 분석 모델의 정확도와 복잡도는 트레이드 오프 관계가 존재
  • 분석 모델이 복잡할수록 정확도는 올라가지만 해석이 어려워지는 단점이 존재
  • 이에 대한 기준을 사전에 정의해두어야 함

(5) 정확도&정밀도 (Accuracy&Precision)

  • 정확도는 모델과 실제 값 사이의 차이가 적은 것 의미
  • 정밀도는 모델을 지속적으로 반복했을 때의 편차의 수준으로써 일관적으로 동일한 결과를 제한다
  • 활용적 측면- 정확도 중요/ 안정성 측면- 정밀도가 중요

출처 https://adailyvet.co.kr/news/practice/companion-animal/88473

 

3.2. 분석 프로젝트 관리 방안

  • 통합, 이해관계자, 범위, 자원, 시간, 원가, 리스크, 품질, 조달, 의사소통

 

 

 

반응형

댓글