본문 바로가기

분류 전체보기60

[컴활 1급 필기] 1과목 컴퓨터 일반 - 빈출 개념 정리 part 1 참고 Tip 최대한 기출문제 보기에 나왔던 문장 그대로 정리하였으니 문장을 그대로 보면 시험칠 때 익숙 형광펜 칠한 문장 => 기출문제에서 답이었던 문장 빨간 글씨 => 보기에 오답으로 바꾸어 출제되었던 부분 진한 글씨 => 답은 아니었지만 기출에 자주 출제된 보기 멀티미디어의 특징 디지털화(Digitalization), 쌍방향성(Interactive), 비선형성(Non-Linear), 정보의 통합성(Intergration) 디지털 데이터로 변환하여 통합 처리한다 정보 제공자와 사용자 간의 상호작용에 의해 데이터가 전달된다 데이터가 사용자 선택에 따라 비순차적으로 처리되는 비선형성의 특징을 가진다 문자, 그림, 사운드 등의 여러 미디어를 통합하여 처리한다 보안 위협의 구체적 형태 분산 서비스 거부 공격(.. 2021. 8. 14.
[ADsP 2과목] 데이터 분석 기획의 이해 정리 part 3 - 분석 과제 발굴(하향식/ 상향식 접근법), 분석 프로젝트 관리 방안 차례 1. 분석 과제 발굴 방법론 1.1. 하향식 접근법 1.2. 상향식 접근법 1.3. 하향식 접근방식 VS 상향식 접근방식 2. 분석 과제 정의서 3. 분석 프로젝트 관리 방안 3.1. 분석 과제 관리를 위한 5가지 주요 영역 3.2. 분석 프로젝트 관리 방안 1. 분석과제 발굴 방법론 1.1. 하향식 접근법 (Top-Down Approach) 문제가 주어지고 이에 대한 해법을 찾기 위해(Problem Solving) 각 과정이 체계적으로 단계화되어 수행하는 방식 현황 분석을 통해 기회나 문제를 탐색(Problem Discovery)하고, 해당 문제를 정의(Problem Definition), 해결방안을 탐색(Solution Search) 한 후 데이터 분석의 타당성 평가(Feasibility Stu.. 2021. 8. 12.
[ADsP 2과목] 데이터 분석 기획의 이해 정리 part 2 - 분석 방법론(폭포수, 애자일, 나선형 모델/ KDD, CRISP-DM, 빅데이터 분석 방법론) 차례 1. 분석 방법론 생성과정 2. 분석 방법론의 모델 2.1. 폭포수 모델 2.2. 애자일(Agile) 모델 2.3. 프로토타입 모델 2.4. 나선형 모델 3. 방법론의 구성 3.1. 계층적 프로세스 모델 4. 분석 방법론 4.1. KDD 4.2. CRISP-DM 4.3. 빅데이터 분석 방법론 4.4. 방법론 비교 1. 분석 방법론 생성과정 구분 의미 예 특징 상호작용 암묵지 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식 김치 담그기, 자전거 타기 사회적으로 중요하지만 다른 사람에게 공유되기 어려움 내면화, 공통화 형식지 문서나 매뉴얼처럼 형상화된 지식 교과서, 비디오, DB 전달과 공유가 용이함 표출화, 연결화 2. 분석 방법론의 모델 2.1. 폭포수 모델 단계를 순차적으로.. 2021. 8. 11.
[ADsP 2과목] 데이터 분석 기획의 이해 정리 part 1- 분석기획 방향성 도출(최적화, 통찰, 솔루션, 발견/ 과제 중심적 접근, 장기적인 마스터 플랜/ 분석 기획시 고려사항) 차례 1. 분석기획의 특징 1.1. 분석기획 1.2. 데이터 사이언티스트의 역량 2. 분석 대상과 방법 2.1. 최적화, 통찰, 솔루션, 발견 3. 목표 시점 별 분석 기획 방안 3.1. 당면한 분석 주제의 해결 "과제 중심" 3.2. 지속적 분석 문화 내재화 "마스터 플랜" 4. 분석 기획시 고려사항 4.1. 가용 데이터 4.2. 적절한 유스케이스 4.3. 장애요소 +) 데이터 종류- 정형 데이터, 반정형 데이터, 비정형 데이터 1. 분석기획의 특징 1.1.분석기획? 실제 분석을 시작하기에 앞서 수행할 과제를 정의하고, 의도했던 결과를 도출할 수 있도록 이를 적절하게 관리할 수 있는 방안을 사전에 계획하는 일련의 작업 분석 과제 및 프로젝트를 직접 수행하지 않으나 어떤 목표(What)를 달성하기 위해(.. 2021. 8. 10.
[공공데이터 open API] 에러 핸들링: "Module not found Error: No module named 'urllib2'", "ImportError: cannot import name 'urlencode' from 'urllib'" 공공데이터 포털에서 open API를 받아오면서 발생한 "Module not found" 에러와 "Import Error" 에러 핸들링 결과부터 말하자면 파이썬 버전의 차이에 따른 문제였다 현재 사용 중인 파이썬 버전은 3.9.1 공공데이터 포털 https://www.data.go.kr/ 먼저 활용한 데이터는 공공데이터 포털에 등록되어 있는 한국산업인력공단의 데이터인 " 산업인력 국가기술자격 통계 정보" 먼저 활용하고 싶은 open API 상세를 보면 화면 하단에 아래와 같은 샘플 코드가 나온다. 이 샘플 코드는 open API를 불러오는 코드로 자신이 사용하는 언어에 맞는 샘플 코드를 활용하면 된다. 오류 발생/ 에러 핸들링 Jupyter notebook에서 python을 이용하여 API를 불러올 것이.. 2021. 7. 26.
[Excel] 단축키 정리 및 셀 포인터 이동/ 범위 지정- Ctrl, Shift, Alt 차이 Tab 오른쪽 셀로 이동 Shift + Tab 왼쪽 셀로 이동 Enter 아래쪽 셀로 이동 Shift + Enter 위쪽 셀로 이동 Home 해당 행의 A열로 이동 Ctrl + Home A1 셀로 이동 Ctrl + End 데이터 범위의 마지막 셀(맨 오른쪽 아래)로 이동 Ctrl + 방향키 화살표 방향으로 데이터 범위의 마지막 셀로 이동 PgUp, PgDn 한 시트 내에서 위, 아래 이동 Alt + PgUp/ PgDn 한 시트 내에서 좌, 우로 이동 Ctrl + PgUp/ PgDn 현재시트의 앞, 뒤 다른 시트로 이동 F5 셀 주소를 직접 입력하여 이동 연속된 셀 테이블 형태 Shift키를 누른채로 첫번째 셀과 마지막 셀을 클릭 Ctrl + Shift + 방향키 원하는 행방향과 열방향으로 방향키를 모두 .. 2021. 7. 20.
[python & Jupyter] 필요한 열로만 데이터 프레임 만드는 방법 두 가지 + drop 명령 이전 포스팅에서 만든 데이터 프레임을 이용한 작업입니다 [python & Jupyter] 폴더 내 여러 개의 csv파일을 하나의 데이터 프레임으로 한 번에 합치기 FinanceData에서 받은 연도별 주식 데이터를 하나의 데이터 프레임으로 합치는 작업 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운로드하게 되면 marcap/data라는 폴더 안에 주식 데이터 파 hyunsitstory.tistory.com 필요한 데이터를 받아서 작업을 하려고 데이터 프레임을 보면 내가 필요 없는 데이터도 포함되어 있기 마련이다. 이 데이터프레임을 가지고 계속 작업하면 필요 없는 부분도 계속 포함되다 보니 보기에도 불편하고 효율성이 그다지 좋지 않아 필요한 열만 포함하고 있는 데이터 프레임을 원하게 된다.. 2021. 3. 29.
[Python Pandas] 폴더 내 여러 개의 csv파일을 하나의 데이터 프레임으로 한 번에 합치기 FinanceData에서 받은 연도별 주식 데이터를 하나의 데이터 프레임으로 합치는 작업 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운로드하게 되면 marcap/data라는 폴더 안에 주식 데이터 파일이 연도별로 존재한다. 파일 리스트 확인하기 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운받게 되면 marcap/data라는 폴더 안에 주식 데이터 파일이 연도별로 존재한다. 파일 리스트를 확인하려고 할 때, Jupyter에서 "ls" 명령을 치려고 하니 에러가 발생하였는데 구글링 해 본 결과 os를 import하고 다음과 같은 "os.listdir()"를 이용하면 된다/ 위 사진을 보면 95년부터 21년까지 연도별로 파일이 존재하는 것을 확인 할 수 있다. 모든 연도.. 2021. 3. 29.
[Python Pandas] csv파일 읽기, csv파일로 내보내기 csv파일을 읽기 위해서는 pandas 라이브러리가 필요하기 때문에 먼저 pandas를 import 해줍니다. 이때, pandas를 편하게 이용하기 위해 pd로 import 합니다. import pandas as pd csv 파일 읽기 변수= pd.read_csv('파일주소/파일이름.csv') * 이때 변수는 불러올 파일을 저장할 이름 df= pd.read_csv('./result.csv') 1. 파일 위치가, 현재 작성 중인 코드 파일의 위치와 같을 때 ' ./ ' 2. result.csv 파일을 읽어옴 3. df라는 변수에 불러온 파일을 저장 +) 불러온 파일을 확인하기 위해서는 df를 다시 실행해야 함 ※ 데이터는 보이지 않게 가렸습니다 csv 파일로 내보내기 변수.to_csv('파일주소/파일이름... 2021. 2. 21.
[python 자료형] Boolean type(불리언 타입)과 논리 연산자 Boolean type: bool bool 자료형은 참(True)과 거짓(False)으로 나타내는 자료형이다. a = True b = False type(a) # type(b) # 1 3+3 # False 10 == 1*10 # True ※ True와 False는 파이썬의 예약어로 첫 문자를 항상 대문자로 써야 한다. 자료형의 참과 거짓 1. 문자열이 비어있는 경우 2. 자료구조(리스트, 튜플 등)가 비어있는 경우 3. 숫자 0 4. None " " False [ ] ( ) { } 0 None 1. 0보다 큰 수 2. 비어있지 않은 문자열이나 자료구조 bool 연산 bool( 값 또는 식 ) 논리 연산자(logical operator) or - 논리식 중에 하나라도 True이면.. 2021. 2. 4.