본문 바로가기
Python (Data)/데이터 가공

[python & Jupyter] 필요한 열로만 데이터 프레임 만드는 방법 두 가지 + drop 명령

by Gina Sim 2021. 3. 29.

이전 포스팅에서 만든 데이터 프레임을 이용한 작업입니다

 

[python & Jupyter] 폴더 내 여러 개의 csv파일을 하나의 데이터 프레임으로 한 번에 합치기

FinanceData에서 받은 연도별 주식 데이터를 하나의 데이터 프레임으로 합치는 작업 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운로드하게 되면 marcap/data라는 폴더 안에 주식 데이터 파

hyunsitstory.tistory.com

 

필요한 데이터를 받아서 작업을 하려고 데이터 프레임을 보면 내가 필요 없는 데이터도 포함되어 있기 마련이다.

이 데이터프레임을 가지고 계속 작업하면 필요 없는 부분도 계속 포함되다 보니

보기에도 불편하고 효율성이 그다지 좋지 않아 필요한 열만 포함하고 있는 데이터 프레임을 원하게 된다.

 

이때 사용할 수 있는 두가지 방법은 다음과 같다.

1. 필요한 열들만 취하여 새로운 데이터 프레임을 만들기
2. 필요 없는 열을 제거하기

 

1. 필요한 열들만 취하여 새로운 데이터 프레임 만들기

필요한 열들을 직접 리스트로 적어주어야 하기 때문에 전체 열에 비해 필요한 열의 수가 적을 때 이용

 

원래 데이터 프레임을 확인해보면 다음과 같이 많은 열을 포함하고 있다. (18개)

 

여기서 필요한 7개의 열을 가져와 새로운 데이터 프레임 "df_all_needed"를 생성한다.

이때 주의할 점은 대괄호를 두 번 한다는 점 "[[ ]]"
1. 첫 번째 대괄호 [ ] - 리스트의 요소에 인덱스로 접근하듯 데이터 프레임의 열에 접근하기 위함
2. 두번째 대괄호 [[ ]]- 여러 개의 열을 동시에 취할 것이기 때문에 열의 이름을 리스트로 적어주기 위함


 

2. 필요 없는 열들을 제거

필요 없는 열들을 직접 리스트로 적어주어야하기 때문에 전체 열에서 drop 할 열의 수가 적을 때 이용

 

원래 데이터 프레임이 다음과 같을 때, 

 

 필요없는 열 3개를 "drop"을 이용하여 제거

이 때는 소괄호 "( )" 안에 대괄호 "[ ]"를 적어준다.
1. 소괄호 ( ) - drop()이라는 변수를 사용하기 위함
2. 대괄호 [ ] - drop 하고자 하는 열 이름들을 리스트로 적어주기 위함
3. "axis=1" - drop 명령을 열에 대해 실행하겠다는 의미

 

 

 

반응형

댓글