이전 포스팅에서 만든 데이터 프레임을 이용한 작업입니다
필요한 데이터를 받아서 작업을 하려고 데이터 프레임을 보면 내가 필요 없는 데이터도 포함되어 있기 마련이다.
이 데이터프레임을 가지고 계속 작업하면 필요 없는 부분도 계속 포함되다 보니
보기에도 불편하고 효율성이 그다지 좋지 않아 필요한 열만 포함하고 있는 데이터 프레임을 원하게 된다.
이때 사용할 수 있는 두가지 방법은 다음과 같다.
1. 필요한 열들만 취하여 새로운 데이터 프레임을 만들기
2. 필요 없는 열을 제거하기
1. 필요한 열들만 취하여 새로운 데이터 프레임 만들기
필요한 열들을 직접 리스트로 적어주어야 하기 때문에 전체 열에 비해 필요한 열의 수가 적을 때 이용
원래 데이터 프레임을 확인해보면 다음과 같이 많은 열을 포함하고 있다. (18개)
여기서 필요한 7개의 열을 가져와 새로운 데이터 프레임 "df_all_needed"를 생성한다.
이때 주의할 점은 대괄호를 두 번 한다는 점 "[[ ]]"
1. 첫 번째 대괄호 [ ] - 리스트의 요소에 인덱스로 접근하듯 데이터 프레임의 열에 접근하기 위함
2. 두번째 대괄호 [[ ]]- 여러 개의 열을 동시에 취할 것이기 때문에 열의 이름을 리스트로 적어주기 위함
2. 필요 없는 열들을 제거
필요 없는 열들을 직접 리스트로 적어주어야하기 때문에 전체 열에서 drop 할 열의 수가 적을 때 이용
원래 데이터 프레임이 다음과 같을 때,
필요없는 열 3개를 "drop"을 이용하여 제거
이 때는 소괄호 "( )" 안에 대괄호 "[ ]"를 적어준다.
1. 소괄호 ( ) - drop()이라는 변수를 사용하기 위함
2. 대괄호 [ ] - drop 하고자 하는 열 이름들을 리스트로 적어주기 위함
3. "axis=1" - drop 명령을 열에 대해 실행하겠다는 의미
반응형
댓글