본문 바로가기

Python (Data)/데이터 가공5

[Python] 데이터프레임 열 이름 변경 (change dataframe columns name) - rename, columns 데이터프레임을 다루다보면 열 이름을 변경 할 일이 정말 많습니다. 한번에 전체 columns명을 바꿀수도 있고, columns이 많은 경우 특정 column만 바꾸고 싶을때도 있죠. 전체 columns명을 바꿀 수 있는 df.columns와 특정 columns명만 바꿀때 적절한 rename()에 대해 정리해보겠습니다. 예시로 활용할 데이터프레임: name = ['Kim','Lee','Park'] age = ['25','35','45'] sex = ['F','F','M'] df = pd.DataFrame([name,age,sex]) df= df.transpose() df.columns = [ ] - 전체 columns 명을 바꿀때 적절 df.columns = [ 'column1', 'columns2', '.. 2022. 9. 15.
[Python Pandas] 데이터프레임 생성, pd.DataFrame() - dictionary to dataframe, list to dataframe, tuple to dataframe 데이터를 처리할 때 제일 기본이자 시작인 "데이터프레임 생성" 입니다. 사실 완전히 새로운 데이터를 생성하기 보다는, 이미 존재하는 csv, tsv, txt, xslx 파일을 읽어들여 가공하는 일이 많지만 간혹 리스트들을 가지고 데이터프레임을 만들거나 빈 데이터 프레임을 생성하는 경우는 종종 있습니다. 이번 포스팅에서는 데이터프레임을 생성하는 방법을 정리하려 합니다. 데이터 프레임을 생성하기전 pandas 모듈을 import 해주세요. import pandas as pd 데이터프레임을 생성하는 방법은 pandas 모듈의 DataFrame() 함수를 활용하는 것입니다. pd.DataFrame( data = , index = , columns = , dtype = , copy = ) DataFrame의 pa.. 2022. 9. 15.
[python & Jupyter] 필요한 열로만 데이터 프레임 만드는 방법 두 가지 + drop 명령 이전 포스팅에서 만든 데이터 프레임을 이용한 작업입니다 [python & Jupyter] 폴더 내 여러 개의 csv파일을 하나의 데이터 프레임으로 한 번에 합치기 FinanceData에서 받은 연도별 주식 데이터를 하나의 데이터 프레임으로 합치는 작업 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운로드하게 되면 marcap/data라는 폴더 안에 주식 데이터 파 hyunsitstory.tistory.com 필요한 데이터를 받아서 작업을 하려고 데이터 프레임을 보면 내가 필요 없는 데이터도 포함되어 있기 마련이다. 이 데이터프레임을 가지고 계속 작업하면 필요 없는 부분도 계속 포함되다 보니 보기에도 불편하고 효율성이 그다지 좋지 않아 필요한 열만 포함하고 있는 데이터 프레임을 원하게 된다.. 2021. 3. 29.
[Python Pandas] 폴더 내 여러 개의 csv파일을 하나의 데이터 프레임으로 한 번에 합치기 FinanceData에서 받은 연도별 주식 데이터를 하나의 데이터 프레임으로 합치는 작업 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운로드하게 되면 marcap/data라는 폴더 안에 주식 데이터 파일이 연도별로 존재한다. 파일 리스트 확인하기 먼저 FinanceData에서 알려주는 방법을 따라 데이터를 다운받게 되면 marcap/data라는 폴더 안에 주식 데이터 파일이 연도별로 존재한다. 파일 리스트를 확인하려고 할 때, Jupyter에서 "ls" 명령을 치려고 하니 에러가 발생하였는데 구글링 해 본 결과 os를 import하고 다음과 같은 "os.listdir()"를 이용하면 된다/ 위 사진을 보면 95년부터 21년까지 연도별로 파일이 존재하는 것을 확인 할 수 있다. 모든 연도.. 2021. 3. 29.
[Python Pandas] csv파일 읽기, csv파일로 내보내기 csv파일을 읽기 위해서는 pandas 라이브러리가 필요하기 때문에 먼저 pandas를 import 해줍니다. 이때, pandas를 편하게 이용하기 위해 pd로 import 합니다. import pandas as pd csv 파일 읽기 변수= pd.read_csv('파일주소/파일이름.csv') * 이때 변수는 불러올 파일을 저장할 이름 df= pd.read_csv('./result.csv') 1. 파일 위치가, 현재 작성 중인 코드 파일의 위치와 같을 때 ' ./ ' 2. result.csv 파일을 읽어옴 3. df라는 변수에 불러온 파일을 저장 +) 불러온 파일을 확인하기 위해서는 df를 다시 실행해야 함 ※ 데이터는 보이지 않게 가렸습니다 csv 파일로 내보내기 변수.to_csv('파일주소/파일이름... 2021. 2. 21.