Seongwon Lim

[Python] Pandas to_csv()를 이용한 csv 파일 저장 본문

Python

[Python] Pandas to_csv()를 이용한 csv 파일 저장

limsw 2022. 5. 30. 12:15
반응형

서론

이번 글에서는 파이썬의 Pandas 라이브러리를 이용해서 데이터를 CSV 파일로 저장하는 방법을 알아보고자 한다.

CSV 파일이란?

CSV(comma-separated values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 확장자는 .csv 이다.

오래전부터 엑셀 스프레드시트나 데이터베이스 소프트웨어에서 많이 쓰이고 있으며 현재에도 CSV 파일을 엑셀에서 사용하는 경우가 많다.

모듈 설치하기

  • pip install pandas
  • 또는 아나콘다(Anaconda)를 설치하여 pandas 모듈을 사용할 수도 있다.

to_csv() 메서드를 이용하여 CSV 파일로 저장하기

import pandas as pd

data = [["A", "B", "C"], [4, 5, 6], [True, False, False]]

dataFrame = pd.DataFrame(data)
print(dataFrame)

data 변수는 3x3으로 이루어진 2차원 배열이며, 해당 데이터를 DataFrame 형태로 변환한다.

위와 같이 pandas 모듈을 불러온 뒤 모듈.DataFrame() 명령어를 이용해서 데이터 프레임 형태로 바꿀 수 있다.

 

출력문을 살펴보면 다음과 같다.

  0 1 2
0 A B C
1 4 5 6
2 True False False

 

이제 변환된 데이터프레임을 CSV 파일로 저장해보자. 다음과 같이 코드를 추가한다.

dataFrame.to_csv("result.csv", header=False, index=False)
  • 첫번째 인자 : 파일을 저장할 위치와, 파일 이름을 정의한다. 위와 같이 정의하면 현재 디렉토리에 result.csv 파일이 생성된다.
  • 두번째 인자 : 열 이름을 정의한다. False일 경우에는 열 이름을 출력하지 않는다.
  • 세번째 인자 : 인덱스의 출력 여부를 정의한다. False일 경우 인덱스를 출력하지 않는다.

먼저 header, index 모두 False로 정의한 경우의 결과는 다음과 같다.

출력문과 달리 맨 위의 헤더와 왼쪽의 인덱스가 없어진 것을 확인할 수 있다.

 

만약 header, index를 모두 True로 바꾼 경우에는 결과가 다음과 같은 결과를 얻을 수 있다.


출처

Comments