Python
[Python] Pandas to_csv()를 이용한 csv 파일 저장
limsw
2022. 5. 30. 12:15
반응형
서론
이번 글에서는 파이썬의 Pandas 라이브러리를 이용해서 데이터를 CSV 파일로 저장하는 방법을 알아보고자 한다.
CSV 파일이란?
CSV(comma-separated values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 확장자는 .csv 이다.
오래전부터 엑셀 스프레드시트나 데이터베이스 소프트웨어에서 많이 쓰이고 있으며 현재에도 CSV 파일을 엑셀에서 사용하는 경우가 많다.
모듈 설치하기
- pip install pandas
- 또는 아나콘다(Anaconda)를 설치하여 pandas 모듈을 사용할 수도 있다.
to_csv() 메서드를 이용하여 CSV 파일로 저장하기
import pandas as pd
data = [["A", "B", "C"], [4, 5, 6], [True, False, False]]
dataFrame = pd.DataFrame(data)
print(dataFrame)
data 변수는 3x3으로 이루어진 2차원 배열이며, 해당 데이터를 DataFrame 형태로 변환한다.
위와 같이 pandas 모듈을 불러온 뒤 모듈.DataFrame() 명령어를 이용해서 데이터 프레임 형태로 바꿀 수 있다.
출력문을 살펴보면 다음과 같다.
0 | 1 | 2 | |
0 | A | B | C |
1 | 4 | 5 | 6 |
2 | True | False | False |
이제 변환된 데이터프레임을 CSV 파일로 저장해보자. 다음과 같이 코드를 추가한다.
dataFrame.to_csv("result.csv", header=False, index=False)
- 첫번째 인자 : 파일을 저장할 위치와, 파일 이름을 정의한다. 위와 같이 정의하면 현재 디렉토리에 result.csv 파일이 생성된다.
- 두번째 인자 : 열 이름을 정의한다. False일 경우에는 열 이름을 출력하지 않는다.
- 세번째 인자 : 인덱스의 출력 여부를 정의한다. False일 경우 인덱스를 출력하지 않는다.
먼저 header, index 모두 False로 정의한 경우의 결과는 다음과 같다.
출력문과 달리 맨 위의 헤더와 왼쪽의 인덱스가 없어진 것을 확인할 수 있다.
만약 header, index를 모두 True로 바꾼 경우에는 결과가 다음과 같은 결과를 얻을 수 있다.