Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- Android
- Scheduling
- macos
- React
- node.js
- HTML
- Crawling
- AWS
- docker
- linux
- OOAD
- Express
- Kotlin
- mongoose
- DATABASE
- ubuntu
- TypeScript
- OS
- css
- typeorm
- Network
- sequelize
- algorithm
- Util
- mysql
- python
- MongoDB
- wireshark
- postman
- S3
Archives
- Today
- Total
Seongwon Lim
[Python] Pandas to_csv()를 이용한 csv 파일 저장 본문
반응형
서론
이번 글에서는 파이썬의 Pandas 라이브러리를 이용해서 데이터를 CSV 파일로 저장하는 방법을 알아보고자 한다.
CSV 파일이란?
CSV(comma-separated values)는 몇 가지 필드를 쉼표(,)로 구분한 텍스트 데이터 및 텍스트 파일이다. 확장자는 .csv 이다.
오래전부터 엑셀 스프레드시트나 데이터베이스 소프트웨어에서 많이 쓰이고 있으며 현재에도 CSV 파일을 엑셀에서 사용하는 경우가 많다.
모듈 설치하기
- pip install pandas
- 또는 아나콘다(Anaconda)를 설치하여 pandas 모듈을 사용할 수도 있다.
to_csv() 메서드를 이용하여 CSV 파일로 저장하기
import pandas as pd
data = [["A", "B", "C"], [4, 5, 6], [True, False, False]]
dataFrame = pd.DataFrame(data)
print(dataFrame)
data 변수는 3x3으로 이루어진 2차원 배열이며, 해당 데이터를 DataFrame 형태로 변환한다.
위와 같이 pandas 모듈을 불러온 뒤 모듈.DataFrame() 명령어를 이용해서 데이터 프레임 형태로 바꿀 수 있다.
출력문을 살펴보면 다음과 같다.
0 | 1 | 2 | |
0 | A | B | C |
1 | 4 | 5 | 6 |
2 | True | False | False |
이제 변환된 데이터프레임을 CSV 파일로 저장해보자. 다음과 같이 코드를 추가한다.
dataFrame.to_csv("result.csv", header=False, index=False)
- 첫번째 인자 : 파일을 저장할 위치와, 파일 이름을 정의한다. 위와 같이 정의하면 현재 디렉토리에 result.csv 파일이 생성된다.
- 두번째 인자 : 열 이름을 정의한다. False일 경우에는 열 이름을 출력하지 않는다.
- 세번째 인자 : 인덱스의 출력 여부를 정의한다. False일 경우 인덱스를 출력하지 않는다.
먼저 header, index 모두 False로 정의한 경우의 결과는 다음과 같다.
출력문과 달리 맨 위의 헤더와 왼쪽의 인덱스가 없어진 것을 확인할 수 있다.
만약 header, index를 모두 True로 바꾼 경우에는 결과가 다음과 같은 결과를 얻을 수 있다.
출처
'Python' 카테고리의 다른 글
[Python] itertools 라이브러리를 이용한 조합&순열 구하기 (0) | 2022.07.08 |
---|---|
[Python] json 데이터를 dictionary로 변경하기 (0) | 2022.05.30 |
[Python] KoNLPy를 이용하여 문장에서 명사 추출하기 (0) | 2022.05.27 |
[Python] 구글 번역 API 사용하기 (0) | 2022.05.17 |
[Python] 파이썬 라이브러리 사용법 (0) | 2022.05.16 |
Comments