반응형
csv파일 읽기
pandas를 이용해 csv 파일을 불러오기 위해서는 아래와 같이 pandas를 먼저 import
그리고 약어로 지정한 pd를 사용하여 read_csv함수를 통해 csv 파일
import pandas as pd
data = pd.read_csv('파일경로/파일이름.csv')
csv파일 예시
CSV는 Comma Seperated Value의 약자로 ',' 쉼표(comma)로 분리된 텍스트 파일
예를 들면 아래와 같이 쓰여져 있는 텍스트 파일
이름, 성별, 키
데이콘, 남자, 180
홍길동, 남자, 175
아이유, 여자, 163
파라미터
read_csv는 여러가지 파라미터를 통해서 옵션을 줄 수 있고 더 많은 파라미터를 자세하게 확인하고 싶으시다면 판다스 공식 문서를 확인
- filepath or buffer
- 파일경로/파일이름.csv 을 입력하여 파일 로딩
- sep or delimiter
- 초기값은 comma(,)
- 만일 분리되어있는 기준이 쉼표(,)로 분리되어 있지 않은 경우 기준이 되는 값을 입력
예를 들어 슬라이스(/), Tab( ) 등 으로 분리되어 있는 경우
- header
- 초기값은 0
- 컬럼명으로 사용할 행의 번호를 입력
- names
- 사용할 변수명을 입력합니다. 파일에 변수명이 없다면 header를 None으로 설정
- index_col
- 데이터의 인덱스로 사용할 열의 번호를 입력
- skiprows
- 첫 행을 기준으로 데이터를 얼마나 건너뛰고 읽어올지
- nrows
- 파일을 읽어올 행의 수를 입력
- date_parser
- 시계열 타입으로 변환할 변수를 입력
csv파일 저장하기
- 작업이 끝난 뒤 쥬피터 노트북에있는 값들을 파일로 변환해서 저장하려면 바로 csv파일로 만들어서 저장
- 아래와같이 to_csv를 사용하여 저장하고자 하는 파일경로와 파일명 그리고 csv 확장자를 같이 입력해주면 data의 값들이 파일로 저장
data.to_csv('파일경로/파일명.csv', index = False)
단, 여기서 data는 위에서 read_csv를 통해 불러온 data와 같이 pandas의 DataFrame 형식이거나 Series 형식
- index는 data의 index(행의 이름)를 같이 저장할 것인지 하지 않을 것인지를 결정하는 옵션
- 만약 위와 같이 index가 False라면 index를 저장되지 않음
반응형
'IT > Python' 카테고리의 다른 글
파이선 3.11 에 대해서 (37) | 2022.11.14 |
---|---|
cx_Oracle 이란? (34) | 2022.11.12 |
반복문 역순으로 돌기 (43) | 2022.10.28 |
정규표현식(한글, 특수문자 지우기) (52) | 2022.10.25 |
list 안에서 최소 최대값 (42) | 2022.10.20 |
댓글