본문 바로가기
IT/Python

read_csv()

by 성준하이 2022. 11. 8.
반응형
csv파일 읽기

pandas를 이용해 csv 파일을 불러오기 위해서는 아래와 같이 pandas를 먼저 import

그리고 약어로 지정한 pd를 사용하여 read_csv함수를 통해 csv 파일


 
import pandas as pd
data = pd.read_csv('파일경로/파일이름.csv')

csv파일 예시

CSV는 Comma Seperated Value의 약자로 ',' 쉼표(comma)로 분리된 텍스트 파일
예를 들면 아래와 같이 쓰여져 있는 텍스트 파일


 
이름, 성별, 키
데이콘, 남자, 180
홍길동, 남자, 175
아이유, 여자, 163

파라미터

read_csv는 여러가지 파라미터를 통해서 옵션을 줄 수 있고 더 많은 파라미터를 자세하게 확인하고 싶으시다면 판다스 공식 문서를 확인

  • filepath or buffer
    • 파일경로/파일이름.csv 을 입력하여 파일 로딩
  • sep or delimiter
    • 초기값은 comma(,)
    • 만일 분리되어있는 기준이 쉼표(,)로 분리되어 있지 않은 경우 기준이 되는 값을 입력
      예를 들어 슬라이스(/), Tab( ) 등 으로 분리되어 있는 경우
  • header
    • 초기값은 0
    • 컬럼명으로 사용할 행의 번호를 입력
  • names
    • 사용할 변수명을 입력합니다. 파일에 변수명이 없다면 header를 None으로 설정
  • index_col
    • 데이터의 인덱스로 사용할 열의 번호를 입력
  • skiprows
    • 첫 행을 기준으로 데이터를 얼마나 건너뛰고 읽어올지
  • nrows
    • 파일을 읽어올 행의 수를 입력
  • date_parser
    • 시계열 타입으로 변환할 변수를 입력

csv파일 저장하기

  • 작업이 끝난 뒤 쥬피터 노트북에있는 값들을 파일로 변환해서 저장하려면 바로 csv파일로 만들어서 저장
  • 아래와같이 to_csv를 사용하여 저장하고자 하는 파일경로와 파일명 그리고 csv 확장자를 같이 입력해주면 data의 값들이 파일로 저장
 
data.to_csv('파일경로/파일명.csv', index = False)

 


단, 여기서 data는 위에서 read_csv를 통해 불러온 data와 같이 pandas의 DataFrame 형식이거나 Series 형식

  • index는 data의 index(행의 이름)를 같이 저장할 것인지 하지 않을 것인지를 결정하는 옵션
  • 만약 위와 같이 index가 False라면 index를 저장되지 않음
반응형

'IT > Python' 카테고리의 다른 글

파이선 3.11 에 대해서  (37) 2022.11.14
cx_Oracle 이란?  (33) 2022.11.12
반복문 역순으로 돌기  (42) 2022.10.28
정규표현식(한글, 특수문자 지우기)  (51) 2022.10.25
list 안에서 최소 최대값  (41) 2022.10.20

댓글