본문 바로가기
IT/파이썬

파이썬으로 엑셀 데이터 불러오기

by 깡타의 컴맹인생 2023. 1. 24.
반응형

파이썬 엑셀 데이터 불러오기

다음과 같은 엑셀 데이터가 있다. 엑셀로도 내부 함수를 이용해 다양한 분석 결과를 만들어낼 수 있지만, 복잡하고 시간이 오래 걸리는 작업 같은 경우에는 파이썬을 활용해 작업하는 것이 훨씬 수월하다. 파이썬을 활용해 엑셀의 데이터를 그대로 불러올 수 있는 방법이 있다. 오늘은 그 방법에 대해서 알아보려고 한다.

목차
1. pandas 패키지 설치하기
2. 엑셀 데이터 불러오기
3. 인덱스 열 제외하기
4. 특정 시트만 불러오기 
5. 기타

1. pandas 패키지 설치하기

pandas 패키지는 시리즈(Series)와 데이터 프레임(Data Frame)이라는 클래스를 제공하고 데이터 분석을 위한 다양한 기능을 제공하는 패키지다. 이것을 설치하기 위해서는 명령 프롬프트에서 아래와 같이 명령어를 입력하면 된다.

pip install pandas


2. 엑셀 데이터 불러오기


2.1. 위치와 파일명으로 불러오기

csv, xlsx, xls 확장자 모두 아래의 명령어를 통해 불러올 수 있다. 확장자만 실제 확장자에 맞게 작성하면 된다. csv 확장자의 경우 전용 명령어가 따로 존재하긴 하지만 read_excel 명령어를 실행했을 때와 결과값이 차이가 없었다.


2.2. 파일명으로 불러오기

비주얼 스튜디오 코드의 경우 작업경로가 이미 해당 엑셀 파일이 있는 위치로 설정되어있다면 아래와 같이 파일명만 입력해줘도 데이터를 불러올 수 있다.

비주얼 스튜디오 코드에서 작업경로를 설정하기 위해서는 다음과 같은 방법을 따르면 된다. Ctrl + K → Ctrl + O를 차례대로 누르거나 하단의 캡처 사진과 같이 폴더 열기 메뉴를 선택해 주면 된다.



3. 인덱스 열 제외하기

별도의 설정 없이 엑셀 데이터를 불러오는 명령어를 사용했을 경우 출력 결과를 확인했을 때 별도의 인덱스 열이 생겨난 것을 볼 수 있다. 그러나 인덱스 열을 생성하지 않는 방법이 있다. 데이터를 불러들이는 명령어에 'index_col=0'이라는 옵션을 부여하면 된다.


4. 특정 시트만 불러오기

'sheet_name='이라고 적혀있는 곳에 데이터를 불러오고 싶은 시트의 이름을 적으면 된다.


5. 기타

이번 포스팅에서 설명한 기능 이외에도 더욱 다양한 옵션들이 존재하는데, 그것을 아래 공식 문서를 통해 확인할 수 있다.

 

pandas.read_excel — pandas 1.5.3 documentation

Additional strings to recognize as NA/NaN. If dict passed, specific per-column NA values. By default the following values are interpreted as NaN: ‘’, ‘#N/A’, ‘#N/A N/A’, ‘#NA’, ‘-1.#IND’, ‘-1.#QNAN’, ‘-NaN’, ‘-nan’, ‘1.#IN

pandas.pydata.org

 

반응형