본문 바로가기

IT/파이썬(Python)69

파이썬 txt 파일 열기 cp949 UnicodeDecodeError 해결 방법 목차 1. 텍스트 파일 인코딩 형식 변환 2. open() 함수에 인코딩 옵션 추가 위의 내용이 적혀있는 텍스트 파일을 파이썬을 활용해 불러오려고 한다. 1 2 3 file = open('test.txt') content = file.read() file.close() # 파일을 열었다면 닫아줘야만 프로그램 실행 속도가 빨라진다. cs --------------------------------------------------------------------------- UnicodeDecodeError Traceback (most recent call last) Cell In[10], line 2 1 file = open('test.txt') ----> 2 content = file.read() 3 fi.. 2023. 4. 15.
파이썬 문자열 안에 공백 제거하기 replace() 문자열.replace('찾는 단어', '변경 문자')replace() 함수는 문자열 안에 있는 특정 문자를 사용자가 원하는 문자로 변경해 주는 함수다.123456789text = '컴맹인생에 오신 것을 환영합니다.' print(text) print('') text = text.replace(' ', '') # 공백 제거 print(text)cs컴맹인생에 오신 것을 환영합니다.컴맹인생에오신것을환영합니다.text라는 문자열 안에 '컴맹인생에 오신 것을 환영합니다.'라는 문자가 할당되어 있다. 이 문자열 안에 있는 공백을 제거하기 위해 replace() 함수를 사용했다.123456789text = '컴맹인생에 오신 것을 환영합니다.\n 오늘은 비가 옵니다.\t 우산 챙기셨나요?' print(text) prin.. 2023. 4. 14.
파이썬 특정 문자로 시작하는 단어 찾기 startswith(), 문자열 슬라이싱 우리는 어떤 데이터들 중에서 특정 단어로 시작하는 문자를 찾고 싶을 때가 있다. 엑셀이라면 간단하게 필터를 적용한 뒤 필터에 원하는 단어를 입력해서 간단하게 문제를 해결할 수 있다. 파이썬에서는 어떻게 할 수 있을지 알아보자. 목차 1. startswith() 함수 이용 2. 문자열 슬라이싱 1. startswith() 함수 이용 문자열.startswith('원하는 문자 또는 문자열') startswith()는 사용자가 원하는 문자나 문자열로 시작하는 단어를 찾을 때 유용한 함수다. True나 False 값을 반환한다. 1 2 3 4 5 a = ['apple', 'apartment', 'april', 'banana', 'building', 'python'] for word in a: if word.sta.. 2023. 4. 14.
파이썬 데이터 프레임 집계 aggregate() 저번 포스팅에서는 groupby()라는 함수에 대해 알아보았다. 이번 시간에는 데이터 프레임 그룹화 이후에 최댓값, 최솟값과 같은 집계를 간단하게 한 번에 해낼 수 있는 방법에 대해 설명하려고 한다. https://ggangtalife.tistory.com/117 파이썬 데이터 프레임 그룹화 groupby() 위와 같은 엑셀 데이터가 있다고 하자. 이 데이터를 pandas 라이브러리를 활용해 데이터 프레임의 형태로 만든 다음, 과일의 이름별로 그룹화를 해보려고 한다. 그룹화는 간단한 집계를 넘어서서 ggangtalife.tistory.com 1 2 3 4 5 6 7 import pandas as pd df = pd.read_excel('230412.xlsx') display(df) df = df.grou.. 2023. 4. 14.
파이썬 데이터 프레임 그룹화 groupby() 위와 같은 엑셀 데이터가 있다고 하자. 이 데이터를 pandas 라이브러리를 활용해 데이터 프레임의 형태로 만든 다음, 과일의 이름별로 그룹화를 해보려고 한다. 그룹화는 간단한 집계를 넘어서서 조건부로 집계하고 싶은 경우에 사용한다. 1 2 3 4 5 6 7 import pandas as pd df = pd.read_excel('230412.xlsx') display(df) df = df.groupby(['이름', '원산지']).sum() display(df) cs read_excel() 함수를 사용하여 데이터 프레임을 형성한 결과는 위와 같다. 참고로 그룹화의 기준이 될 열은 여러 개 선택할 수 있다. 이 데이터 프레임에서 '이름'과 '원산지' 열을 기준으로 그룹화를 한 결과는 다음과 같다. 귤과 원산.. 2023. 4. 14.
주피터 노트북, 주피터 랩 파이썬 데이터 프레임 출력 display() 함수 파이썬에서 pandas는 정말 유용한 라이브러리다. 이 라이브러리를 통해 데이터 프레임을 생성할 수 있는데 데이터 프레임을 출력할 때 특유의 형태가 있다. 위는 주피터 랩에서 데이터 프레임을 출력한 결과다. 하지만 위와 같은 형태로 데이터 프레임을 보기 위해서 어떤 함수를 사용해야 하는지 모른다. 이때 활용하는 함수는 display()다. 위와 같은 데이터가 담긴 엑셀 파일이 있다고 하자. 우리는 먼저 read_excel() 함수를 사용해서 위의 데이터를 데이터 프레임 형태로 생성할 수 있다. 1 2 3 4 5 import pandas as pd df = pd.read_excel('230412.xlsx') print(df) cs 이름 가격 0 사과 200 1 바나나 150 2 포도 600 3 귤 500 .. 2023. 4. 12.
파이썬 데이터 프레임 정렬하기 sort_values() 함수 sort_values sort_values('기준 열', ascending = True) sort_values(['기준 열1', '기준 열2'] ascending = True) sort_values('기준 열', ascending = False) sort_values(['기준 열1', '기준 열2'] ascending = False) 위의 표를 담고 있는 엑셀 파일이 있다고 하자. read_excel() 함수를 사용하여 생성한 데이터 프레임의 형태는 다음과 같다. 우리는 sort_values()라는 함수를 사용하여 특정 열을 기준으로 데이터를 정렬할 수 있다. 1 2 3 4 5 6 7 import pandas as pd df = pd.read_.. 2023. 4. 12.
파이썬 데이터 프레임 인덱싱, 슬라이싱(loc, iloc) 목차 1. loc 2. iloc 1. loc 데이터 프레임.loc['인덱스명'] 명시적인 인덱스를 참조하는 인덱싱, 슬라이싱 방법이다. 1 2 3 4 5 6 7 8 9 10 11 12 import pandas as pd a = pd.Series([10, 20, 30, 40, 50]) b = pd.Series([124,523,125,324,754]) df = pd.DataFrame(data = [a, b], index = ['a', 'b']) print(df) print('') print(df.loc['a']) print('') print(df.loc['b']) Colored by Color Scripter cs 0 1 2 3 4 a 10 20 30 40 50 b 124 523 125 324 754 0 1.. 2023. 4. 6.
파이썬 함수 지역변수와 전역변수 예전에 파이썬 함수의 정의, 구조, 형태에 대해 글을 쓴 적이 있다. 그 연장선으로 이제는 전역변수와 지역변수에 대해 알아보려고 한다. 함수에서 정의한 변수는 어떻게 처리될까? https://ggangtalife.tistory.com/37 파이썬 함수(Function) 정의, 구조, 형태 목차 1. 함수(Function)란? 2. 함수의 구조 3. 다양한 함수의 형태 1. 함수(Function)란? 동일한 작업을 수행하는 코드들의 집합이다. 6가지 변수들을 각각 더하고 그 결과 값을 표출해야 하는 작업이 필 ggangtalife.tistory.com 목차 1. 전역변수 2. 지역변수 1. 전역변수 1 2 3 4 5 6 a = 'Hello' def func(): print(a) func() cs Hello.. 2023. 4. 4.
반응형