본문 바로가기

데이터프레임4

파이썬 데이터 프레임 집계 aggregate() 저번 포스팅에서는 groupby()라는 함수에 대해 알아보았다. 이번 시간에는 데이터 프레임 그룹화 이후에 최댓값, 최솟값과 같은 집계를 간단하게 한 번에 해낼 수 있는 방법에 대해 설명하려고 한다. https://ggangtalife.tistory.com/117 파이썬 데이터 프레임 그룹화 groupby() 위와 같은 엑셀 데이터가 있다고 하자. 이 데이터를 pandas 라이브러리를 활용해 데이터 프레임의 형태로 만든 다음, 과일의 이름별로 그룹화를 해보려고 한다. 그룹화는 간단한 집계를 넘어서서 ggangtalife.tistory.com 1 2 3 4 5 6 7 import pandas as pd df = pd.read_excel('230412.xlsx') display(df) df = df.grou.. 2023. 4. 14.
주피터 노트북, 주피터 랩 파이썬 데이터 프레임 출력 display() 함수 파이썬에서 pandas는 정말 유용한 라이브러리다. 이 라이브러리를 통해 데이터 프레임을 생성할 수 있는데 데이터 프레임을 출력할 때 특유의 형태가 있다. 위는 주피터 랩에서 데이터 프레임을 출력한 결과다. 하지만 위와 같은 형태로 데이터 프레임을 보기 위해서 어떤 함수를 사용해야 하는지 모른다. 이때 활용하는 함수는 display()다. 위와 같은 데이터가 담긴 엑셀 파일이 있다고 하자. 우리는 먼저 read_excel() 함수를 사용해서 위의 데이터를 데이터 프레임 형태로 생성할 수 있다. 1 2 3 4 5 import pandas as pd df = pd.read_excel('230412.xlsx') print(df) cs 이름 가격 0 사과 200 1 바나나 150 2 포도 600 3 귤 500 .. 2023. 4. 12.
파이썬 데이터 프레임 정렬하기 sort_values() 함수 sort_values sort_values('기준 열', ascending = True) sort_values(['기준 열1', '기준 열2'] ascending = True) sort_values('기준 열', ascending = False) sort_values(['기준 열1', '기준 열2'] ascending = False) 위의 표를 담고 있는 엑셀 파일이 있다고 하자. read_excel() 함수를 사용하여 생성한 데이터 프레임의 형태는 다음과 같다. 우리는 sort_values()라는 함수를 사용하여 특정 열을 기준으로 데이터를 정렬할 수 있다. 1 2 3 4 5 6 7 import pandas as pd df = pd.read_.. 2023. 4. 12.
파이썬 데이터 프레임 조건 검색(조건식, query 함수, str 함수) 데이터 프레임은 파이썬에서 매우 유용하게 활용된다. 연산도 가능하지만 조건식이나 특정 함수를 활용하여 원하는 조건을 만족하는 데이터만을 추출할 수도 있다.목차1. 조건식2. 데이터 프레임.query() 함수3. 데이터 프레임.str.contains 함수4. 데이터 프레임.str.match 함수1. 조건식데이터 프레임[(데이터 프레임['원하는 인덱스'] > 조건)]데이터 프레임[(데이터 프레임['원하는 인덱스'] > 조건 & (데이터 프레임['원하는 인덱스'] 1234567891011121314import numpy as npimport pandas as pd df = np.random.rand(6, 2)print(df)print(type(df), '\n'*2) df = pd.DataFrame(df, co.. 2023. 3. 29.
반응형