파이썬53 파이썬 문자열과 리스트 상호 변환 방법 파이썬에서 여러 가지 자료를 다루다 보면 데이터 형식으로 인해 특정 함수를 사용하지 못하는 경우가 있다. 또는 개발자가 원하는 프로그램을 구현하기 위해서 알맞은 데이터 형식으로 변경해 줄 필요가 있다. 목차 1. 문자열을 리스트로 2. 리스트를 문자열로 1. 문자열을 리스트로 list(문자열) list 함수는 특정 문자열 변수를 리스트 형식으로 변경시켜 주는 함수다. "i am a boy"라는 문자열을 list 함수를 이용하여 리스트로 변환시켰다. 변수의 타입을 확인해 본 결과도 'list'라고 나온다. 문자열에 들어있던 하나의 문자들이 각각 리스트의 원소가 된 것을 확인할 수 있다. 공백도 그대로 원소가 되었다. 2. 리스트를 문자열로 기준 문자.join(리스트) join은 리스트의 모든 원소를 하나로.. 2023. 3. 19. 파이썬 수치형 자료의 요약법(히스토그램, 줄기-잎 그림) 이번 시간에는 수치형 자료를 요약할 때 사용하는 그래프 함수들에 대해 알아보려고 한다. 참고로 수치형 자료는 정확히 셀 수 있으면 이산형 자료, 그렇지 못한다면 연속형 자료라고 한다. 목차 1. 히스토그램(Histogram) 2. 줄기-잎 그림(Stem-and-leaf Plot) 1. 히스토그램(Histogram) plt.hist() 하나의 변수에 대한 데이터의 빈도를 측정하는데 쓰이는 그래프다. 비슷하게 생긴 막대그래프는 각각의 항목 크기를 정확히 파악하는데 쓰이는데 히스토그램은 집단의 분포 상태를 파악하거나 비교할 때 사용된다. X축은 계급을 나타내고 Y축은 빈도를 나타낸다. 자료의 분포를 알 수 있다. 계급구간과 막대의 높이로 그린다. 모든 계급구간의 폭이 같으면 도수, 상대도수를 막대 높이로 사용.. 2023. 3. 18. 파이썬 튜플의 정의, 특징 파이썬 자료형에는 크게 3가지가 있다. 시퀀스, 튜플, 딕셔너리다. 시퀀스는 인덱스를 갖는 원소의 집합이고, 튜플은 값을 수정할 수 없는 원소의 집합이다. 딕셔너리는 키와 값을 갖는 데이터의 집합이다. 이번에는 튜플에 대해 알아보자. 목차 1. 튜플의 정의 2. 튜플의 특징 └ 2.1. 소괄호 입력 또는 괄호 필요 없음 └ 2.2. 하나의 원소 뒤에는 쉼표 입력 └ 2.3. 데이터 수정 불가 1. 튜플의 정의 여러 자료를 담을 수 있으면서 절대 변하지 않는 자료형을 튜플(Tuple)이라고 한다. 변경, 추가, 삭제 그 어떤 것도 할 수 없다. 어떤 프로그램에서는 튜플처럼 데이터가 절대 변하지 않는 것이 더욱 유리한 조건인 경우가 있다. 개발자는 프로그램의 특성에 맞춰 리스트와 튜플을 사용한다. 2. 튜플.. 2023. 3. 17. 파이썬 시퀀스 관련 함수 정리(pop, count, split, join) 파이썬에서 시퀀스란 데이터 구조 중 하나로 데이터를 순서대로 나타낸 것이다. 시퀀스의 각 원소에는 위치를 뜻하는 인덱스가 지정되어 있다. 파이썬의 인덱스는 0부터 시작한다. 이번에는 시퀀스를 대상으로 활용할 수 있는 함수들에 대해 알아보려고 한다. 시퀀스(Sequence) : 원소마다 인덱스가 부여되어 있는 데이터 구조 (문자열, 리스트) 목차 1. pop (제거 후 반환) 2. count (자료 찾기) 3. split (문자 기준 쪼개기) 4. join (문자 합치기) 1. pop (제거 후 반환) 리스트.pop(i) 인덱스 i의 원소를 제거하고 나서 반환해 주는 함수다. 1부터 5까지의 숫자가 있는 리스트에서 0번째 인덱스 원소를 pop 함수를 통해 제거하고 a라는 변수에 대입시켰다. 그러고 나서 p.. 2023. 3. 17. 파이썬 리스트 관련 함수 정리(append 추가, insert 삽입, remove 삭제, sort 정렬) 목차 1. append (추가) 2. insert (삽입) 3. remove (삭제) 4. sort (정렬) 1. append (추가) 리스트.append(내용) append는 리스트의 마지막 원소 뒤에 원하는 내용을 추가하고 싶을 때 사용한다. [1, 2, 3, 4, 5]의 원소들을 가진 a라는 리스트에 append 함수를 사용해서 숫자 6을 추가했다. append 함수는 리스트의 끝에 새로운 원소를 추가한다. 2. insert (삽입) 리스트.insert(인덱스, 내용) insert는 리스트의 원하는 위치(인덱스)에 내용을 추가할 때 사용한다. insert 함수를 사용하여 2번째 인덱스에 2.5라는 숫자를 리스트에 추가했다. 참고로 리스트의 인덱스는 0부터 시작한다. insert 함수에 입력하는 인덱.. 2023. 3. 16. 파이썬 거듭제곱 연산자(**) 사용법 파이썬의 다양한 연산자 중에서 제곱을 계산하는 연산자에 대해 알아보자. 제곱 : 같은 수를 2번 곱한 것 거듭제곱 : 같은 수를 반복해서 곱한 것 읽는 방법 : 밑의 지수 제곱(화면에 보이는 숫자를 읽을 때는 2의 4 제곱 또는 2의 4승이라고 읽는다.) 밑**지수 파이썬에서 거듭제곱을 계산하기 위한 코드 문법은 위와 같다. 단순히 ** 기호 앞 뒤로 원하는 숫자를 입력하면 된다. 2의 3 제곱은 2 X 2 X 2이라서 8이다. 5의 3 제곱은 5 X 5 X 5이라서 125다. 3의 3 제곱은 3 X 3 X 3이라서 27이다. 참고로 소수의 거듭제곱도 계산하는데 문제없다. 2023. 3. 14. 파이썬 범주형 자료의 요약법(그래프) 범주형 자료를 요약하는 방법 중에 하나는 도수분포표 이외에도 그래프를 활용하는 방법이 있다. 원형 그래프와 막대 그래프를 그리는 방법에 대해 알아보자. 목차 1. 원형 그래프 2. 막대 그래프 1. 원형 그래프(Pie Chart) 각 범주가 차지하는 비율로 중심각을 나눠 원형의 형태로 표현한 그래프다. 숫자의 나열보다 전체적인 분포를 이해하기 쉽다. 장점 : 범주가 차지하는 비율을 파악하기 쉽다. 단점 : 범주 간 도수 비교 및 도수 크기 차이 파악이 어렵다. plt.pie(수치, labels = 라벨) 전자제품 판매 데이터를 활용해 원형 그래프를 만들어봤다. sales는 각 제품별 판매 비율이 적힌 데이터고, product는 각 제품의 종류가 적힌 데이터다. plt.pie 함수를 활용하여 원형 그래프를.. 2023. 3. 13. 파이썬 범주형 자료의 요약법(도수분포표) 범주형 자료의 요약법은 다음 순서를 따른다. 각 범주에 속하는 관측값의 개수를 측정한다. 전체에서 차지하는 각 범주의 비율을 파악한다. 효율적으로 범주 간의 차이점을 비교 가능하다. 목차 1. 도수분포표 └ 1.1. 도수(Frequency) └ 1.2. 상대도수(Relative Frequency) 2. 실습 └ 2.1. 도수 계산 └ 2.2. 상대도수 계산 1. 도수분포표 범주형 자료에서 범주와 그 범주에 대응하는 도수, 상대도수를 나열해 표로 만든 것이다. 몇 개의 범주를 기준으로 둘 것인지에 따라 다양한 도수 분포표를 만들 수 있다. pandas.crosstab(index = 범주, columns = 원하는 컬럼명) 위의 코드는 index로 설정한 범주에 해당하는 도.. 2023. 3. 12. 파이썬 자료의 구분(수치형, 범주형 자료) 데이터를 분석하고 시각화할 때 데이터가 어떤 형태의 자료인지 파악하고 그 특성에 맞는 분석 기법을 사용해야 한다. 자료는 기본적으로 수치형 자료와 범주형 자료로 나뉘는데 오늘은 그 개념에 대해 알아보도록 한다. 목차 1. 수치형 자료(Numerical data) └ 1.1. 연속형 자료(Continuous data) └ 1.2. 이산형 자료(Discrete data) 2. 범주형 자료(Categorical data) └ 2.1. 연속형 자료(Ordinal data) └ 2.2. 이산형 자료(Nominal data) 1. 수치형 자료(Numerical data) 수치로 측정이 가능한 양적 자료(Quantitative data)다. 예를 들어 키, 몸무게, 시험 점수, 나이 등에 해당한다. 선형 회귀 분석 .. 2023. 3. 11. 이전 1 2 3 4 5 6 다음 반응형