본문 바로가기

IT/파이썬(Python)69

파이썬 블로그로 코드 붙여넣기 Color Scripter 저번에 코드를 그림으로 캡처하는 방법에 대해 알아봤다. 하지만 그림의 단점은 바로 복사해서 텍스트 편집기에 붙여넣기 할 수 없다는 단점이 있다. 그래서 이번 시간에는 보기 좋은 스타일의 글로 붙여넣기 하는 방법에 대해 알아보려고 한다. 그림으로 캡처하는 방법이 궁금하다면 아래 포스팅을 참고하도록 하자. 파이썬 코드 캡처하는 방법(CodeSnap, Carbon, Ray) 파이썬 코드를 다른 사람에게 보여주고 싶은 때가 있을 것이다. 그러나 단순히 코드만을 복사하고 붙여 넣기 했을 경우 코드를 제대로 파악하는데 시간이 걸린다. 이때 활용할 수 있는 캡처 도 ggangtalife.tistory.com 이번에 소개할 사이트는 Color Scripter라는 사이트다. 개발자는 자신이 작성한 코드를 복사한 뒤 이곳.. 2023. 3. 25.
파이썬 웹 크롤링(requests, bs4) 파이썬으로 다양한 활동을 할 수 있는데 오늘은 그 중에서 웹 크롤링하는 방법에 대해 알아보려고 한다. 웹 크롤링이란 어떤 URL에서 하이퍼링크를 분류하고 원하는 데이터를 찾아내 DB에 저장하는 것이다. 목차 1. requests 모듈 설치 2. bs4 모듈 설치 3. 크롤링 영역 찾기 4. 코드 작성 1. requests 모듈 설치 pip install requests 명령 프롬프트를 실행시켜 위의 명령어를 입력하면 설치가 진행된다. requests 모듈은 HTTP 요청을 보내는 모듈이다. 원하는 URL에 접속하여 해당 인터넷 페이지에 있는 HTML 코드를 가져오고 그 코드 중에서 원하는 내용만 스크래핑할 수 있도록 도와준다. 아나콘다를 설치한 경우에는 기본적으로 설치되어 있다. https://pypi... 2023. 3. 25.
파이썬 문자열과 리스트 상호 변환 방법 파이썬에서 여러 가지 자료를 다루다 보면 데이터 형식으로 인해 특정 함수를 사용하지 못하는 경우가 있다. 또는 개발자가 원하는 프로그램을 구현하기 위해서 알맞은 데이터 형식으로 변경해 줄 필요가 있다. 목차 1. 문자열을 리스트로 2. 리스트를 문자열로 1. 문자열을 리스트로 list(문자열) list 함수는 특정 문자열 변수를 리스트 형식으로 변경시켜 주는 함수다. "i am a boy"라는 문자열을 list 함수를 이용하여 리스트로 변환시켰다. 변수의 타입을 확인해 본 결과도 'list'라고 나온다. 문자열에 들어있던 하나의 문자들이 각각 리스트의 원소가 된 것을 확인할 수 있다. 공백도 그대로 원소가 되었다. 2. 리스트를 문자열로 기준 문자.join(리스트) join은 리스트의 모든 원소를 하나로.. 2023. 3. 19.
파이썬 수치형 자료의 요약법(히스토그램, 줄기-잎 그림) 이번 시간에는 수치형 자료를 요약할 때 사용하는 그래프 함수들에 대해 알아보려고 한다. 참고로 수치형 자료는 정확히 셀 수 있으면 이산형 자료, 그렇지 못한다면 연속형 자료라고 한다. 목차 1. 히스토그램(Histogram) 2. 줄기-잎 그림(Stem-and-leaf Plot) 1. 히스토그램(Histogram) plt.hist() 하나의 변수에 대한 데이터의 빈도를 측정하는데 쓰이는 그래프다. 비슷하게 생긴 막대그래프는 각각의 항목 크기를 정확히 파악하는데 쓰이는데 히스토그램은 집단의 분포 상태를 파악하거나 비교할 때 사용된다. X축은 계급을 나타내고 Y축은 빈도를 나타낸다. 자료의 분포를 알 수 있다. 계급구간과 막대의 높이로 그린다. 모든 계급구간의 폭이 같으면 도수, 상대도수를 막대 높이로 사용.. 2023. 3. 18.
파이썬 튜플의 정의, 특징 파이썬 자료형에는 크게 3가지가 있다. 시퀀스, 튜플, 딕셔너리다. 시퀀스는 인덱스를 갖는 원소의 집합이고, 튜플은 값을 수정할 수 없는 원소의 집합이다. 딕셔너리는 키와 값을 갖는 데이터의 집합이다. 이번에는 튜플에 대해 알아보자. 목차 1. 튜플의 정의 2. 튜플의 특징 └ 2.1. 소괄호 입력 또는 괄호 필요 없음 └ 2.2. 하나의 원소 뒤에는 쉼표 입력 └ 2.3. 데이터 수정 불가 1. 튜플의 정의 여러 자료를 담을 수 있으면서 절대 변하지 않는 자료형을 튜플(Tuple)이라고 한다. 변경, 추가, 삭제 그 어떤 것도 할 수 없다. 어떤 프로그램에서는 튜플처럼 데이터가 절대 변하지 않는 것이 더욱 유리한 조건인 경우가 있다. 개발자는 프로그램의 특성에 맞춰 리스트와 튜플을 사용한다. 2. 튜플.. 2023. 3. 17.
파이썬 시퀀스 관련 함수 정리(pop, count, split, join) 파이썬에서 시퀀스란 데이터 구조 중 하나로 데이터를 순서대로 나타낸 것이다. 시퀀스의 각 원소에는 위치를 뜻하는 인덱스가 지정되어 있다. 파이썬의 인덱스는 0부터 시작한다. 이번에는 시퀀스를 대상으로 활용할 수 있는 함수들에 대해 알아보려고 한다. 시퀀스(Sequence) : 원소마다 인덱스가 부여되어 있는 데이터 구조 (문자열, 리스트) 목차 1. pop (제거 후 반환) 2. count (자료 찾기) 3. split (문자 기준 쪼개기) 4. join (문자 합치기) 1. pop (제거 후 반환) 리스트.pop(i) 인덱스 i의 원소를 제거하고 나서 반환해 주는 함수다. 1부터 5까지의 숫자가 있는 리스트에서 0번째 인덱스 원소를 pop 함수를 통해 제거하고 a라는 변수에 대입시켰다. 그러고 나서 p.. 2023. 3. 17.
파이썬 리스트 관련 함수 정리(append 추가, insert 삽입, remove 삭제, sort 정렬) 목차 1. append (추가) 2. insert (삽입) 3. remove (삭제) 4. sort (정렬) 1. append (추가) 리스트.append(내용) append는 리스트의 마지막 원소 뒤에 원하는 내용을 추가하고 싶을 때 사용한다. [1, 2, 3, 4, 5]의 원소들을 가진 a라는 리스트에 append 함수를 사용해서 숫자 6을 추가했다. append 함수는 리스트의 끝에 새로운 원소를 추가한다. 2. insert (삽입) 리스트.insert(인덱스, 내용) insert는 리스트의 원하는 위치(인덱스)에 내용을 추가할 때 사용한다. insert 함수를 사용하여 2번째 인덱스에 2.5라는 숫자를 리스트에 추가했다. 참고로 리스트의 인덱스는 0부터 시작한다. insert 함수에 입력하는 인덱.. 2023. 3. 16.
파이썬 거듭제곱 연산자(**) 사용법 파이썬의 다양한 연산자 중에서 제곱을 계산하는 연산자에 대해 알아보자. 제곱 : 같은 수를 2번 곱한 것 거듭제곱 : 같은 수를 반복해서 곱한 것 읽는 방법 : 밑의 지수 제곱(화면에 보이는 숫자를 읽을 때는 2의 4 제곱 또는 2의 4승이라고 읽는다.) 밑**지수 파이썬에서 거듭제곱을 계산하기 위한 코드 문법은 위와 같다. 단순히 ** 기호 앞 뒤로 원하는 숫자를 입력하면 된다. 2의 3 제곱은 2 X 2 X 2이라서 8이다. 5의 3 제곱은 5 X 5 X 5이라서 125다. 3의 3 제곱은 3 X 3 X 3이라서 27이다. 참고로 소수의 거듭제곱도 계산하는데 문제없다. 2023. 3. 14.
파이썬 범주형 자료의 요약법(그래프) 범주형 자료를 요약하는 방법 중에 하나는 도수분포표 이외에도 그래프를 활용하는 방법이 있다. 원형 그래프와 막대 그래프를 그리는 방법에 대해 알아보자. 목차 1. 원형 그래프 2. 막대 그래프 1. 원형 그래프(Pie Chart) 각 범주가 차지하는 비율로 중심각을 나눠 원형의 형태로 표현한 그래프다. 숫자의 나열보다 전체적인 분포를 이해하기 쉽다. 장점 : 범주가 차지하는 비율을 파악하기 쉽다. 단점 : 범주 간 도수 비교 및 도수 크기 차이 파악이 어렵다. plt.pie(수치, labels = 라벨) 전자제품 판매 데이터를 활용해 원형 그래프를 만들어봤다. sales는 각 제품별 판매 비율이 적힌 데이터고, product는 각 제품의 종류가 적힌 데이터다. plt.pie 함수를 활용하여 원형 그래프를.. 2023. 3. 13.
반응형