Beautiful Soup란? Beautiful Soup은 웹페이지 분석 모듈로, HTML 코드에서 특정 태그나 값을 추출(parsing;파싱)할 때 사용하는 라이브러리입니다. requests 모듈로 HTML 소스를 받아오고 Beaitoful Soup은 이를 파싱합니다. parsing(파싱)이란 가공되지 않은 문자열에서 필요한 부분을 추출하여 의미있는 구조화된 데이터로 만드는 과정입니다. [관련 문서] https://www.crummy.com/software/BeautifulSoup/bs4/doc/ Beautiful Soup Documentation — Beautiful Soup 4.12.0 documentation Beautiful Soup Documentation Beautiful Soup is a ..
openpyxl 모듈은 파이썬에서 엑셀을 쉽게 다룰 수 있도록 도와주는 모듈입니다. openpyxl 설치는 cmd(터미널)창에서 다음과 같이 입력해주어야합니다. pip install openpyxl 가로 M, 세로 N 값을 받아 곱셈표를 만들어 엑셀파일(xlsx)로 저장하는 코드입니다. 예를 들어 가로 5, 세로 6을 입력하면 다음과 같이 엑셀에 저장되어야 합니다. 1. 필요한 모듈 가져오기 현재 디렉토리에서 작업하여 해당 파일에 저장하기 위해 os 모듈을 사용합니다.(선택) 가로 M, 세로 N 값을 받기 위해 sys 모듈을 사용합니다. (선택, input() 사용 가능) 파이썬에서 엑셀을 다루기 위해 openpyxl 모듈을 사용합니다. import sys, openpyxl, os from openpyx..
webbrowser란? webbrowser는 파이썬 기본 내장 모듈로 브라우저로 특정 페이지를 열 때 사용합니다. import webbrowser webbrowser.open('https://www.naver.com') requests란? requests는 스크래핑에서 활용되는 모듈로, 인터넷에서 파일과 웹페이지를 다운로드하는데 사용합니다. reqeusts모듈을 사용하기 위해서는 설치를 해야합니다. pip install requests 기본 사용법 네이버 주소에 get 요청을 보내면 서버에서는 요청을 받아 처리 후 응답을 줍니다. 응답코드가 status_code입니다. 응답 내용이 req.text의 결과값입니다. import requests url = 'https://www.naver.com' req =..
zipfile 모듈이란? 파일을 압축하거나 해제하는 등 압축파일에 관련된 모듈입니다. zipfile 모듈은 기본으로 설치되어 있는 파이썬 내장 라이브러리이기 때문에 따로 설치할 필요가 없습니다. 파일 하나만 압축 파일을 압축할 때는 write()를 사용합니다. 일단 os 모듈을 통해 작업할 위치로 현재 디렉토리를 변경해줍니다. import zipfile, os os.chdir('D:\\python_study\\zipfile_test') #현재 디렉토리 위치 변경 #파일 하나만 압축 one_new_zip = zipfile.ZipFile('new.zip','w') one_new_zip.write('hello.txt') one_new_zip.close() 파일 여러개 압축 파일을 여러 개 압축할 때는 먼저 압..
pickle 모듈은 기본으로 설치되어 있는 파이썬 내장 라이브러리이기 때문에 따로 설치할 필요가 없습니다. pickle 모듈을 사용하는 이유 텍스트가 아닌 자료형은 일반 파일 입출력이 불가능합니다. 따라서 리스트, 딕셔너리, 클래스 등과 같은 파일은 pickle을 사용하여 저장합니다. 그리고 pickle.load()를 사용하여 파일을 읽어오기 위해서는 pickle.dump를 사용하여 데이터를 입력해야합니다. 객체 파일 열기/쓰기 pickle.dump()를 사용하여 객체를 저장합니다. import pickle #열기/쓰기 color = ['red','yellow','blue','green','purple'] with open('pickle.dat','wb') as file: pickle.dump(color..
shutil 모듈은 기본으로 설치되어 있는 파이썬 내장 라이브러리이기 때문에 따로 설치할 필요가 없습니다. 파일 복사 파일 복사를 위해서는 copy() 함수를 사용합니다. copy(복사할 파일, 복사 위치) 형식으로 작성합니다. import shutil shutil.copy('test1.txt','..\\shutil_test') #파일 복사 전체 디렉토리를 복사하는 것은 copytree() 함수를 사용합니다. copytree(복사할 디렉토리, 복사위치) 형식으로 작성합니다. shutil.copytree('D:\\python_study\\os_test','..\\copy_file') #파일 복사 파일 이동 파일을 이동시키기 위해 move() 함수를 사용합니다. move(이동할 파일,이동 위치) 형식으로 작..
OS 모듈이란? OS모듈은 Operating System의 약자로, 운영체제와 관련된 기능을 제공하는 모듈입니다. 예를 들어 파일을 복사하거나 폴더를 새로 만들거나 파일을 지우는 등의 작업을 수행합니다. 경로 조작 os.path.join은 경로명 조작에 관한 함수로, 경로와 파일명을 결합하는 용도로 사용합니다. 이 함수를 사용하면 운영체제에 관계없이 경로를 알맞게 생성해줍니다. 리눅스와 맥에서는 /, 윈도우에서는 \\로 동작합니다. import os print(os.path.join('Users','USER','bin')) #Users\USER\bin my_file = ['a.txt', 'b.docx', 'c.csv'] for i in my_file: print(os.path.join('D:\\pytho..