본문 바로가기

BeautifulSoup2

[ 스파르타 / Web ] 웹개발 종합반 3주차_#3 웹 사이트 크롤링 심화버전 네이버영화 사이트의 현재 영화 순위를 아래와 같이 출력하기 크롤링할 웹 사이트 링크 랭킹 : 네이버 영화 영화, 영화인, 예매, 박스오피스 랭킹 정보 제공 movie.naver.com 크롤릴해올 사이트 이미지 풀이 선생님과함께 영화 제목을 뽑아보고 스스로 영화 순위와 평점을 뽑아 보았다. 태크안에 alt를 어떻게 뽑아올지 막막했지만 앞에 배운 내용들로 적용을 해보니 바로 원하는 데이터들이 출력되서 뿌듯했다. import requests from bs4 import BeautifulSoup headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) .. 2022. 12. 31.
[ 스파르타 / Web ] 웹개발 종합반 3주차_#2 주제 requests와 beautifulsoup를 활용해서 네이버 영화 페이지에 있는 영화 제목들 크롤링해오기 크롤링할 웹사이트 링크 랭킹 : 네이버 영화 영화, 영화인, 예매, 박스오피스 랭킹 정보 제공 movie.naver.com 크롤링 크롤링을 하기 위해서는 2가지를 해야 한다. 1. requests로 링크에 요청을 해서 html을 가져와야 한다. requests는 일종의 Ajax 역학을 한다. 일단 requests를 사용하기 위해서는 설치를 해주어야 한다. 2. beautifulsoup을 사용하여 가져온 데이터 안에서 영화 제목들을 가져온다. 제목을 쉽게 찾게 해주는 라이브러리 requests 설치 1. Pycharm을 눌러 설정을 들어간다. 2. 프로젝트에 Python 인터프리터를 누른다. 3... 2022. 12. 31.
728x90