반응형
파이썬 웹 크롤링 / 네이버 영화 인기검색어 순위 가져오기
BeautifulSoup를 이용해 네이버 영화 인기검색어 순위를 가져오도록 하겠습니다.
네이버 Html 코드 분석
아래 링크에 들어가면 네이버 영화 정보를 볼 수 있습니다.
개발자 도구(F12)로 영화 검색어 순위에 대한 내용을 따라 들어가 보면
keyword_obj first_child 클래스 안의 영화 인기검색어에 대한 정보가 있는 것을 알 수 있습니다.
이 클래스 안의 영화 제목 정보를 가져와 출력해 보도록 하겠습니다.
https://movie.naver.com/movie/running/current.naver
BeautifulSoup의 find 코드
keyword_obj first_child 클래스를 우선 찾고. 그 하위의 rank_tx에 영화 제목 정보가 있는 것을 알 수 있습니다.
순위에 있는 모든 영화 제목을 가져와야 하기 때문에 find_all 함수를 사용합니다.
ul = soup.find("div", class_="keyword_obj first_child").find_all("p", class_="rank_tx")
전체 코드
import urllib.request
from bs4 import BeautifulSoup
url = "https://movie.naver.com/movie/running/current.naver"
soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser")
ul = soup.find("div", class_="keyword_obj first_child").find_all("p", class_="rank_tx")
print(type(ul))
for i, title in enumerate(ul):
print(i+1, "위 : " , title.get_text())
반응형
'파이썬 > 파이썬 웹 크롤링' 카테고리의 다른 글
파이썬 웹 크롤링 / 네이버 현재 상영영화 정보 가져오기 (0) | 2021.08.25 |
---|---|
파이썬 웹 크롤링 / BeautifulSoup를 이용한 네이버 스포츠 야구 순위 정보 가져오기 (0) | 2020.07.31 |
파이썬 웹 크롤링 / 네이버 첫화면 HTML 가져오기 - beautifulsoup Parser와 비교 (0) | 2020.07.29 |