반응형

파이썬 웹 크롤링 / 네이버 영화 인기검색어 순위 가져오기

 

 

BeautifulSoup를 이용해 네이버 영화 인기검색어 순위를 가져오도록 하겠습니다. 

 

네이버 Html 코드 분석

아래 링크에 들어가면 네이버 영화 정보를 볼 수 있습니다. 

개발자 도구(F12)로 영화 검색어 순위에 대한 내용을 따라 들어가 보면 

keyword_obj first_child 클래스 안의 영화 인기검색어에 대한 정보가 있는 것을 알 수 있습니다. 

이 클래스 안의 영화 제목 정보를 가져와 출력해 보도록 하겠습니다. 

https://movie.naver.com/movie/running/current.naver

 

BeautifulSoup의 find 코드

keyword_obj first_child 클래스를 우선 찾고. 그 하위의 rank_tx에 영화 제목 정보가 있는 것을 알 수 있습니다. 

순위에 있는 모든 영화 제목을 가져와야 하기 때문에 find_all 함수를 사용합니다. 

ul = soup.find("div", class_="keyword_obj first_child").find_all("p", class_="rank_tx")

 

전체 코드

import urllib.request
from bs4 import BeautifulSoup

url = "https://movie.naver.com/movie/running/current.naver"
soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser")

ul = soup.find("div", class_="keyword_obj first_child").find_all("p", class_="rank_tx")
print(type(ul))
for i, title in enumerate(ul):
    print(i+1, "위 : " , title.get_text())

반응형

+ Recent posts