반응형

파이썬 웹 크롤링 / 네이버 현재 상영영화 정보 가져오기

 

네이버 Html 코드 분석

아래 링크에 들어가면 네이버 영화 정보를 볼 수 있습니다.

개발자 도구(F12)로 영화 검색어 순위에 대한 내용을 따라 들어가 보면 

lst_detail_t1 클래스 안에 현재 상영영화 정보가 있는 것을 알 수 있습니다. 

이 클래스 안의 영화 제목 정보를 가져와 출력하겠습니다. 

https://movie.naver.com/movie/running/current.naver

 

전체 코드

현재 상영영화 정보가 100개가 넘기 때문에 10개만 출력하도록 하였습니다. 

import urllib.request
from bs4 import BeautifulSoup

url = "https://movie.naver.com/movie/running/current.naver"
soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser")

ul = soup.find("ul", class_="lst_detail_t1").find_all("dt", class_="tit")
print(type(ul))

for i, title in enumerate(ul):
    print(i+1, ") ", title.get_text())
    if i+1 == 10:
        break

아래와 같이 출력되는 것을 볼 수 있습니다.

반응형

+ Recent posts