반응형
파이썬 웹 크롤링 / 네이버 현재 상영영화 정보 가져오기
네이버 Html 코드 분석
아래 링크에 들어가면 네이버 영화 정보를 볼 수 있습니다.
개발자 도구(F12)로 영화 검색어 순위에 대한 내용을 따라 들어가 보면
lst_detail_t1 클래스 안에 현재 상영영화 정보가 있는 것을 알 수 있습니다.
이 클래스 안의 영화 제목 정보를 가져와 출력하겠습니다.
https://movie.naver.com/movie/running/current.naver
전체 코드
현재 상영영화 정보가 100개가 넘기 때문에 10개만 출력하도록 하였습니다.
import urllib.request
from bs4 import BeautifulSoup
url = "https://movie.naver.com/movie/running/current.naver"
soup = BeautifulSoup(urllib.request.urlopen(url).read(), "html.parser")
ul = soup.find("ul", class_="lst_detail_t1").find_all("dt", class_="tit")
print(type(ul))
for i, title in enumerate(ul):
print(i+1, ") ", title.get_text())
if i+1 == 10:
break
아래와 같이 출력되는 것을 볼 수 있습니다.
반응형
'파이썬 > 파이썬 웹 크롤링' 카테고리의 다른 글
파이썬 웹 크롤링 / 네이버 영화 인기검색어 순위 가져오기 (0) | 2021.08.23 |
---|---|
파이썬 웹 크롤링 / BeautifulSoup를 이용한 네이버 스포츠 야구 순위 정보 가져오기 (0) | 2020.07.31 |
파이썬 웹 크롤링 / 네이버 첫화면 HTML 가져오기 - beautifulsoup Parser와 비교 (0) | 2020.07.29 |