Dorulog
article thumbnail
파이썬으로 네이버 웹툰 웹크롤링 하기
Tip & Tech/Python 2021. 4. 5. 12:20

안녕하세요. 오늘은 파이썬을 활용해서 네이버 웹툰 사이트를 웹크롤링 하는 방법을 알아보겠습니다. 웹크롤링 단계 사실 웹크롤링은 웹페이지의 가져와서 데이터를 추출해 내는 것인데요. 나무위키에 따르면 아래와 같다고 합니다. 크롤링(crawling) 혹은 스크레이핑(scraping)은 웹 페이지를 그대로 가져와서 거기서 데이터를 추출해 내는 행위다. 크롤링하는 소프트웨어는 크롤러(crawler)라고 부른다. 저와 같은 초보일수록 기초적인 실수를 안하려면 단계를 정하고 그에 따라서 코딩하는 것이 시행착오를 줄일 수 있습니다. 저는 일반적으로 크롤링하려는 페이지 구조확인 및 크롤링하고자 하는 위치파악 코딩 및 필요한 내용 구글링 테스트 및 디버깅 위와 같은 순서로 짜고 있는데요. 이에 따라서 포스팅 해보겠습니다...