개발팁/Python

Python과 셀레니움을 이용한 동적 스크래핑

후앤하 2022. 12. 15. 19:42
반응형

다음은 Python과 셀레늄 라이브러리를 사용한 동적 스크래핑의 간단한 예입니다.

 

 

from selenium import webdriver

# Create a new Chrome browser
browser = webdriver.Chrome()

# Go to the website you want to scrape
browser.get('https://www.example.com')

# Use Selenium to dynamically scrape the contents of the page
contents = browser.find_elements_by_css_selector('p')

# Print the contents of the page
for content in contents:
  print(content.text)

# Close the browser
browser.close()

 

이 코드는 새 Chrome 브라우저를 열고 지정된 웹사이트로 이동한 다음 페이지의 모든 <p> 요소 내용을 인쇄합니다.

동적 스크래핑은 특히 Chrome과 같은 모든 기능을 갖춘 브라우저에서 수행할 때 리소스를 많이 사용할 수 있으며 스크래핑하려는 웹 사이트의 크기와 복잡성에 따라 실행하는 데 상당한 시간이 걸릴 수 있습니다. 웹사이트 소유자의 허가 없이 웹사이트를 스크랩하는 것은 웹사이트의 서비스 약관에 위배될 수 있으며 경우에 따라 불법으로 간주될 수 있음을 명심하는 것도 중요합니다. 규칙을 어기지 않도록 웹사이트를 스크랩하기 전에 항상 웹사이트의 서비스 약관을 확인해야 합니다.

반응형