Sử dụng Selenium để scrape Web (phần 9)

Thẩm định thiết lập

Suốt giai đoạn thiết lập, chúng ta phải ghé thăm và xử lí một vài links, download các files, vv.. Để thẩm định thiết
lập và khẳng định rằng driver đang chạy, chúng ta hãy triển khai code cái load https://www.python.org URL trong
trình duyệt (Chrome) với sự giúp đỡ của selenium và chromedriver:

from selenium import webdriver
from selenium.webdriver.chrome.service import Service
chromedriver_path=”C:\HOWScraping2E\driver\chromedriver.exe”
# path
service = Service(service=chromedriver_path)
driver = webdriver.Chrome(service=service)
# initiate an empty Chrome window
driver.get(‘https://www.python.org’) # loads URL in browser
driver.quit() # closes browser & terminates the session

Trong khối code này, chúng ta trước tiên nhập khẩu webdriver và sau đó service. selenium.webdriver chứa các công
cụ và classes khác nhau. Service là một trong những classes từ webdriver.chrome.service. Service liên quan chủ
yếu với các đặc tính và hàm dựa trên trình duyệt. Đường dẫn (vị trí) tới chromedriver.exe là quan trọng và phải
được cung cấp tới dịch vụ.

Chia sẻ