Sử dụng Selenium để scrape Web (phần 7)

Sử dụng Selenium WebDriver

Selenium được sử dụng cho tự động hóa trình duyệt, và một trong những bộ phận chính của nó, WebDriver là công cụ lõi
để truy cập các trình duyệt. WebDriver thực thi code logic cho các trình duyệt được lựa chọn cái được yêu cầu suốt
tự động hóa. Nó cũng là hệ thống lõi cái gắn khung Selenium với trình duyệt và thường được gọi hay tham chiếu tới
như Selenium driver hay chỉ driver. Cho thông tin chi tiết hơn, ghé thăm link:
https://www.selenium.dev/documentation/webdriver/getting_started/
Trước khi đi sâu vào tự động hóa hay sử dụng khung, hãy cài đặt các thư viện yêu cầu trong phần tiếp theo.

Thiết lập các thứ hoạt động

Để khám phá tự động hóa trình duyệt sử dụng Python và Selenium WebDriver, trước tiên, chúng ta cần cài đặt thư viện
selenium (một thư viện Python), và các drivers liên quan trình duyệt.
Chú ý quan trọng
Selenium là một khung cái chứa các bộ phận khác nhau như WebDriver và những cái khác, trong khi selenium là một
thư viện Python
https://www.selenium.dev/documentation/webdriver/getting_started/install_library/
cái chúng ta sử dụng để code và duy trì logic cái gắn WebDriver với các trình duyệt được lựa chọn.
Trước tiên hãy thẩm định thiết lập của thư viện selenium:

import selenium
selenium.__version__ # 4.10.0
selenium.__spec__
ModuleSpec(name=’selenium’,…… submodule_search_locations=
[‘C:\\HOWScraping2E\\secondEd\\Lib\\site-packages\\selenium’])

Khối code này thể hiện rằng thư viện selenium Python với phiên bản 4.10.0 đã được cài đặt thành công trong môi
trường mục tiêu của chúng ta (Hãy tham chiếu đến các phần Setting things up and Creating a virtual environment
trong các học phần trước).
Sau khi thẩm định thư viện Python, chúng ta sẽ cài đặt các drivers (drivers trình duyệt) trong phần tiếp theo.

Chia sẻ