Sử dụng Selemium để scrape Web
Trước đây, chúng ta đã học về một vài thư viện Python, các công nghệ web và dựa trên API, tìm dữ liệu và định vị
các phần tử, các kĩ thuật rút, và nhiều dịch vụ liên quan đến dữ liệu trong các học phần trước.
Selenium tự động hóa các trình duyệt – một trích dẫn từ https://www.selenium.dev/ và nó là một bộ các công cụ
chủ yếu cũng được biết đến như là một khung test. Selenium được sử dụng để tự động hóa web (các ứng dụng, các forms
website, và nhiều hơn nhiều) cho mục đích test. Cùng với test sử dụng tự động hóa, có nhiều dịch vụ tiềm tàng
kiêm nhiệm các kịch bản dựa trên nhiệm vụ cái có thể được thực hiện và xử lí sử dụng Selenium. Khung Selenium
chứa các mô đun hay bộ phận khác nhau. Chúng ta sẽ sử dụng Selenium WebDriver.
Nhìn chung, chúng ta sẽ cài đặt và học về Selenium WebDriver, sử dụng WebDriver để tự động hóa các websites, và
sử dụng Selenium để scrape dữ liệu từ web.
Trong học phần này, chúng ta sẽ bao quát các chủ đề sau:
+ Giới thiệu Selenium
+ Sử dụng Selenium WebDriver
+ Scrape sử dụng Selenium
