Sử dụng Selenium để scrape Web (phần 15)

Các phần tử và forms HTML và Javascript (tiếp tục)

selenium.webdriver cung cấp các dạng khác nhau các cái định vị phần tử để nhận dạng các phần tử HTML và các thuộc
tính liên quan đến chúng. Các cái định vị này được cung cấp như các đối số đối với các phương thức driver:
+ find_element(): Trả về một phần tử đơn
+ find_elements(): Trả về nhiều hay danh sách các phần tử
Nhập khẩu hay sử dụng By class (from selenium.webdriver.common.by import By), các cái định vị và thuộc tính khác
nhau có thể được tìm thấy. Một vài trong số chúng là như sau:
+ By.ID: Tìm ra các phần tử với thuộc tính id như driver find_element (By.ID,”numb1″) cho <span id=”numb1″>
+ By.XPATH: Tìm ra các phần tử bằng cách cung cấp XPath expressions, ví dụ, driver.find_element(By.XPATH,”[id=’demo’]”)
+ By.NAME: Tìm ra các phần tử với thuộc tính name, ví dụ, driver.find_element (By.TAG_NAME,”h2″)
+ By.CLASS_NAME: Tìm ra các phần tử với thuộc tính class, ví dụ, driver.find_element(By.CLASS_NAME,”email”)
+ By.CSS_SELECTOR: Tìm ra các phần tử sử dụng các biểu thức cái chọn CSS, ví dụ, driver.find_element
(By.CSS_SELECTOR,”.completed > h2″)
+ By.LINK_TEXT: Tìm ra các phần tử từ các links có sẵn và những cái cái khớp string hoàn chỉnh cung cấp, ví dụ,
driver.find_element(By.LINK_TEXT,”Childrens” sẽ khớp anchor tag hay <a> cái có “Childrens” text.
+ By.PARTIAL_LINK_TEXT: Tìm ra các phần tử từ các links có sẵn và những cái cái khớp một phần hay bộ phận của
string cung cấp, ví dụ,
driver.find_element(By.PARTIAL_LINK_TEXT,”click”) sẽ khớp anchor tag hay <a> cái chứa text (hay bộ phận của text)
click.
Cho chi tiết hơn về XPath và CSS Selector, hãy tham khảo phần Introducing XPath and CSS Selector to process
markup documents của các học phần trước.

Chia sẻ