Điều hướng trên các cây HTML
Hàm find_all chịu trách nhiệm cho tìm ra các tags dựa trên tên và các thuộc tính của chúng. Nhưng cái gì xảy ra
nếu bạn cần tìm ra một tag dựa trên vị trí của nó trong một tài liệu? Đó là nơi điều hướng cây đi tới có sẵn.
Trong học phần trước, bạn nhìn vào điều hướng một cây BeautifulSoup thep một hướng đơn:
bs.tag.subTag.anotherSubTag
Bây giờ hãy nhìn vào điều hướng lên, qua, và chéo qua các cây HTML. Bạn sẽ sử dụng shopping site trực tuyến của
chúng tôi tại http://www.pythonscraping.com/pages/page3.html như một trang ví dụ cho scraping, như thể hiện
ảnh dưới.
HTML cho trang này, chập ra như một cây (với một vài tags bị bỏ đi cho ngắn gọn), trông giống cái này:
Bạn sẽ sử dụng cùng cấu trúc HTML này như một ví dụ trong các phần tiếp theo.