find() và find_all() với BeautifulSoup (phần 2)

find() và find_all() với BeautifulSoup (tiếp tục)

Tham số recursive là một boolean. Bạn muốn đi sâu vào tài liệu bao xa? Nếu recursive được thiết lập thành True,
hàm find_all nhìn vào phần tử con, con của con, etc., cho các tags cái khớp tham số. Nếu nó là False, nó sẽ
chỉ nhìn vào các tags mức đỉnh trong tài liệu của bạn. Theo mặc định, find_all làm việc recursively (recursive
được thiết lập thành True). Nói chung, nó là một ý tưởng tốt để để lại cái này như nó là, trừ phi bạn thực sự
biết cái gì bạn cần để làm và hiệu suất là một vấn đề.
Tham số text là không thường lệ ở chỗ rằng nó khớp dựa trên nội dung text của các tags, hơn là các đặc tính của
các tags bản thân chúng. Ví dụ, nếu bạn muốn tìm ra số lần “the prince” được bao quanh bởi các tags trên trang
ví dụ, bạn có thể thay thế hàm .find_all() của bạn trong ví dụ trên với các dòng sau:

nameList = bs.find_all(text=’the prince’)
print(len(nameList)

Đầu ra là 7
Tham số limit, tất nhiên, chỉ được sử dụng trong phương thức find_all, find là tương ứng với cùng lời gọi find_all
với một limit bằng 1. Bạn có thể thiết lập cái này nếu bạn quan tâm giành chỉ vật x đầu tiên từ trang. Nhận thức
rằng cái này cung cấp cho bạn các vật đầu tiên trên trang trong trật tự chúng xuất hiện trong tài liệu, không nhất
thiết các cái đầu tiên bạn muốn.

Chia sẻ