Một giới thiệu về BeautifulSoup (phần 2)

Cài đặt BeautifulSoup

Vì thư viện BeautifulSoup không phải là thư viện Python mặc định, nó phải được cài đặt. Nếu bạn đã trải qua cài
đặt các thư viện Python, hãy sử dụng bộ cài đặt ưa thích.
Cho những ai người chưa cài đặt các thư viện Python (hay cần một refresher), phương pháp chung này sẽ được sử
dụng cho cài đặt nhiều thư viện xuyên suốt các học phần, nên bạn có thể muốn tham khảo phần này trong tương
lai.
Chúng ta sẽ sử dụng BeautifulSoup 4 library (cũng được biết đến như là BS4) xuyên suốt các học phần. Tài
liệu hướng dẫn đầy đủ, cũng như các hướng dẫn cài đặt, cho BeautifulSoup 4 có thể được tìm thấy tại
https://www.Crummy.com.
Nếu bạn dùng nhiều thời gian viết Python, bạn có thể đã sử dụng bộ cài đặt gói cho Python (pip).
Nếu bạn chưa, tôi khuyến nghị cao rằng bạn cài đặt pip để cài đặt BeautifulSoup và các gói Python khác sử
dụng xuyên suốt các học phần.
Phụ thuộc vào bộ cài đặt Python bạn sử dụng, pip có thể đã được cài dặt trên máy tính của bạn. Để
kiểm tra, thử:

$ pip

Lệnh này sẽ dẫn đến kết quả trong pip help text được in ra terminal của bạn. Nếu lệnh không được nhận
ra, bạn có thể cài đặt pip. Pip có thể được cài đặt theo một loạt cách, như apt-get trên Linux hay
brew trên macOS. Bất kể hệ điều hành của bạn, bạn có thể download pip bootstrap file tại
https://bootstrap.pypa.io/get-pip.py, lưu file này như get-pip.py, và chạy nó với Python:

$ python get-pip.py

Lại một lần nữa, chú ý rằng bạn đã có cả Python 2.x và 3.x cài đặt trên máy của bạn, bạn có thể
cần gọi python3 công khai:

$ python3 get-pip.py

Cuối cùng, sử dụng pip để cài đặt BeautifulSoup:

$ pip install bs4

Nếu bạn có hai phiên bản Python, cùng với hai phiên bản pip, bạn có thể cần gọi pip3 để cài đặt các gói phiên
bản Python 3.x:

$ pip3 install bs4

Và đó là nó! BeautifulSoup sẽ được nhận như một thư viện Python trên máy của bạn. Bạn có thể test cái này bằng
cách mở một Python terminal và nhập khẩu nó:

$ python
> from bs4 import BeautifulSoup

Import nên hoàn thành không lỗi.

Chia sẻ