Web Scraping dễ dàng với Scrapy (phần 5)

Rút dữ liệu

Bây giờ hãy thử một vài biểu thức XPath để rút product title và price:
shop
Trong trường hợp này, chúng ta sẽ tìm kiếm cho <span> đầu tiên bên trong <div id=”my-4″> của chúng ta.

In [16]: response.xpath(“//div[@class=’my-4′]/span/text()”).get()
Out[16]: ‘20.00$’

Tôi cũng có thể sử dụng một cái chọn CSS:

In [21]: response.css(‘.my-4 > span::text’).get()
Out[21]: ‘20.00$’

Scrapy không thực thi bất cứ Javascript nào theo mặc định, nên nếu website bạn đang thử scrape đang sử dụng một
khung frontend như Angular / React.js, bạn có thể gặp khó khăn truy cập dữ liệu bạn muốn.

Chia sẻ