Rút dữ liệu
Bây giờ hãy thử một vài biểu thức XPath để rút product title và price:
Trong trường hợp này, chúng ta sẽ tìm kiếm cho <span> đầu tiên bên trong <div id=”my-4″> của chúng ta.
In [16]: response.xpath(“//div[@class=’my-4′]/span/text()”).get()
Out[16]: ‘20.00$’
Tôi cũng có thể sử dụng một cái chọn CSS:
In [21]: response.css(‘.my-4 > span::text’).get()
Out[21]: ‘20.00$’
Scrapy không thực thi bất cứ Javascript nào theo mặc định, nên nếu website bạn đang thử scrape đang sử dụng một
khung frontend như Angular / React.js, bạn có thể gặp khó khăn truy cập dữ liệu bạn muốn.

