Ví dụ Scrapy Spider
Ở đây, chúng ta đã tạo class EcomSpider của bản thân chúng ta, dựa trên scrap.Spider, và thêm ba trường
+ name, cái là tên Spider của chúng ta (cái bạn có thể chạy sử dụng scrapy runspider spider_name)
+ start_urls, định nghĩa một mảng các URLs bạn thích scrape
+ allowed_domains, tùy chọn nhưng quan trọng khi bạn sử dụng một thực thể khởi tạo CrawlSpider cái có thể đi theo
các links trên các domains khác nhau.
Cuối cùng, chúng ta đã thêm phương thức parse() của bản thân chúng ta, nơi chúng ta khởi tạo một Product object,
định vị nó với dữ liệu (sử dụng XPath lại một lần nữa, XPath thật tuyệt phải không?), và trả về product object
của chúng ta.
Hãy chạy code của chúng ta theo cách sau, để xuất khẩu dữ liệu như JSON (nhưng bạn cũng có thể chọn CSV)
scrapy runspider ecom_spider.py -o product.json
Bạn nên có bây giờ một JSON file xinh:


