Subscribe RSS feeds sử dụng Python (tiếp tục)
Làm cách nào làm nó
1. Nhập khẩu module feedparser, cũng như datetime, delorean, và requests:
>>> import feedparser
>>> import datetime
>>> import delorean
>>> import requests
2. Duyệt feed (nó sẽ được download tự động) và kiểm tra xem khi nào nó được cập nhật cuối cùng. Thông tin feed,
như title của feed có thể được giành trong thuộc tính feed:
>>> rss = feedparser.parse(‘http://rss.nytimes.com/services/xml/
rss/nyt/HomePage.xml’)
>>> rss.channel.updated
Friday, 24 Jan 2020 19:42:27 +0000′
3. Nhận các nhập vào cái nhỏ hơn hoặc bằng 6 giờ tuổi:
>>> time_limit = delorean.parse(rss.channel.updated) – datetime.
timedelta(hours=6)
>>> entries = [entry for entry in rss.entries if delorean.
parse(entry.published) > time_limit]
4. Một vài của các nhập vào trả về sẽ lâu hơn 6 giờ:
>>> len(entries)
28
>>> len(rss.entries)
54
5. Giành thông tin về các nhập vào, như title. URL nhập vào đầy đủ là có sẵn như link. Khám phá thông tin có sẵn
trong feed cụ thể này:
>>> entries[18][‘title’]
‘These People Really Care About Fonts’
>>> entries[18][‘link’]
‘https://www.nytimes.com/2020/01/24/style/typography-font-design.
html?emc=rss&partner=rss’
>>> requests.get(entries[18].link)
<Response [200]>