Как объединить RSS-каналы с течением времени из одного источника?
Я хотел бы архивировать конкретные RSS-каналы и со временем увеличивать базу данных. Я заметил, что старые статьи выпадают из RSS-ленты и по мере добавления новых. Я хочу иметь возможность архивировать их на своем диске, поэтому за несколько лет я создал архив. Я предпочитаю инструмент терминала Linux, но я в порядке с GUI.
Какой инструмент я могу использовать для этого? Я также хорошо кодирую это сам на python, если кто-нибудь может предложить мне несколько библиотек...
1 ответ
Парсер подачи Python кажется хорошим решением.
https://pypi.python.org/pypi/feedparser
Кажется простым в использовании...
import feedparser
d = feedparser.parse('https://www.eff.org/rss/updates.xml')
for item in d.entries:
print (item.title)
item.id
кажется уникальным, чтобы проверить, свежие ли каналы.