Как объединить RSS-каналы с течением времени из одного источника?

Я хотел бы архивировать конкретные RSS-каналы и со временем увеличивать базу данных. Я заметил, что старые статьи выпадают из RSS-ленты и по мере добавления новых. Я хочу иметь возможность архивировать их на своем диске, поэтому за несколько лет я создал архив. Я предпочитаю инструмент терминала Linux, но я в порядке с GUI.

Какой инструмент я могу использовать для этого? Я также хорошо кодирую это сам на python, если кто-нибудь может предложить мне несколько библиотек...

1 ответ

Решение

Парсер подачи Python кажется хорошим решением.

https://pypi.python.org/pypi/feedparser

Кажется простым в использовании...

import feedparser d = feedparser.parse('https://www.eff.org/rss/updates.xml') for item in d.entries: print (item.title)

item.id кажется уникальным, чтобы проверить, свежие ли каналы.

Другие вопросы по тегам