Как получить статьи из базы данных RSSOwl (db40)?
Читатель RSSOwl сохраняет все статьи в базе данных. rssowl.db
, Насколько я прочитал, это база данных " db40".
Размер моего rssowl.db
На данный момент 3,9 ГБ. Я также получил другую базу данных размером около 2 ГБ, но она может быть повреждена.
Теперь я хочу получить все статьи из этих баз данных. Формат не имеет значения, если он является открытым / бесплатным форматом (XML, HTML, TXT, база данных SQL и т. Д.).
Как я мог сделать это?
Я не разбираюсь в базах данных, но я хочу копаться в этом. Я представляю, что мне нужно открыть базу данных db40 (как?) И "сопоставить" таблицы с форматом экспорта, например, с базой данных SQLite (как? Путем написания кода?).
2 ответа
Насколько я вижу, некоторые из доступных вам вариантов:
Менеджер объектов db4o - это инструмент с графическим интерфейсом для просмотра и запроса содержимого любого файла базы данных db4o. Диспетчер объектов в настоящее время предоставляет следующие функции:
- Мощные специальные запросы
- Эффективная обработка больших наборов данных
- Табличное представление для быстрой прокрутки больших наборов данных
- Древовидное представление для детализации по графу объектов
- Доступ к внутренней информации базы данных, включая хранимые классы, размер данных и индексы
- Функции управления, включая резервное копирование и дефрагментацию
DataWander может переносить данные из реляционной базы данных (Oracle 10g XE) в объектную базу данных (db4).
DataWander также может переносить данные из объектной базы данных (db4o) в реляционную базу данных (Oracle 10g XE).
Система репликации db4o (dRS):
Система репликации db4o (dRS), основанная на Hibernate, позволяет пользователям создавать приложения, которые двунаправленно синхронизируют объекты между распределенными экземплярами ведущей базы данных объектов с открытым исходным кодом db4o и всеми распространенными реляционными базами данных, такими как Oracle или MySQL. dRS делает нативную архитектуру персистентности объектов db4o доступной для всех разработчиков Java и.NET, сохраняя полную совместимость данных с существующими ИТ-средами, используя технологию реляционных баз данных.
Пакетный файл SqlExport включен в db4o:
JDBC может использоваться для резервного копирования данных db4o и для миграции данных между версиями db4o с различными форматами файлов.
Кроме того, классы могут быть сгенерированы из существующих баз данных SQL, а существующие данные могут быть импортированы в db4o.
В крайнем случае вы всегда можете написать свой собственный Java-код для экспорта в XML или любой другой формат. Дальнейшие запросы, связанные с этим, могут, конечно, быть размещены на переполнении стека или на форуме Versant.
Я немного опоздал с ответом, но вот он. В моих файловых архивах уже много лет хранится база данных каналов RSSOwl размером 300 МБ, и мне пришлось ее экспортировать. Я не хотел углубляться в знания Oracle/SQL, поэтому немного поискал в RSSOwl.
Это работает только для баз данных небольшого размера (протестировано с базой данных размером 300 МБ, но должно работать и до 500 МБ, позже вы узнаете почему). То, что вам нужно сделать, очень просто:
- Создайте новый « Фильтр новостей » в RSSOwl.
- Отметьте фильтр новостей, чтобы фильтровать все новости во всех папках. Количество элементов, возвращаемых этим фильтром, должно быть СУММОЙ всех ваших новостей.
- Нажмите на новый фильтр. На правой панели (таким образом, это зависит от того, как вы настроили графический интерфейс RSSOwl) будут появляться все новости.
- Нажмите CTRL+A , чтобы выделить все появившиеся новости.
- После того, как все выбрано, выберите в меню RSSOwl « Файл» > «Сохранить как», затем выберите место назначения HTML-файла.
Таким образом, абсолютно все мои RSS-каналы были экспортированы. Имейте в виду, что размер файла невелик по сравнению с базой данных, поскольку я уменьшил размер базы данных db4o с 300 МБ до примерно 60 МБ HTML-текста, но этот размер HTML-файла очень велик для современного браузера (примечание: я считаю, что старые браузеры лучше справляются с большими объемами данных). размер HTML-файлов, чем современный). Используйте хороший текстовый редактор или сценарии для изучения данных.
Кроме того, изначально я не мог экспортировать файл HTML, потому что RSSOwl аварийно завершал работу с ошибкой кучи памяти Java . Я немного поискал и обнаружил, что там, где находится исполняемый файл RSSOwl.exe , есть файл RSSOwl.ini. Есть параметр -XMS и -XMX. Я не мог вспомнить какой, но увеличил размер с -Xm_192m до -Xm_1024m.
Дальше я пойти не смог, так как если бы я выбрал для кучи памяти 2048 или 4096, RSSOwl даже не открылся бы. Как следствие, число 1024 ограничивает размер базы данных, которую вы можете экспортировать. Я думаю, это можно было бы легко обойти, если бы вы создали множество подфильтров для постепенного экспорта всех каналов.