Общая сжимаемость различных форматов файлов
Кто-нибудь сталкивался со списком файловых форматов, которые обычно хорошо сжимаются (в общих алгоритмах)?
Как правило, текстовые файлы .txt
хорошо сжимаю и медиа-файлы (.mp3
, .avi
и т.д.) плохо сжимаются.
Я ищу список (или базу данных) форматов файлов, чтобы я мог ответить на вопрос "Will a general, lossless algorithm compress a <.xxx> file?
".
РЕДАКТИРОВАТЬ: Конечно, по своей природе случайные данные, медиа-файлы и сжатые данные не сжимаются хорошо. Это не мой вопрос.
Вопрос: Где можно посмотреть описания форматов файлов, в частности, чтобы узнать, содержит ли формат сжатие?
Примеры:
Чертежи AutoCAD, различные форматы Microsoft Office, файлы базы данных Oracle .DBF, файлы Adobe PDF, файлы Outlook PST и т. Д.
1 ответ
Из того, что я могу понять по вашему вопросу, похоже, что вы пытались сжать уже сжатый файл. Форматы файлов, такие как.png, .jpg, .avi, pdf, .mp4 и многие другие, могут уже иметь свои данные в сжатом формате. Попытка сжать такие файлы не приведет к значительному уменьшению их размера.