Почему мой.tar.gz больше, чем сумма отдельно сжатых файлов в нем?

Я наблюдал следующую ситуацию, которая несколько неожиданна для меня:

У меня есть CSV-файл и соответствующий текстовый файл. Несжатые, их размеры 375 МБ и 5 КБ.

  • Когда я сжимаю CSV-файл с помощью gzip со стандартными настройками его размер уменьшен до 95 МБ. Так что вместе у меня ~ 95 МБ.
  • Когда я объединяю оба файла в tarball, а затем сжимаю их gzip Стандартные настройки, я в конечном итоге с 189 МБ.

Из того, что я знаю, сжатый tarball должен быть меньше сжатого csv-файла + txt-файла, потому что тогда gzip Можно искать избыточности во всех файлах из архива. Я знаю, что это не имеет значения для моего конкретного случая, так как текстовый файл очень маленький.

Однако не должен ли файл.tar.gz иметь такой же размер, как сжатый файл csv + txt? В моем случае это более чем в два раза больше...

Я хотел бы избежать нескольких уровней архивирования / сжатия, но все же хочу добиться хорошего сжатия. Я что-то пропустил?

0 ответов

Другие вопросы по тегам