Почему иногда документы Word уменьшаются в размере после добавления текста?

Много раз, когда я делаю свое обычное резервное копирование документа (перезаписывая предыдущий), я обнаруживаю, что, хотя я добавил достаточное количество текста в новый документ (и НЕ изменил форматирование существующего текста), он может быть меньше, чем старый документ

Иногда после добавления примерно 3 тысяч слов в данный документ его размер может уменьшиться на 15 КБ по сравнению с предыдущей итерацией того же документа (без уменьшения размера существующих изображений или редактирования форматирования).

Какова причина этого?

2 ответа

Решение

Современный формат текстовых файлов - это набор XML-файлов в zip-контейнере. .docx подать в .zip и вы можете открыть файл в вашей любимой программе zip).

Если текст, который вы добавляете в файл, хорошо сжимается, например, он содержит много повторяющихся текстовых шаблонов или в исходном документе использовалась более старая версия стандарта, которая не использовалась в качестве агрессивной настройки zip, размер файла может закончиться вверх из-за того, как файл был заархивирован послесловием.

Никто действительно не понимает формат файла для слова, даже Microsoft, даже те, которые перевернули его. Есть стандарт для этого, но это, как говорят, бесполезно.

Известно одно: современные версии представляют собой набор файлов, заархивированных. Таким образом, алгоритм zip может работать лучше в следующий раз.

Другой вариант, это может сделать какую-то сборку мусора: удалить ненужные вещи. (Общеизвестно, что люди извлекали удаленный текст из текстовых документов, часто смущая автора.)

Другие вопросы по тегам