7za.exe 9.20 не может создать архив с не английскими буквами имя файла (utf-8)
Я изо всех сил пытаюсь, чтобы 7za.exe создал архив, включающий нелатинские символы. Кодировка utf-8, символы кириллические. У меня есть папка с 4 файлами:
7za.exe privet.txt Кириллица.txt test.py
где содержимое test.py следующее:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
SOURCE_FILE = "Кириллица.txt"
DEST_ARCHIVE = "Кириллица.7z"
import subprocess
subprocess.call('7za a -bd -y privet.7z privet.txt', shell=True)
cmd_str = '7za a -bd -y %s %s' % (DEST_ARCHIVE, SOURCE_FILE)
subprocess.call(cmd_str, shell=True)
Хотя я могу создать privet.7z из privet.txt, я не могу создать Кириллица.7z из Кириллица.txt (вместо этого создается пустой архив с именем КРриР"Ð" ица.7z).
Вывод из 7za.exe:
C:\BEPPE\STAMPARE\TEST_7za_cyrillic>python test.py
7-Zip (A) 9.20 Copyright (c) 1999-2010 Igor Pavlov 2010-11-18
Scanning
Creating archive privet.7z
Everything is Ok
7-Zip (A) 9.20 Copyright (c) 1999-2010 Igor Pavlov 2010-11-18
Scanning
ÐsиÑ_иллиÑ┼а.txt: WARNING: Impossibile trovare il file specificato.
Creating archive ÐsиÑ_иллиÑ┼а.7z
WARNINGS for files:
ÐsиÑ_иллиÑ┼а.txt : Impossibile trovare il file specificato.
----------------
WARNING: Cannot find 1 file
Кто-нибудь может мне помочь с этим? Я также пытался из пакетного скрипта test.bat со следующим содержанием:
7za.exe a -bd -y privet.7z privet.txt
7za.exe a -bd -y Кириллица.7z Кириллица.txt
но результат был тот же.
2 ответа
Обработка UTF-8 (на самом деле Unicode) не легка, меня не удивило бы, что обработка имен файлов UTF-8 (или даже не ASCII) просто не была сделана. Неправильное имя созданного файла намекает на серьезные проблемы с обработкой имен файлов (программа сжатия / распаковки зависит от возможного вредоносного содержимого). Я бы отнесся к этому как к токсичным материалам, ища более надежное решение для сжатия.
Это работает для меня:
Загрузите Notepad ++ (подойдет даже минималистичный пакет <900 КБ)
Перейти к
Settings / Preferences / New Document
и установите кодировку по умолчанию в UTF-8 без спецификации :Откройте новый документ и введите в нем следующую команду:
cmd /u /c "chcp 65001 >nul && 7za.exe a -bd -y Кириллица.7z Кириллица.txt"
Убедитесь, что в строке состояния Notepad ++ указано ANSI как UTF-8, и сохраните документ в виде файла .BAT:
Откройте командную строку и запустите командный файл
Также смотрите здесь, если вы хотите, чтобы в окне командной строки отображались символы Unicode.