Как правильно извлечь файлы из архива rar, который содержит не-ASCII символы в качестве имени папки или имени файла в Linux

Я использовал rar для просмотра / извлечения архива, но не-ASCII символы стали нечитаемыми словами.

7z может перечислить имя папки / имя файла с удобочитаемыми символами, однако 7z сообщило об ошибке неподдерживаемого метода при извлечении архива rar.

2 ответа

Решение

С помощью unrar вместо rar,

Этот ответ от @Ignacio vazquez-Abrams.

Я получил ту же проблему и разработал решение, несколько усложняющее: вам нужно будет установить пару программ, таких как unrar и hexedit (или любую другую с той же функциональностью), а затем создать простой скрипт bash, который будет выполнять извлечение. В моем случае содержание такого скрипта:

#!/bin/bash
unrar e -v diccionario-arabe-espanol.rar "Diccionario Arabe espaNol.pdf"

где я заменил реальное имя файла, который я хочу извлечь, на "ASCII-версию", где á (акцентированный a: ASCII шестнадцатеричный код A0) и ñ (tilde-n: ASCII код A4) были заменены любыми другими Символ ASCII (который не будет заменен вашим редактором многобайтовым символом UTF-8). Вы можете использовать hexedit, чтобы узнать заголовок файла, чтобы проверить имя интересующего вас файла, в шестнадцатеричном разделе вы увидите коды, используемые для проблемных символов.

Сохраните ваш скрипт и измените разрешения как обычно, затем отредактируйте его с помощью hexedit (или двоичного или шестнадцатеричного редактора по вашему выбору) и измените символы имени файла для извлечения соответственно, то есть в моем примере, где появляется A, замените с шестнадцатеричным A0, и замените N "espaNol" на шестнадцатеричный A4, сохраните его и запустите, вот и все, в итоге вы получите извлеченный файл, и в моей системе (linux Ubuntu 9.10) моя версия unrar (UNRAR 4.00 beta 3 freeware) создал извлеченный файл с именем, правильно преобразованным в UTF-8

В будущем я создам еще один скрипт для автоматического выполнения всех вышеперечисленных шагов. Надеюсь, что это работает для вас.

Другие вопросы по тегам