Обратный поиск набора символов

У меня есть набор строк (ну, имена файлов, но эта деталь, которую я могу обработать самостоятельно), которую я хочу преобразовать в UTF-8. Однако, попробовав очевидных кандидатов, я не смог успешно выполнить преобразование, за исключением того, что это должен быть 8-битный набор символов. Итак, я спрашиваю, есть ли какая-нибудь утилита "поиск по обратному набору символов"? Т.е. я могу указать в качестве входных данных, что символ с десятичным числом 138 должен отображаться в символ Unicode "ä" (U+00E4), и инструмент выплевывает список наборов символов.

1 ответ

Отвечая себе, я как бы грубо заставил это чем-то вроде

for c in $(convmv --list); do echo -n "$c: "; convmv -f $c -t utf8 SOMEFILENAME_WITH_NON_UTF8_CHARS 2>/dev/null; done

В этом случае оказалось, что кодировкой была "MacRoman", которая, по-видимому, была некоторой кодировкой до OSX, используемой Apple.

Другие вопросы по тегам