Может ли iconv преобразовать кодировку символов?

Мне нужно конвертировать некоторые файлы на греческом языке, которые закодированы для использования со шрифтом "Symbol" в Unicode. Могу ли я использовать iconv для этого? И если да, то как называется кодировка, которая используется в "Symbol"?

2 ответа

Решение

Вы можете использовать онлайн-конвертер, найденный на этом сайте:
Символ шрифта в конвертер Unicode.

Эта статья содержит длинный список конвертеров, где автор "собрал все греческие конвертеры шрифтов, которые мне известны" (но я не знаю, какой из них рекомендовать):
Преобразователи греческого наследия в Unicode.

В противном случае вам, вероятно, придется создать свой собственный инструмент конвертации.

В статье " Преобразовать символ в юникод" в основном рассматриваются файлы HTML, которые представляют, например, символ Ω с помощью:

<font face="symbol">W</font>

Статья содержит исходный код для программы, которая конвертирует такие HTML-файлы, написанные на каком-то неопознанном языке программирования.

Другая такая статья - Как преобразовать шрифт Symbol в стандартную HTML-сущность utf8.

Иначе, один слишком простой метод может заключаться в том, чтобы использовать какой-либо текстовый процессор, чтобы просто выделить текст и изменить его шрифт, но, вероятно, он слишком прост для работы.

Вы можете опубликовать минимальный пример файла, который поможет нам понять, какой тип конверсии требуется.

Возможно, вас ждет тяжелая поездка. В оригинале Symbol использовал нестандартный набор символов, который по существу был составлен для шрифта, выделяя символы для кодовых точек ASCII визуальным сходством с символами латинского алфавита; описание того, как эта кодировка отображается в Unicode по адресу http://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt, может оказаться полезным.

Я полагаю, может быть сложно убедить iconv сделать то, что вы хотите - вам, возможно, придется прибегнуть к некоторой работе сценариев, чтобы напрямую транскодировать каждый символ.

Другие вопросы по тегам