Может ли iconv преобразовать кодировку символов?
Мне нужно конвертировать некоторые файлы на греческом языке, которые закодированы для использования со шрифтом "Symbol" в Unicode. Могу ли я использовать iconv для этого? И если да, то как называется кодировка, которая используется в "Symbol"?
2 ответа
Вы можете использовать онлайн-конвертер, найденный на этом сайте:
Символ шрифта в конвертер Unicode.
Эта статья содержит длинный список конвертеров, где автор "собрал все греческие конвертеры шрифтов, которые мне известны"
(но я не знаю, какой из них рекомендовать):
Преобразователи греческого наследия в Unicode.
В противном случае вам, вероятно, придется создать свой собственный инструмент конвертации.
В статье " Преобразовать символ в юникод" в основном рассматриваются файлы HTML, которые представляют, например, символ Ω
с помощью:
<font face="symbol">W</font>
Статья содержит исходный код для программы, которая конвертирует такие HTML-файлы, написанные на каком-то неопознанном языке программирования.
Другая такая статья - Как преобразовать шрифт Symbol в стандартную HTML-сущность utf8.
Иначе, один слишком простой метод может заключаться в том, чтобы использовать какой-либо текстовый процессор, чтобы просто выделить текст и изменить его шрифт, но, вероятно, он слишком прост для работы.
Вы можете опубликовать минимальный пример файла, который поможет нам понять, какой тип конверсии требуется.
Возможно, вас ждет тяжелая поездка. В оригинале Symbol использовал нестандартный набор символов, который по существу был составлен для шрифта, выделяя символы для кодовых точек ASCII визуальным сходством с символами латинского алфавита; описание того, как эта кодировка отображается в Unicode по адресу http://unicode.org/Public/MAPPINGS/VENDORS/ADOBE/symbol.txt, может оказаться полезным.
Я полагаю, может быть сложно убедить iconv сделать то, что вы хотите - вам, возможно, придется прибегнуть к некоторой работе сценариев, чтобы напрямую транскодировать каждый символ.