Как декодировать текстовый файл с помощью символов \uXXXX?

У меня есть файл 10 Мб, содержащий \uXXXX персонажи. Как я могу расшифровать это с помощью Sublime Text?

Пример:
введите описание здесь

1 ответ

Решение

Есть несколько вещей, которые вы можете попробовать. Прежде всего, вам нужно использовать шрифт Unicode, который поддерживает символы, которые вы хотите отобразить. Этот сайт на unicode.org является хорошим ресурсом, и Google, как всегда, весьма полезен. Если вы не возражаете против использования немонокального шрифта, Arial Unicode MS поставляется с Windows и имеет довольно хороший охват. Я считаю, что моноширинный шрифт Consolas делает то же самое

Во-вторых, ваша операционная система должна быть настроена для отображения этих символов - большинство современных есть, но вы можете столкнуться с проблемами с некоторыми версиями и настройками Windows.

В Sublime убедитесь, что вы просматриваете файл в правильном режиме - попробуйте File -> Reopen with Encoding -> UTF-8 или же ... -> UTF-16LE (или же BE, вы можете попробовать оба).

Так что, не зная точного содержимого вашего файла, как он был сгенерирован и больше информации о вашей системе, это лучшее, что я могу сделать. Удачи!


РЕДАКТИРОВАТЬ

Основываясь на файле, который вы связали, похоже, что это результат работы программы на Python 2, так как данные выглядят как списки, содержащие строки в юникоде (я программист на Python, как это и происходит). Я посмотрел пару упомянутых кодовых точек, и все они кириллические, поэтому любой современный шрифт должен их обрабатывать. Проблема в том, что вам понадобится программа для чтения в файле и перевода отдельных байтов. Если вам интересно, первая полная строка (из ' в ') является:

Любимая акция вернулась! В ресторанах Евразия "" 3 ролла по цене 1 ""! С 9 по 12 сентября! Только эти 4 дня! Подробности на evrasia.spb.ru, 88005050145 и 008

Не имея всего файла, я не могу разобрать все это за вас, но если вы программист на Python, вы должны знать, что делать (я бы рекомендовал использовать Python 3, его поддержка Unicode намного лучше, чем 2.x). Если нет, найдите человека, который сгенерировал файл, и попросите его расшифровать байты для вас.

Другие вопросы по тегам