Почему clang генерирует неразборчивый текст при перенаправлении?

Я пытаюсь сохранить вывод команды в файл. Команда:

clang -Xclang -ast-dump -fsyntax-only main.cpp > output.txt

Однако полученный файл output.txt при открытии (с помощью gedit и jedit в ubuntu) дает мне следующее:

[0;1;32mTranslationUnitDecl[0m[0;33m 0x4192020[0m <[0;33m<invalid sloc>[0m> [0;33m<invalid sloc>[0m
[0;34m|-[0m[0;1;32mTypedefDecl[0m[0;33m 0x4192558[0m <[0;33m<invalid sloc>[0m> [0;33m<invalid sloc>[0m implicit[0;1;36m __int128_t[0m [0;32m'__int128'[0m
[0;34m| `-[0m[0;32mBuiltinType[0m[0;33m 0x4192270[0m [0;32m'__int128'[0m
[0;34m|-[0m[0;1;32mTypedefDecl[0m[0;33m 0x41925b8[0m <[0;33m<invalid sloc>[0m> [0;33m<invalid sloc>[0m implicit[0;1;36m __uint128_t[0m [0;32m'unsigned __int128'[0m
[0;34m| `-[0m[0;32mBuiltinType[0m[0;33m 0x4192290[0m [0;32m'unsigned __int128'[0m
...

Когда это действительно должно выглядеть так:

TranslationUnitDecl 0x4e46020 <<invalid sloc>> <invalid sloc>
|-TypedefDecl 0x4e46558 <<invalid sloc>> <invalid sloc> implicit __int128_t '__int128'
| `-BuiltinType 0x4e46270 '__int128'
|-TypedefDecl 0x4e465b8 <<invalid sloc>> <invalid sloc> implicit __uint128_t 'unsigned __int128'
| `-BuiltinType 0x4e46290 'unsigned __int128'
...

Я думал, что это может быть проблема кодирования, я проверил кодировку файла, file -bi output.txt какие выводы text/plain; charset=us-ascii,

Я подумал, может быть, если я изменю кодировку на utf-8, проблема будет исправлена, поэтому я попробовал это:

clang -Xclang -ast-dump -fsyntax-only main.cpp | iconv -f us-ascii -t UTF-8 > output.txt

но это не имело значения.

Что я могу сделать, чтобы решить эту проблему?

Проблема не в том, что я пытаюсь просмотреть выделенную синтаксисом версию (у меня не было проблем с ее просмотром). Мне нужно сохранить AST, сгенерированный clang, в файл, а затем проанализировать его, что было бы трудно с информацией о цвете, оставшейся в.

3 ответа

Решение

Это не имеет ничего общего с кодовыми страницами / кодированием. Ваш вывод не простой текст. Он содержит такие последовательности, как [0;1;32m, Эти строки (перед каждым из них есть символ (не показан), а также [escape]) являются инструкциями для терминала для отображения текста, выделенного полужирным шрифтом, курсивом, различными цветами и т. Д. Это приводит к более легкому чтению вывода, если ваш терминал поддерживает это.

Должна быть возможность указать clang не пытаться украсить вывод, а вместо этого использовать обычный текст. Проверьте руководство. (У меня нет одной под рукой, поэтому я не могу сказать вам, какой будет правильная команда.)

В качестве альтернативы, вместо удаления цветов из вывода, вы можете просмотреть цветной вывод в вашем терминале, используя необработанную опцию less

less -r output.txt

Эти персонажи, такие как [0;33m выглядишь как управление выводом терминала для меня. Они являются частью набора escape-последовательностей, которые часто используются для применения цветов к тексту в терминале. В исходном состоянии, как это, он также часто используется для применения цвета к самой подсказке bash. Вот что я использовал в .bashrc годами на всех моих машинах:

export PS1='\[\033[1;33m\]\u\[\033[1;35m\]@\[\033[1;32m\]\h\[\033[0;36m\]\w\[\033[1;37m\]\$ \[\033[0;37m\]'

(Большинство думает, что это некрасиво, но мне это нравится).

Посмотрите, сможете ли вы найти переключатель для удаления какой-либо цветовой кодировки или тому подобного из выходных данных ваших команд, и посмотрите, поможет ли это.

Другие вопросы по тегам