Не удается удалить форматирование в блокноте, PureText не работает для YouTube

Если перейти по ссылке на YouTube, например, http://www.youtube.com/watch?v=1Jfm-92JXVE и я хочу скопировать некоторые комментарии в блокнот, я обнаружу, что некоторые тексты по-прежнему меньше других текстов.

Если я выберу все это и нажму сочетание клавиш PureText, оно все равно не удалит форматирование. Если я выберу все и "поменяю" все на один шрифт и размер шрифта (он уже был), это не сделает все это одним размером.

введите описание здесь

введите описание здесь

4 ответа

Хотя в тексте нет никакого форматирования, кажется, что текст содержит символы Юникода (в отношении которых я не уверен), я предполагаю, что это является причиной проблемы. Быстрый способ их удаления - сохранить текстовый файл в формате ASCII и снова открыть его.

Вы можете найти их вне диапазона символов и решить, что с ними делать. Некоторые из них могут быть кавычками. Вы могли бы просто хотеть заменить те с прямыми кавычками. Но другие будут вашими неприятными персонажами, которые блокнот может не обработать, и вы захотите их удалить.

Так что для блокнота ++ находка [\x{0080}-\x{FFFF}]

Обратите внимание, что вы нажмете на вкладку замены, чтобы найти / заменить.

Выше должно быть достаточно, но некоторые дальнейшие объяснения

Диапазон ascii составляет 0000h-007Fh, то есть base10, 0-127. Так что, если вы ищете любой юникод вне этого, то есть 128+, то есть 80h-FFFFh, то вы можете найти эти символы. Синтаксис регулярного выражения имеет концепцию диапазона символов, поэтому [AZ] будет любым символом между A и Z в Unicode. А в notepad++ вы указываете символ с кодом utf-16 с обозначением \x{...}, где... - это шестнадцатеричный код, поэтому для 'A', шестнадцатеричный код которого равен 41, вы должны указать \x{0041}. Editpad будет использовать \u.... например \u0041, Так что в Editpad Pro вы бы сделали [\u0080-\uFFFF], В блокноте ++ вы бы сделали, как на картинке выше. [\x{0080}-\x{FFFF}] Обратите внимание, что синтаксический аспект регулярного выражения одинаков, но способ задания символа различается в разных текстовых редакторах.

Основываясь на ответе R4D4, я предлагаю следующее (либо / оба работали для меня):

1) Используйте Windows Notepad:

  • (а) вставьте текст в новый файл в блокноте Windows
  • (б) удалить любые непреднамеренные / скрытые символы, которые появляются, например, мягкие дефисы (см. ответ barlop в этой теме: при копировании текста с YouTube в буфер обмена появляются тире?)
  • (c) сохраните его как файл ANSI (примечание: здесь появится предупреждающее сообщение, если текст содержит символы Юникода; нажмите "ОК")
  • (d) открыть файл ANSI, созданный на предыдущем шаге
  • (e) скопируйте и вставьте текст в нужное место

2) Используйте Блокнот ++

  • (а) вставьте текст в новый файл в Notepad++
  • (б) удалить любые странные символы, которые могут появиться **
  • (c) изменить кодировку с UTF-8 на ANSI
  • (d) снова удалите любые странные символы, которые могут появиться
  • (e) скопируйте и вставьте текст в нужное место

** Это предполагает, что ваши настройки Notepad++ следуют настройкам по умолчанию для создания новых файлов с кодировкой UTF-8. Проверка на непреднамеренные символы в обеих кодировках может быть необходимой, поскольку некоторые проблемные символы не выглядят странно в ANSI и их легче обнаружить в UTF-8 (например, мягкие дефисы: см. Ответ barlop в этой теме: Копирование текста из YouTube в буфер обмена вводит черточки?).

По какой-то причине я могу выбросить что-нибудь в блокнот, и все форматирование удаляется без сохранения. кроме простого текста остаются только некоторые вкладки. Использование Win 7 Home Premium версии 6.1 с пакетом обновления 1 (SP1), другие советы на http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm и http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html

Другие вопросы по тегам