Не удается удалить форматирование в блокноте, PureText не работает для YouTube
Если перейти по ссылке на YouTube, например, http://www.youtube.com/watch?v=1Jfm-92JXVE и я хочу скопировать некоторые комментарии в блокнот, я обнаружу, что некоторые тексты по-прежнему меньше других текстов.
Если я выберу все это и нажму сочетание клавиш PureText, оно все равно не удалит форматирование. Если я выберу все и "поменяю" все на один шрифт и размер шрифта (он уже был), это не сделает все это одним размером.
4 ответа
Хотя в тексте нет никакого форматирования, кажется, что текст содержит символы Юникода (в отношении которых я не уверен), я предполагаю, что это является причиной проблемы. Быстрый способ их удаления - сохранить текстовый файл в формате ASCII и снова открыть его.
Вы можете найти их вне диапазона символов и решить, что с ними делать. Некоторые из них могут быть кавычками. Вы могли бы просто хотеть заменить те с прямыми кавычками. Но другие будут вашими неприятными персонажами, которые блокнот может не обработать, и вы захотите их удалить.
Так что для блокнота ++ находка [\x{0080}-\x{FFFF}]
Обратите внимание, что вы нажмете на вкладку замены, чтобы найти / заменить.
Выше должно быть достаточно, но некоторые дальнейшие объяснения
Диапазон ascii составляет 0000h-007Fh, то есть base10, 0-127. Так что, если вы ищете любой юникод вне этого, то есть 128+, то есть 80h-FFFFh, то вы можете найти эти символы. Синтаксис регулярного выражения имеет концепцию диапазона символов, поэтому [AZ] будет любым символом между A и Z в Unicode. А в notepad++ вы указываете символ с кодом utf-16 с обозначением \x{...}, где... - это шестнадцатеричный код, поэтому для 'A', шестнадцатеричный код которого равен 41, вы должны указать \x{0041}. Editpad будет использовать \u.... например \u0041
, Так что в Editpad Pro вы бы сделали [\u0080-\uFFFF]
, В блокноте ++ вы бы сделали, как на картинке выше. [\x{0080}-\x{FFFF}]
Обратите внимание, что синтаксический аспект регулярного выражения одинаков, но способ задания символа различается в разных текстовых редакторах.
Основываясь на ответе R4D4, я предлагаю следующее (либо / оба работали для меня):
1) Используйте Windows Notepad:
- (а) вставьте текст в новый файл в блокноте Windows
- (б) удалить любые непреднамеренные / скрытые символы, которые появляются, например, мягкие дефисы (см. ответ barlop в этой теме: при копировании текста с YouTube в буфер обмена появляются тире?)
- (c) сохраните его как файл ANSI (примечание: здесь появится предупреждающее сообщение, если текст содержит символы Юникода; нажмите "ОК")
- (d) открыть файл ANSI, созданный на предыдущем шаге
- (e) скопируйте и вставьте текст в нужное место
2) Используйте Блокнот ++
- (а) вставьте текст в новый файл в Notepad++
- (б) удалить любые странные символы, которые могут появиться **
- (c) изменить кодировку с UTF-8 на ANSI
- (d) снова удалите любые странные символы, которые могут появиться
- (e) скопируйте и вставьте текст в нужное место
** Это предполагает, что ваши настройки Notepad++ следуют настройкам по умолчанию для создания новых файлов с кодировкой UTF-8. Проверка на непреднамеренные символы в обеих кодировках может быть необходимой, поскольку некоторые проблемные символы не выглядят странно в ANSI и их легче обнаружить в UTF-8 (например, мягкие дефисы: см. Ответ barlop в этой теме: Копирование текста из YouTube в буфер обмена вводит черточки?).
По какой-то причине я могу выбросить что-нибудь в блокнот, и все форматирование удаляется без сохранения. кроме простого текста остаются только некоторые вкладки. Использование Win 7 Home Premium версии 6.1 с пакетом обновления 1 (SP1), другие советы на http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm и http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html