Невозможно удалить форматирование в Блокноте, PureText не работает для YouTube

Невозможно удалить форматирование в Блокноте, PureText не работает для YouTube

Если я перейду по ссылке на YouTube, напримерhttp://www.youtube.com/watch?v=1Jfm-92JXVEи я хочу скопировать некоторые комментарии в блокнот, я обнаруживаю, что часть текста все еще меньше, чем другой текст.

Если я выделю все и нажму сочетание клавиш PureText, это все равно не удалит форматирование. Если я выделю все и "изменю" все на один шрифт и размер шрифта (так уже было), это не сделает все одним размером.

введите описание изображения здесь

введите описание изображения здесь

решение1

Хотя в тексте нет никакого форматирования, текст, похоже, содержит символы Unicode (какие именно, я не уверен), предполагаю, что это и вызывает проблему. Быстрый способ их удаления — сохранить текстовый файл как ASCII и снова открыть его.

решение2

Вы можете найти эти символы, выходящие за пределы диапазона, и решить, что с ними делать. Некоторые из них могут быть фигурными кавычками. Вы можете просто заменить их прямыми кавычками. Но другие будут вашими раздражающими символами, которые блокнот может не обрабатывать должным образом, и вы захотите их удалить.

Так что для Notepad++ находка[\x{0080}-\x{FFFF}]

Обратите внимание, что вам нужно щелкнуть вкладку «Заменить», чтобы можно было выполнить поиск/замену.

введите описание изображения здесь

Вышеизложенного должно быть достаточно, но некоторые дополнительные пояснения

Диапазон ASCII составляет 0000h-007Fh, т. е. base10, 0-127. Так что если вы ищете любой Unicode за пределами этого, т. е. 128+, т. е. 80h-FFFFh, то вы можете найти эти символы. Синтаксис регулярных выражений имеет концепцию диапазона символов, поэтому [AZ] будет любым символом от A до Z в Unicode. А в Notepad++ вы указываете символ с кодом UTF-16 с помощью нотации \x{...}, где ... - это шестнадцатеричное значение, так что для 'A', шестнадцатеричное значение которого равно 41, вы указываете \x{0041}. Editpad будет использовать \u.... например \u0041. Так что в Editpad Pro вы сделаете [\u0080-\uFFFF]. В Notepad++ вы сделаете, как на рисунке выше. [\x{0080}-\x{FFFF}] Обратите внимание, что аспект синтаксиса регулярных выражений тот же самый, но способ указания символа отличается в разных текстовых редакторах.

решение3

по какой-то причине я могу что угодно закинуть в блокнот, и все форматирование удаляется без сохранения. кроме обычного текста остаются только некоторые вкладки. Использование Win 7 Home Premium Version 6.1 SP1 другие советы по http://www.techsupportalert.com/remove-unwanted-formatting-from-text.htm и http://blog.eogn.com/eastmans_online_genealogy/2011/07/remove-text-formatting-when-copying-and-pasting.html

решение4

Основываясь на ответе R4D4, я предлагаю следующее (один или оба варианта сработали для меня):

1) Используйте Блокнот Windows:

  • (а) вставьте текст в новый файл в Блокноте Windows
  • (б) удалите все непреднамеренные/скрытые символы, которые появляются, например, мягкие дефисы (см. ответ barlop в этой теме:При копировании текста с YouTube в буфер обмена появляются тире?)
  • (c) сохраните его как файл ANSI (примечание: здесь появится предупреждающее сообщение, если текст содержит символы Unicode; нажмите «ОК»)
  • (d) открыть файл ANSI, созданный на предыдущем шаге
  • (e) скопируйте и вставьте текст в нужное место

2) Используйте Notepad++

  • (а) вставьте текст в новый файл в Notepad++
  • (б) удалить любые странные символы, которые могут появиться**
  • (c) изменить кодировку с UTF-8 на ANSI
  • (d) снова удалите любые странные символы, которые могут появиться
  • (e) скопируйте и вставьте текст в нужное место

**Предполагается, что ваши настройки Notepad++ соответствуют настройкам по умолчанию для создания новых файлов с кодировкой UTF-8. Проверка на наличие непреднамеренных символов в обеих кодировках может быть необходима, поскольку некоторые проблемные символы не выглядят странно в ANSI и их легче обнаружить в UTF-8 (например, мягкие дефисы: см. ответ barlop в этой теме:При копировании текста с YouTube в буфер обмена появляются тире?).

Связанный контент