Как удалить странные символы пробела в Word

Как удалить странные символы пробела в Word

Я получил от одного парня файлы Word, написанные на русском языке, и конвертировал их в HTML.

Эти файлы содержат некоторые странные пробельные символы, например:

введите описание изображения здесь

Это выглядит как маленький ноль (я изменил режим, чтобы показать специальные символы). В скрытом режиме это просто пробел.

Проблема в том, что эти символы выглядят некрасиво при конвертации файла в HTML.

Мне нужно их удалить. Но если я их ищу, я не могу отличить их от use space (выглядят как точки), поэтому я вручную сканирую все файлы, чтобы найти и удалить их.

Итак, как мне найти и удалить эти специальные символы?

решение1

Этот символ называется неразрывным пробелом (NBSP) и находится в Unicode U+00A0(который, как вы правильно отметили, отличается от обычного пробела, который есть в Unicode U+0020).

Неразрывный пробел используется, когда вы хотите, чтобы между двумя словами был пробел, но вы не хотите, чтобы Word (или любой другой текстовый редактор, который их поддерживает) ставил там разрыв строки или перенос строки. Например, они полезны, если вы хотите написать предложение «Этот компьютер поддерживает Microsoft Windows.» без разрыва строки между «Microsoft» и «Windows».

Что касается вашей проблемы с их отображением в документе Word, то ее очень легко исправить. Все, что вам нужно сделать, это скопировать-вставить и пример NBSP в раздел поиска Find and Replace, а затем ввести обычный пробел в раздел замены. Это должно устранить вашу проблему.


Если вам интересно, более подробную информацию о NBSP можно найти здесьв Википедии. Однако для ваших целей полезно знать, что хотя HTML обрабатывает любое количество последовательных обычных пробелов как один пробел, он обрабатывает NBSP особым образом (вы могли видеть его представленным в вашем HTML-выводе как  ). Это сделано для того, чтобы пользователи могли иметь немного более тонкий контроль над интервалами в ситуациях, когда CSS не подходит (или если вы просто хотите быстрый и грязный хак :) ). Так что вы можете обнаружить, что NBSP действительно пригодятся в HTML в конечном итоге - однако они определенно загромождают ваш исходный HTML-код, и они раздражают, когда не нужны.

Вам также может быть интересно узнать, как самостоятельно вставлять NBSP в Word — без необходимости постоянно копировать-вставлять из Википедии. Вы можете вставить их из диалогового окна «Вставка символа» (вкладка «Вставка» > «Символ» > вкладка «Специальные символы» > «Неразрывный пробел»). Вы также можете использовать сочетание клавиш Ctrl+ Shift+ Space. В диалоговом окне «Найти и заменить» вы также можете вставить их, нажав More >>, затем Specialраскрывающийся список, затем Nonbreaking space.

решение2

Если у вас есть поиск Word для обычных пробелов, он также найдет неразрывные пробелы. Таким образом, вы можете преобразовать все неразрывные пробелы в обычные пробелы, просто поставив пробел в полях «Найти:» и «Заменить на:».

Связанный контент