
Я хочу удалить начальные и конечные теги из названий стран.
В моем примере это теги <li>
и <a>
.
<li><a href="http://afghanistan.makaan.com/">Afghanistan</a></li>
<li><a href="http://albanie.makaan.com/">Albanie</a></li>
<li><a href="http://algérie.makaan.com/">Algérie</a></li>
Результат должен быть:
Afghanistan
Albanie
Algérie
В Microsoft Word я хочу использоватьНайти и заменитьвозможность сделать это с помощью регулярного выражения.
Как использовать регулярные выражения в MS Word?
решение1
Вместо того чтобы копировать введенный текст в Word, скопируйте его в Notepad++ или любой другой редактор с полной поддержкой RegEx.
Строка RegEx для выбора всего, что находится за пределами тегов или всего, что находится между знаками >
и .<
(?<=>).*?(?=<)
(?<=>)
этосмотреть за. Он ищет>
знаки и действует как якорь. Таким образом, вы можете исключить строку поиска, что важно, поскольку вы не хотите<Afghanistan
.*?
этоленивый квантификатори выбирает все до самого следующего выражения(?=<)
этосмотреть впереди ищет<
знак, но исключает сам искомый знак. Так же, как взгляд сзади
НоВы не хотите выбирать названия стран. Вы хотите удалить все теги. Вам нужно обратное первому регулярному выражению. Что-то вроде
<.*?>
- Открыть диалоговое окно поиска и замены в Notepad++
- ВыбиратьИспользуйте регулярные выражения
- Найти то, что:
<.*?>
- Заменить на: ничего
решение2
Это легко сделать в MS Word.Найти и заменить, без Regex, без JavaScript и т. д.
Если вы экранируете скобку, то она найдет сам символ скобки. Так что, если включены подстановочные знаки, выражение \<*\\>
найдет все, что находится между угловыми скобками. Просто замените это ничем.
решение3
Этотпохоже, это то, что вам нужно.
Учитывая последний комментарий (что вы просто хотите это в javsacript) - я бы поискал что-то вродездесь
если вы хотите это в базе данных SQL, то я, вероятно, просто напишу пару строк perl, чтобы предоставить вам список из сырого javascript. Насколько я могу судить; MS Word не подходит.
решение4
Я бы не стал использовать для этого функцию поиска/замены. Проще всего было бы использовать функцию "Текст по столбцам" в Excel для этой задачи. Чтобы сделать это, выберите столбец, содержащий текст, перейдите на ленту "Данные" и выберите "Текст по столбцам". Вам нужно будет сделать это дважды: один раз, чтобы удалить весь текст перед названием страны (разделителем будет ">" - убедитесь, что вы удалили лишние столбцы, чтобы избежать путаницы), и один раз, чтобы удалить текст после названия (разделителем будет "<").