
Quero remover tags iniciais e finais de nomes de países.
No meu exemplo, essas tags são <li>
e <a>
.
<li><a href="http://afghanistan.makaan.com/">Afghanistan</a></li>
<li><a href="http://albanie.makaan.com/">Albanie</a></li>
<li><a href="http://algérie.makaan.com/">Algérie</a></li>
O resultado deve ser:
Afghanistan
Albanie
Algérie
No Microsoft Word, quero usar oLocalizar e substituirrecurso para realizá-lo com expressão regular.
Como posso usar expressões regulares no MS Word?
Responder1
Em vez de copiar o texto de entrada para o Word, copie-o para o Notepad++ ou qualquer outro editor com suporte total a RegEx.
Seria uma string RegEx para selecionar tudo fora das tags ou tudo entre >
os sinais.<
(?<=>).*?(?=<)
(?<=>)
é umolhar para trás. Procura>
sinais e funciona como âncora. Desta forma você pode excluir a string de pesquisa, o que é importante porque você não quer<Afghanistan
.*?
é umquantificador preguiçosoe seleciona tudo até a próxima expressão(?=<)
é umolhe para frentee procura um<
sinal, mas exclui o próprio sinal pesquisado. Assim como o olhar para trás
Masvocê não deseja selecionar os nomes dos países. Você deseja remover todas as tags. Você precisa do oposto da primeira expressão regular. Algo como
<.*?>
- Abra a caixa de diálogo de pesquisa e substituição do Notepad ++
- SelecioneUse expressões regulares
- Encontre o que:
<.*?>
- Substitua por: nada
Responder2
Isso é fácil de fazer no MS WordLocalizar e substituir, sem Regex, sem JavaScript, etc.
Se você escapar de um colchete, ele encontrará o caractere real do colchete. Portanto, com os curingas ativados, a expressão \<*\\>
encontrará tudo entre colchetes angulares. Apenas substitua isso por nada.
Responder3
Esseparece que é o que você precisa.
Dado o último comentário (que você só quer em javsacript) - eu procuraria em algum lugar comoaqui
se você quiser isso em um banco de dados SQL, provavelmente escreverei algumas linhas de perl para fornecer a lista do javascript bruto. Pelo que eu posso dizer; O MS Word não entra nisso.
Responder4
Eu não usaria localizar/substituir para isso. Seria mais simples usar "Texto para Colunas" no Excel para essa tarefa. Para isso, selecione a coluna que contém o texto, vá até a faixa “Dados” e selecione “Texto para Colunas”. Você precisará fazer isso duas vezes, uma vez para remover todo o texto anterior ao nome do país (o símbolo delimitado seria ">" - certifique-se de excluir as colunas estranhas para evitar confusão) e uma vez para remover o texto após o nome (delimitado o símbolo seria "<").