
Tenho uma lista de mais de 20.000 nomes. O nome e o sobrenome de cada pessoa estão todos em uma coluna "Nome Completo". Preciso criar duas colunas para Nome e Sobrenome.
Fazer isso é fácil para a maioria. Mas para algumas pessoas, é bastante complicado.
Aqui estão alguns exemplos do espectro de nomes com os quais estou lidando. Examinar um por um levaria semanas.
Qualquer sugestão de como lidar com isso seria útil.
EX:
David Batte
Guy-Mael Jacobe de Naurois
Jean-Marc Lioutier
Thibaud Le Seguillon
Mrs. Manuela Junghaehnel
Hussain Mohammed Dipu Kabir
Responder1
Não existe uma fórmula única que resolva isso porque há muita variedade. Mas existe uma abordagem que reduzirá bastante a tarefa.
Você pode escrever uma fórmula para lidar com qualquer padrão de nome específico. Quando você tem muitos nomes que se enquadram em um padrão comum, é um bom investimento de tempo. Quando você tem um ou dois nomes que se ajustam a um padrão, levará mais tempo para encontrar esses exemplos e criar a fórmula do que simplesmente analisá-los manualmente.
A solução prática é fazer isso com múltiplas passagens. Use colunas auxiliares, cada uma com uma única fórmula padrão ou algumas que possam ser facilmente combinadas. Cada conjunto sucessivo de colunas auxiliares pode ignorar linhas que já foram analisadas. Quando terminar, você pode concatenar colunas auxiliares em colunas de resultados únicos, &
porque elas conterão um resultado analisado ou um espaço em branco.
Automatize os mais fáceis:
- nomes e sobrenomes únicos (com base no único espaço em branco no meio)
- nomes hifenizados (um nome hifenizado ainda é uma string, então você também pode dividir no espaço)
- prefixos e sufixos de nomes comuns (como le, de, etc.; procure os padrões em um formato como
_de_
, onde o sublinhado representa um espaço e vincule-o ao nome associado) - títulos (Sr., Sra., Sra., Dr., Sr., Jr., etc.; procure-os e vincule-os ao nome associado ou apenas use-os para localizar o nome e ignorar o título)
- vários nomes se você for dividir apenas o primeiro (procure o primeiro espaço em branco)
- etc.
A fórmula da primeira rodada é propagada para todas as linhas. Classifique os resultados para que todas as linhas em branco (não resolvidas) fiquem no topo ou use um filtro para mostrar apenas essas linhas. Propague a próxima fórmula para as linhas não resolvidas nas próximas colunas auxiliares. Repita para cada fórmula sucessiva. Se você começar com os padrões mais comuns, a lista diminuirá rapidamente e os exemplos não resolvidos serão agregados para simplificar a busca pelo próximo padrão.
A fórmula para qualquer padrão será direta. Está além do escopo de uma resposta criar uma coleção abrangente de fórmulas, mas você sempre pode perguntar sobre um padrão específico que não consegue descobrir, e uma pesquisa no site ou na web em geral revelará respostas existentes que cobrirão comuns.
Este processo deixará uma percentagem sucessivamente menor por resolver. Verifique se há pontos em comum que possam ser facilmente tratados em outras rodadas automatizadas. Eventualmente, você terá padrões de caso único que são mais rápidos de fazer manualmente do que de codificar, e esses serão um número muito mais gerenciável.
Você pode até ajudar a automatizá-los usando uma fórmula ou VBA que permite especificar onde dividir (como inserir 2
o segundo espaço em branco) ou ter uma coleção de fórmulas para dividir em diferentes delimitadores e você escolhe a fórmula). A fórmula então analisa o nome.