Tenho alguns arquivos HTML que contêm tabelas, nos quais preciso realizar algumas análises.
Posso abri-los no Excel e ele preserva toda a formatação e layout da tabela (que é o que eu quero).
O problema é que ele, por padrão, formata todas as células como “gerais”. Isso significa que a conversão de dados "inteligente" do Excel entra em ação, o que,como foi observado muitos no stackexchange no passado, causa todos os tipos de problemas quando códigos e nomes aparecem como datas e são convertidos em números.
Existem maneiras de contornar isso ao importar de texto simples, forçando o Excel a abrir um assistente que permite alterar o formato de importação de "geral" para "texto". Como faço para o Excel tratar tudo como texto para um arquivo HTML?
Existe alguma maneira de alterar uma configuração global do Excel que impede o formato geral de converter datas? Ou existe alguma maneira específica de abrir arquivos html que impeça a aplicação do formato "geral"?
Responder1
Eu usaria o suplemento Power Query para isso. O Power Query pode ler arquivos HTML (locais ou web). Ele procura tabelas, portanto será necessário haver alguma consistência na estrutura HTML. Depois que a tabela HTML for lida, ela tentará detectar datas automaticamente - você pode substituir isso e converter as colunas manualmente.
Responder2
1 ano depois, você pode usar uma consulta na web e alterar as opções para desativar o reconhecimento de data, conforme especificadoaqui:https://support.microsoft.com/en-gb/kb/287027
Em vez de abrir o arquivo HTML, aponte a consulta da web para um endereço local (file:///C:/Users/.../file.html)
Para evitar que o Excel converta automaticamente números em datas, siga estas etapas ao criar uma nova consulta na Web: No Microsoft Office Excel 2003 ou no Microsoft Excel 2002, aponte para Importar Dados Externos no menu Dados e clique em Nova Consulta na Web.
No Microsoft Office Excel 2007, clique em Da Web no grupo Obter Dados Externos na guia Dados.
Na caixa Endereço, digite o endereço da página da Web que contém a tabela que você deseja importar e clique em Ir.
Clique no marcador de tabela apropriado para selecionar a tabela que deseja importar.
Clique em Opções.
Em Outras configurações de importação, clique para marcar a caixa de seleção Desativar reconhecimento de data.