Remover registros de dados duplicados no Excel
Programas de planilhas, como o Excel, são frequentemente usados como bancos de dados para itens como estoques de peças, registros de vendas e listas de discussão.
Bancos de dados no Excel são compostos de tabelas de dados que normalmente são organizadas em linhas de dados chamadas de registros.
Em um registro, os dados em cada célula ou campo na linha estão relacionados - como o nome, endereço e número de telefone da empresa.
Um problema comum que ocorre quando um banco de dados aumenta de tamanho é o de registros ou linhas de dados duplicados.
Essa duplicação pode ocorrer se:
- Registros inteiros são inseridos no banco de dados mais de uma vez, resultando em dois ou mais registros idênticos
- Vários registros possuem um ou mais campos - como nome e endereço - contendo os mesmos dados.
De qualquer maneira, os registros duplicados podem causar uma série de problemas - como o envio de várias cópias de documentos para a mesma pessoa quando as informações do banco de dados são usadas em uma mala direta - por isso é uma boa ideia procurar e remover registros duplicados base.
E, embora seja fácil escolher registros duplicados em uma amostra pequena como a da imagem acima, as tabelas de dados podem conter facilmente centenas, senão milhares, de registros, dificultando a escolha de registros duplicados - especialmente os registros parcialmente correspondentes.
Para facilitar a realização dessa tarefa, o Excel possui uma ferramenta de dados incorporada chamada, não surpreendentemente, Remover duplicados, que pode ser usado para localizar e remover registros idênticos e parciais.
No entanto, a maneira como o Remover duplicados ferramenta é projetada, registros idênticos e parcialmente correspondentes devem ser tratados separadamente.
Isso é porque o Remover duplicados A caixa de diálogo exibe os nomes dos campos para a tabela de dados selecionada e você escolhe quais campos incluir na pesquisa de registros correspondentes:
- Para registros idênticos, pesquise todos os campos - deixe marcas de seleção ao lado de todos os nomes de coluna ou campo;
- Para corresponder registros parcialmente - deixe marcas de seleção ao lado apenas dos campos a serem correspondidos.
Nomes de campos versus letras de colunas
Como mencionado, o Remover duplicados A ferramenta consiste em uma caixa de diálogo na qual você escolhe quais campos correspondentes procurar, marcando os nomes de campos ou colunas desejados.
As informações exibidas na caixa de diálogo - nomes de campos ou letras de colunas - dependem de os dados conterem uma linha de cabeçalhos - ou cabeçalhos - no topo da tabela de dados, como visto na imagem acima.
Se isso acontecer - verifique se a opção no lado direito da caixa de diálogo - Meus dados tem cabeçalhos - é desmarcado e o Excel exibirá os nomes nessa linha como nomes de campo na caixa de diálogo.
Se os dados não tiverem uma linha de cabeçalho, a caixa de diálogo exibirá as letras de coluna apropriadas na caixa de diálogo do intervalo de dados selecionado.
Faixa contígua de dados
Para o Remover duplicados Para funcionar corretamente, a tabela de dados deve ser um intervalo contíguo de dados - ou seja, não deve ter linhas vazias, colunas e, se possível, nenhuma célula vazia localizada na tabela.
Não ter espaços em branco dentro de uma tabela de dados é uma boa prática quando se trata de gerenciamento de dados em geral e não apenas ao pesquisar dados duplicados. Outras ferramentas de dados do Excel - como classificação e filtragem - funcionam melhor quando a tabela de dados é um intervalo contíguo de dados.
Remover exemplo de registros de dados duplicados
Na imagem acima, a tabela de dados contém dois registros idênticos para A. Thompson e dois registros parcialmente correspondentes para R. Holt - onde todos os campos correspondem, exceto o número do aluno.
As etapas listadas abaixo detalham como usar o Remover duplicados ferramenta de dados para:
- Remova o segundo de dois registros idênticos para A. Thompson .
- Remova o segundo registro parcialmente correspondente para R. Holt .
Abrindo a caixa de diálogo Remover duplicatas
- Clique em qualquer célula que contenha dados no banco de dados de amostra.
- Clique no Dados guia na faixa de opções.
- Clique no Remover duplicados ícone para destacar todos os dados na tabela de dados e abrir o Remover duplicados caixa de diálogo.
- o Remover duplicados caixa de diálogo exibe todos os cabeçalhos de coluna ou nomes de campo da nossa amostra de dados
- As marcas de verificação ao lado dos nomes dos campos indicam quais colunas o Excel tentará encontrar na pesquisa de registros duplicados
- Por padrão, quando a caixa de diálogo é aberta, todos os nomes de campo são desmarcados
Encontrando Registros Idênticos
- Como estamos procurando por registros totalmente idênticos neste exemplo, deixaremos todos os cabeçalhos de coluna marcados
- Clique Está bem
Neste ponto, os seguintes resultados devem ser vistos:
- A caixa de diálogo deve fechar e ser substituída por uma mensagem dizendo: 1 valores duplicados encontrados e removidos; 7 valores exclusivos permanecem.
- A linha que contém a duplicata A. Thompson registro terá sido removido do banco de dados
- Embora haja dois registros parcialmente correspondentes para R. Hol t, porque nem todos os campos correspondem - o número do aluno para os dois registros é diferente - o Excel considera um registro de dados exclusivo
Encontre e remova registros parcialmente correspondentes com as duplicações removidas
Verificando um campo de cada vez
Como o Excel só remove os registros de dados que correspondem exatamente aos campos de dados selecionados, a melhor maneira de localizar todos os registros de dados parcialmente correspondentes é remover a marca de seleção de apenas um campo por vez, como é feito nas etapas abaixo.
Pesquisas subseqüentes de registros que correspondam em todos os campos, exceto nome, idade ou programa, removerão todas as combinações possíveis para registros parcialmente correspondentes.
Encontrando Registros Parcialmente Correspondentes
- Clique em qualquer célula que contenha dados na tabela de dados, se necessário
- Clique no Dados guia na faixa de opções.
- Clique no Remover duplicados ícone para destacar todos os dados na tabela de dados e abrir o Remover duplicados caixa de diálogo.
- Todos os nomes de campos ou cabeçalhos de coluna da tabela de dados são selecionados.
- Para localizar e remover registros que não têm uma correspondência em todos os campos, remova a marca de seleção além desses nomes de campo que o Excel deve ignorar.
- Para este exemplo, clique na caixa de seleção ao lado do Identidade estudantil cabeçalho da coluna para remover a marca de seleção.
- O Excel agora só pesquisará e removerá registros que tenham dados correspondentes no Último nome , Inicial e Programa Campos.
- Clique Está bem
- A caixa de diálogo deve fechar e ser substituída por uma mensagem dizendo: 1 valores duplicados encontrados e removidos; 6 valores exclusivos permanecem.
- A linha que contém o segundo registro para R. Holt com o Student ID de ST348-252 terá sido removido do banco de dados.
- Clique Está bem para fechar a caixa de mensagem
Neste ponto, a tabela de dados de exemplo deve estar livre de todos os dados duplicados.