Ir para conteúdo
Fórum Script Brasil
  • 0

Consulta SQL em dados questionáveis


kethellen

Pergunta

Pessoal vamos supor que tenho uma base de dados com milhões de informações e quero fazer várias análises para depois transformar e carregar num Data warehouse.

Então preciso saber como identificar por exemplo dados que as vezes são questionáveis

vamos supor que tenho uma cliente chamada Mariany Ferreira e outra cliente chamada Mariani Ferreira, tendo apenas a diferença do y para i no final do primeiro nome. Como faço uma consulta para identificar esses tipos de dados que podem na verdade ser a mesma pessoa mais tambem podem ser pessoas diferentes.

Preciso saber que tipo de consulta posso fazer em SQL para identificar esse dados na base.

Editado por kethellen
Link para o comentário
Compartilhar em outros sites

4 respostass a esta questão

Posts Recomendados

  • 0
Guest --paulobergo --

Realmente, como o Jothaz disse, faz-se uma pesquisa "fonética" para buscar um nome assim, por "aproximação"...

Mas quanto a falar de dados "questionáveis" e dizer que "Mariany Ferreira" possa ser "Mariani Ferreira", "i" e "y" são sim completamente diferentes e jamais poderiam ser a mesma pessoa, exceto na compreensão de uma pessoa...

Ou seja, eu jamais poderei achar que "JOÃO GULART" seja a mesma pessoa que "JOÃO GOULART"... e para impedir que ambos os nomes sejam cadastrados (eventualmente, num erro) para a mesma pessoa, preciso "amarrar" meu banco de dados obrigando o preenchimento de outros campos, como CPF, Identidade, PIS/PASEP, filiação...

Em termos de pesquisa, sim, como o Jothaz disse, posso pesquisar "DARCY ANTUNES" e obter

"DARCY ANTUNES", "102.404.292-00"

"DARCI ANTUNES", "204.398.992-97"

"DARCY ANTHUNES", "301.489.998-66"

"DARCI ANTUNES", "008.294.118-02"

mas não posso aceitar que sejam a mesma pessoa...

Ok?

Link para o comentário
Compartilhar em outros sites

  • 0
Pelo que entendi você quer efetuar uma consulta fonética?

Tipo: tais, thais, tays ou thays é isso?

No SQL Sever dependendo da versão temo SOUNDEX.

Dá uma pesquisada em "pesquissa fonética" pra mysql que achará várias dicas.

Olá Jothaz seguinte, preciso desta pesquisa para demonstrar num trabalho um estudo feito na base de dados para criar um data warehouse, por exemplo eu tenho em minha base de dados uma tabela Cliente com nome Mariani Ferreira e Mariany Ferreira que moram no mesmo endereço, Av. cardoso 895 cidade São Paulo estado SP, porém com codigos de cliente diferentes. Ou seja a única diferença é de uma letra no nome.

Analisando a base é um dado questionável que tem ser revisado.

Ai para comprovar a descoberta desse dado preciso demonstrar uma pesquisa que fiz nessa base que me mostrou essas duas clientes que por sinal podem ser a mesma pessoa, ou podem não ser a mesma pessoa.

Então preciso de um código SQL que faça essa busca no banco me mostrando

Link para o comentário
Compartilhar em outros sites

Visitante
Este tópico está impedido de receber novos posts.


  • Estatísticas dos Fóruns

    • Tópicos
      152,3k
    • Posts
      652,3k
×
×
  • Criar Novo...