none
Como posso limpar essa tabela? RRS feed

  • Pergunta

  • Olá a todos..

     

    Bom, foi me dada a tarefa de algum jeito "limpar" essa tabela, que contem diversos dados repetidos..

    porem os dados são repetidos mas nao 100% iguais..

    ex.

    Nome                                                                    -          Autor

    A CONQUISTA DA MATEMÁTICA                    -          GIOVANNI
    A CONQUISTA DA MATEMATICA                    -          GIOVANNI

     

    (alguns campos duplicados onde alguns tem acento e outros nao)

    Nome                                        -          Autor

    HELP - MATEMATICA               -  ESTADAO
    HELP- MATEMATICA                - ESTADAO

    outros tem 1 espaco a mais ou menos que outros..

     

    Nome                                                     -          Autor

    PORTUGUES LINGUAGENS                 WILLIAM ROBERTO
    PORTUGUES LINGUAGENS                  WILLIAN ROBERTO

    e por fim outros o nome do autor esta errado

    e tem outros diversos repetidos..

     

    existe alguma maneira de arrumar isso sem ser ver registro por registro ??

    (essa tabela tem quase 7000 registros.. sendo que tipo uns 2000 devem estar assim.. ou seja.. arrumar isso manualmente vai ser complicado :( )

     

    segunda-feira, 15 de janeiro de 2007 18:44

Todas as Respostas

  • Boa tarde Paek

     

    Utilize a função SOUNDEX, e dê um update baseado no valor de retorno desta função.

    select soundex('A CONQUISTA DA MATEMÁTICA '),soundex('A CONQUISTA DA MATEMATICA')

     

     

     

    Espero ter ajudado...

    segunda-feira, 15 de janeiro de 2007 18:52
  •  

    A função Soundex, tem como objetivo, analisar a fonêtica de um conjunto de palavras, ou seja, ela tentar diferençar a maneira com que é falada uma determinada expressão.

    segunda-feira, 15 de janeiro de 2007 19:11
  •  

    bom essa funcao funciono porem + ou -

    ex.

    Nome                                                                             Soundex                   Autor

    MEIO AMBIENTE VIDA E SAUDE                           M000                 MATTEUCCI & FERREIRA
    MEIO AMBIENTE VIDA E SAUDE                           M000                 MATTEUCCI V. FERREIRA
    MEIO AMBIENTE VIDA E SAUDE 4.SERIE           M000                 MATEUCCI V. FERREIRA

     

    Como pode ver nao posso usar essa funcao pois,,,

    MEIO AMBIENTE VIDA E SAUDE   = MEIO AMBIENTE VIDA E SAUDE 4.SERIE pra ele entao fica meio =S

    segunda-feira, 15 de janeiro de 2007 19:17
  • Para fazer uma comparação mais minuciosa vc pode utilizar a função DIFFERENCE se faz uma comparação mais detalhada sobre o retorno da função SOUNDEX. Dá uma olhada no BOL qualquer coisa retorne,

     

     

    Espero ter ajudado

    Boa sorte...

    segunda-feira, 15 de janeiro de 2007 19:27
  • hm.. esse diference deu meio que na mesma =/

    estive fazendo algum testes e.. esse soundex eh meio furado =S

    ex.

    select soundex('A MORTE'), soundex('A VIDA NO MAR')   = A000, A000

    consequentemente pra ele

    select difference('A MORTE', 'A VIDA NO MAR')   = 4

    ou seja.. nao posso usar esses pois.. ele nao eh exatamente confiavel..

     

    =/ acho que pelo jeito vou ter que perder alguns finais de semana arrumando essa tabela +S

    bom vlw por tentar me ajudar..

     

    terça-feira, 16 de janeiro de 2007 11:43