none
Data mining RRS feed

  • Pergunta

  • Salve, salve galera do msdn, a duvida eh a seguinte, preciso fazer mineracao de dados em uma base de dados, soh que a mesma taoh com mtos dados redundantes, gostaria de saber se tem uma forma dinamica de retirar as redundancias da base de dados sem que afete a integridade dos mesmo? algum comando especifico?

     

    outra duvida toh com o sql server 2000 quero ir para o 2005, posso simplisemnte fazer um upgrade na ferramenta? os dados naum vao fikar corrompidos?

     

    e por ultimo, tenho que desenvolver um projeto de data mining, gostaria de saber se alguem possui algum tutorial, tipo um passo a passo, para que eu possa ir me familiarizando com as ferramenta de data mining do sql server.

     

    vlws

    quinta-feira, 6 de dezembro de 2007 04:29

Todas as Respostas

  • A redundância não deveria existir já que suas informações estão agregadas (DW)...

    Acho que vc precisa rever como as informações foram geradas, eliminar as redundâncias e corrigir o processo.

     

    Para migrar para o SQL Server 2005 utilize o "Update Advisor"... ele vem junto com o SQL 2005... ele vai te dizer o que precisa ser feito para vc não ter problemas na migração. Vc precisa tomar cuidados com T-SQL de suas aplicações. Alguns códigos não são mais permitidos (Ex.: *=)...

    Mas a migração não muito segredo.

     

     

    É meio complicado achar material util de Data Mining. Mas veja esse link:

    http://msdn2.microsoft.com/en-us/library/ms167167.aspx

     

    Abraço

    quinta-feira, 6 de dezembro de 2007 18:58
  • ok lucas, vlws pela dica, soh que toh com outra duvida, tenho a tabela abaixo

     

    tab produto

    cod   produto

    1          A

    2          A

    3          A

    4          A

    5          B

     

    e assim sucesivamente, essa tab prod tem um chave estrangeira na tab vendas.... tipow... gostaria de eliminar essa redundancia... tipow..o msmo produco com varios codigos, tenho uma base com quase 1 milhao de dados, precisaria de uma rotina para fazer issso... sem perder a integridade do banco... por ex: como substituir na minha tabela vendas as chaves estrangeiras dos dados reduntantes. por ex?

     

    vendas redundantes

     

    cod  codProd   descricao

    1         1            afadf

    2          2           afdasf

    3          3            afsdfs

     

    percebe ai que o mesmo produto foi vendido 3 vezes, soh que com identificaores diferentes... como corrigir isso?

     

    vlws

    quinta-feira, 6 de dezembro de 2007 19:12
  • entendi sim fera...

    me envia o script de criação da sua tabela de produtos e da sua tabela de vendas...

    Vou montar um script para vc aqui...

    Abraço

    sexta-feira, 7 de dezembro de 2007 11:52
  • Olá GZOFERA,

     

    Encontrei este webcast q fala um poco como criar um projeto data mining. Espero q ajude.

    https://msevents.microsoft.com/CUI/WebCastEventDetails.aspx?EventID=1032304517&EventCategory=5&culture=pt-BR&CountryCode=BR

     

    Abraços

    sexta-feira, 7 de dezembro de 2007 13:05
  • tah ai fera o script da tabela

     


    CREATE TABLE [dbo].[produto] (
     [CODPRD] [varchar] (30) COLLATE Latin1_General_CI_AS NOT NULL ,
     [NOMEFANTASIA] [varchar] (80) COLLATE Latin1_General_CI_AS NULL
    ) ON [PRIMARY]
    GO

    CREATE TABLE [dbo].[fato] (
     [IDMOV] [int] NULL ,
     [CODPRD] [varchar] (30) COLLATE Latin1_General_CI_AS NULL ,  // aki eh a chave estrangeira de produto
     [CODCFO] [varchar] (25) COLLATE Latin1_General_CI_AS NULL ,
     [IDCIDADE] [int] NULL ,
     [CODGRD] [varchar] (20) COLLATE Latin1_General_CI_AS NULL ,
     [CODITMGRD] [varchar] (20) COLLATE Latin1_General_CI_AS NULL ,
     [QUATIDADE] [numeric](18, 0) NULL ,
     [DATASAIDA] [smalldatetime] NULL
    ) ON [PRIMARY]
    GO

     

    vlws.... toh aguardando resposta...

     

    pri... mtooo obrigadooo pela ajuda, acho que esse material vai me ajudar mtoooo

     

    att

     

    Graziano

    sexta-feira, 7 de dezembro de 2007 17:41
  • Graziano, vamos por partes...

     

    Tabela Produto:

    - não é uma boa prática vc utiizar varchar como indice para uma tabela...

    - o idéal seria vc criar uma nova coluna IDPRODUTO do tipo int identity. Ex:

     

    CREATE TABLE [dbo].[produto] (
     [IDPRODUTO] [int] identity(1,1),

     [CODPRD] [varchar] (30) COLLATE Latin1_General_CI_AS NOT NULL ,
     [NOMEFANTASIA] [varchar] (80) COLLATE Latin1_General_CI_AS NULL
    ) ON [PRIMARY]

    GO

    CREATE TABLE [dbo].[fato] (
     [IDMOV] [int] NULL ,
     [IDPRODUTO] [INT] NOT NULL ,  // aki eh a chave estrangeira de produto
     [CODCFO] [varchar] (25) COLLATE Latin1_General_CI_AS NULL ,
     [IDCIDADE] [int] NULL ,
     [CODGRD] [varchar] (20) COLLATE Latin1_General_CI_AS NULL ,
     [CODITMGRD] [varchar] (20) COLLATE Latin1_General_CI_AS NULL ,
     [QUATIDADE] [numeric](18, 0) NULL ,
     [DATASAIDA] [smalldatetime] NULL
    ) ON [PRIMARY]
    GO

     

    - Você pode manter a a coluna CODPRD caso vc precise de uma codigo alfanúmerico para localiz com mais rapidez seus  produtos, mas não a utilize como chave primária

     

    Existe alguma restrição para que isso seja feito?

    Abraço

    sexta-feira, 7 de dezembro de 2007 19:04
  • fera, tbem achei estranho a chave primaria ser do tipo varchar, esse banco de dados conseguie aki em uma empresa da minha regiao, toh fazendo minha monografia sobre data mining, e toh usando esse banco como estudo de caso, tenho pouco tempo, naum sei o q fazer, tipow... arrumar isso ai? ou ir assim mesmo para frente? jah existe um cubo olap rodando em cima desse banco, e ele naum apresentou problema nenhum, detalhe, o cubo naum foi criado por mim, a base tah confusa, mais tenho q seguir em frente, para data mining com aquelas redundacias de dados, talvez eu naum coseguiria chegar a resultado nenhum, por isso toh tentando buscar alguma solucao.

     

    qualquer coisa soh perguntar novamente

     

    vlws pela forca

    sexta-feira, 7 de dezembro de 2007 19:31
  • cara, vc pode deixar assim mesmo ou dar uma revisada geral na base...

    Eu revisaria tudo... mas se estiver funcionando e for melhor para vc deixe como esta...

     

    abraço

    segunda-feira, 10 de dezembro de 2007 13:10