none
Para que sirve "Data mining" en SSIS?? RRS feed

  • Pregunta

  • Buenos días,

    He estado buscando por google para que sirve el "data mining" en SSIS, pero no consigo encontrar ningún sitio donde lo expliquen bien.

    Lo he buscado para saber si sirve para evitar la duplicidad de datos al cargar un excel en SQL Server, ya que si hago una carga para actualizar los datos, me carga la tabla completa, y solo necesito los registros nuevos y/o diferentes...

    Alguien podría explicarme para que sirve eso??

    y si eso no sirve..alguien sabe como evitar que cargue todos los datos y que solo inserte los nuevos??

    Muchas gracias de antemano!!


    SarayAC


    • Editado SAC93 martes, 18 de abril de 2017 13:45
    martes, 18 de abril de 2017 9:12

Respuestas

  • Hola que tal SAC93, el datamining de SSIS es para correr una consulta DMX para correr algun modelo como Arbol de Decision, Cluster, etc basandose en SSAS, lo que tu necesitas es hacer un MERGE JOIN con SSIS para que te inserte los nuevos registros, aqui te dejo un ejemplo.

    Insertar lo nuevo con MERGE JOIN

    Cualquier cosa nos comentas.

    Saludos,

    Jorge Muchaypiña G.


    Business Intelligence Analyst

    • Propuesto como respuesta Enrique AA martes, 18 de abril de 2017 15:48
    • Marcado como respuesta SAC93 miércoles, 19 de abril de 2017 6:35
    martes, 18 de abril de 2017 15:26

Todas las respuestas

  • Hola SAC93

    Una explicación muy puntual del data mining es la extracción de los datos sumamente importantes y de gran relevancia para una determinada empresa o entidad. El data mining termina siendo una inteligencia de negocios que hay que realizar a la empresa, para la clásica toma de decisiones a través de indicadores, etc..

    Lo que tu deseas hacer con excel es una pequeña parte del proceso del data mining y supongo que estas usando el data tools para realizarlo, a este proceso se le denomina ETL. Para llegar a lo que tu deseas deberías realizar una tarea con algún indicador que identifique los registros para poder copiarlo. Esto lo puedes lograr a través de los DataFlow Task.

    Te dejo un ejemplo al respecto Creando ETL con SQL Server Integration Services (SSIS), ahí manejan los DataFlow.

    Saludos



    Si ayudé a resolver tu consulta, no olvides marcar como respuesta y/o votar como útil.

    martes, 18 de abril de 2017 14:54
  • Hola que tal SAC93, el datamining de SSIS es para correr una consulta DMX para correr algun modelo como Arbol de Decision, Cluster, etc basandose en SSAS, lo que tu necesitas es hacer un MERGE JOIN con SSIS para que te inserte los nuevos registros, aqui te dejo un ejemplo.

    Insertar lo nuevo con MERGE JOIN

    Cualquier cosa nos comentas.

    Saludos,

    Jorge Muchaypiña G.


    Business Intelligence Analyst

    • Propuesto como respuesta Enrique AA martes, 18 de abril de 2017 15:48
    • Marcado como respuesta SAC93 miércoles, 19 de abril de 2017 6:35
    martes, 18 de abril de 2017 15:26
  • Buenos días y gracias a ambos por las explicaciones, me han sido de gran ayuda.

    La idea de utilizar la MERGE JOIN es muy buena Jorge, y justo lo que necesitaba, pero al intentar hacerlo me encuentro con un problemilla... Yo utilizo la versión 2005 (aunque no por gusto, es lo que tienen aqui instalado....) y el problema en cuestión es que esta versión no dispone de la herramienta SORT para poder mapear a posteriori.

    Se que en las opciones avanzadas del OLE DB Source, permite indicar los rangos para el mapeo, pero el problema es que uno de los codigos principales para hacer ese filtro se modifica a posteriori en la BBDD añadiendole 4 digitos mas, es decir, en el excel me pasan un código con formato "1234" y después en la BBDD se modifica y pasa a ser un código tipo : "00111234".

    Lo que ocurre es que aunque haga un derived column para dejar el campo igual, el programa no permite ponerle el SortKeyPosition una vez modificado el campo (o al menos no encuentro la manera de hacerlo). No sé si me he explicado bien...

    Sabéis alguna alternativa para poder indicar la posición una vez modificado el campo??? Más que nada para poder mantener la tabla de la BBDD tal cual está, si no, siempre me quedará la opción de guardar ese campo por duplicado, manteniendo el original y el modificado.

    Muchisimas gracias por las respuestas!! ;)


    SarayAC




    • Editado SAC93 miércoles, 19 de abril de 2017 14:50
    miércoles, 19 de abril de 2017 6:54