none
Faktentabelle mit Daten befüllen

    Frage

  • Hallo zusammen,

    bezüglich eines Datawarehouse das ja bekanntlich aus Dimensionstabellen und Faktentabellen besteht, würde ich gerne wissen wie die Datenbefüllung der Faktentabellen genau geschieht. Würde mich hierbei über eine ausführliche Antwort freuen.

    Dimensionstabellen Daten liegen ja fertig in Excel Dateien bzw. Csv Dateien vor. Für das Slowly Changing Dimension kann man ja dann jeden Datensatz ( Tupel ) einen Surrogatekey verpassen. Nachdem jede Dimensiontabelle nur ihren ETL prozess ins Datawarehouse geladen ist inkl. Surrogatekey. Muss nun die Faktentabelle befüllt werden.

    Nehmen wir an, wir haben also 4 Dimensionen: 

    Product, Store, Zeit, Kunde

    Die Daten der Dimensionstabelle sind, sind ja an sich, Daten die sich aus dem Geschäftsprozessen. Z.b. Sind alle Kunden, in der Dimensionstabelle Kunde gespeichert, die z.B. im Media Markt im Operativen System bei einer Rechnung eingeschrieben worden sind. Oder sind alle Producte in der Dimensionstabelle gespeichert, die das Unternehmen Media Markt im Unternehmen anbietet. 

    Nun aber die die Faktentabelle:

    Ich denke hier ist nichts vorgespeichert, sondern jeder Eintrag ergibt sich aus einen Geschäftsablauf. Nehmen wir an, Ich als Kunde ( meine Kunden id ist 1) der bei Media Markt ( store ist auch 1) eingetragen ist, kaufe ein Iphone 4(Artikelnummer 123) für 400€. Dann würde ja in der Faktentabelle folgender Eintrag stehen:

    KundenId = 1 
    StoreId = 1 
    ProductId = 123  
    DateId = 1.1.2013 

    Sprich, wenn man an ein BI Projekt für Media Markt arbeiten würde, und es gibt noch kein Datawarehouse. Wie würde man dann die Faktentabellen erstellen. Alle Rechnungen in die Faktentabelle laden?

    Würd mich freuen, wenn jemand schaut , ob das was ich geschrieben habe so stimmt, oder anders in der Praxis ist. 

    Danke!


    Kalle

    Mittwoch, 30. Januar 2013 00:23

Alle Antworten

  • Hallo Kalle,

    wenn ich das alles richtig intepretiere, kann ich das im groben bestätigen. Wobei nur ungern eine pauschale Aussage treffen würde. Als DateId würde ich allerdings eher int verwenden. (20130101) Auch muss ein DW nicht immer zwingend ein oder nur ein Sternschema enthalten.

    Gruß,

    Andreas

    Donnerstag, 31. Januar 2013 15:16
  • Hallo Kalle,

    der Media Markt ist zunächst ein Einzelhändler und dort ist in einem Großteil der Fälle kein Kunde zuzuordnen.
    Online oder Geschäfte auf getrennte Rechnung mal außen vor gelassen existiert meist nur ein Kassenbon.
    Da die wenigsten Kunden Vielkäufer sind, ist er als Einzelexemplar ohnehin weniger von Interesse -

    Wenn eher über ein Bonusprogramm (sofern beim Mediamarkt vorhanden - war lange nicht mehr dort);
    denn die existieren eigentlich nur aus dem Grunde und nicht für die spartanischen Belohnungen
    (deswegen habe ich von diesen Karten NULL ;)

    Wichtig ist aber die Filiale (für Vergleiche der Märkte untereinander) und sofern Beratung erfolgt ist, der Verkäufer.

    Die Kasse / Kassierer(in) selbst dürfte von geringerem Interesse sein, geben täte sie aber auch.

    Das Datum würde man vermutlich mit Zeitanteil speichern, da dies für einige Betrachtungen wichtig sein kann;

    z. B. Wann ist das Hauptgeschäft und daraus resultierend: Wieviel Personal braucht man wann?

    Da die Kassen an die zentrale EDV angeschlossen sein dürften, kommen die Daten schon automatisch an
    und müssen nur noch "abgefüllt" werden.

    Zusätzlich: Da im Einzelhandel Umschlagskennziffern eine große Rolle spielen, würde man die Einkäufe ebenso benötigen
    (hier die Lieferungen an die einzelnen Filialen) - wichtig auch für die verschiedenen Aktionen (für die die Kette ja berüchtigt ist ;)

    Gruß Elmar

    Donnerstag, 31. Januar 2013 16:21
    Beantworter
  • Hallo Kalle,

    der Media Markt ist zunächst ein Einzelhändler und dort ist in einem Großteil der Fälle kein Kunde zuzuordnen.
    Online oder Geschäfte auf getrennte Rechnung mal außen vor gelassen existiert meist nur ein Kassenbon.
    Da die wenigsten Kunden Vielkäufer sind, ist er als Einzelexemplar ohnehin weniger von Interesse -

    Wenn eher über ein Bonusprogramm (sofern beim Mediamarkt vorhanden - war lange nicht mehr dort);
    denn die existieren eigentlich nur aus dem Grunde und nicht für die spartanischen Belohnungen
    (deswegen habe ich von diesen Karten NULL ;)

    Wichtig ist aber die Filiale (für Vergleiche der Märkte untereinander) und sofern Beratung erfolgt ist, der Verkäufer.

    Die Kasse / Kassierer(in) selbst dürfte von geringerem Interesse sein, geben täte sie aber auch.

    Das Datum würde man vermutlich mit Zeitanteil speichern, da dies für einige Betrachtungen wichtig sein kann;

    z. B. Wann ist das Hauptgeschäft und daraus resultierend: Wieviel Personal braucht man wann?

    Da die Kassen an die zentrale EDV angeschlossen sein dürften, kommen die Daten schon automatisch an
    und müssen nur noch "abgefüllt" werden.

    Zusätzlich: Da im Einzelhandel Umschlagskennziffern eine große Rolle spielen, würde man die Einkäufe ebenso benötigen
    (hier die Lieferungen an die einzelnen Filialen) - wichtig auch für die verschiedenen Aktionen (für die die Kette ja berüchtigt ist ;)

    Gruß Elmar

    Genau, für das konkrete Bsp. Media Markt würde ich das auch so sehen. :-) Daran kann man erkennen, dass es auf mehrere Faktoren ankommt, wie man sowas aufbaut.

    Gruß,

    Andreas


    Andreas Spanner http://as-data-solutions.de SQL Server Consulting

    Freitag, 1. Februar 2013 10:18