
Datawarehouse Definition (Definition und Anwendung)
Hier finden Sie umfangreiche Informationen rund um das Thema Datawarehouse. In wenigen Wochen startet der Datawarehouse Blog "DW Anzeiger" Die Produktivität eines Datawarehouse ist zweifelsohne der entscheidende Faktor für den unternehmerischen Erfolg in Vertrieb und Marketing. Sie zu gewährleisten ist eine der größten Herausforderungen, mit denen sich erfolgsorientierte Unternehmen – von der KMU bis hin zum Großkonzern - konfrontiert sehen. Täglich treffen Hunderte Dokumente, Anträge und Rechnungen in den Unternehmen ein, die nach den unterschiedlichsten Kriterien erfasst, geprüft und verarbeitet werden müssen. Gerade der Zeit- und Kostenfaktor für diese Bearbeitung ist enorm und wirkt sich negativ auf die Produktivität aus. An einem Informationsmanagement und einer effizienten Steuerung der Workflows führt somit kein Weg mehr vorbei.Beschreibung und Funktion eines Datawarehouse
Ein Datawarehouse ist ein zentrales Datenlager in das Inhalte aus verschiedenen Quellen und mit verschiedener Struktur extrahiert und mittels eines ETL-Loaders geladen, bereinigt und entsprechend formatiert werden. Beim ETL-Prozess werden die Schritte Extraktion, Transformation und Laden durchgeführt. Dadurch wird eine globale Sicht auf heterogene und verteilte Daten in einem System erreicht.
Das Datawarehouse fungiert in erster Linie als Informationssystem, das eine schnelle Bereitstellung der Daten für Berichte und Statistiken gewährleisten soll. Ein weiterer wichtiger Zweck ist die flexible Datenanalyse als Basis einer betriebswirtschaflichen Entscheidungshilfe.
Datenspeicherung im Datawarehouse
Der Kern des Datawarehouse ist der passive Datenbestand, der nach der Integration strukturiert und redundanzfrei abgelegt ist. Somit ist ein über Metadaten gesteuerter Zugriff auf einen "single point of truth" gewährleistet und eine umfassende, globale Sicht gegeben, die zur Erstellung von Berichten oder zur Ermittlung von Kennzahlen bestens geeignet ist. Der ETL-Prozess läßt sich auch zeitlich gesteuert wiederholen, sodass zeitmäßig strukturierte Daten in das Datawarehouse geladen werden können. Dadurch ergeben sich durch die chronologische Aufbereitung auch Informationen über Zusammenhänge und Zeitabläufe.
Die Datenspeicherung geschieht im Regelfall themenorientiert, das heißt sortiert nach bestimmten Objekten, wie Produkten oder Kunden. Bei anderen Systemen wird oft nur vereinheitlicht, also auf jede Strukturierung bei der Speicherung verzichtet, was eine komplexe Systematik bei den Auswertungen erfordert.
Für anwendungsspezifische Zwecke und zur besseren operativen Zuordnung werden die Daten zusätzlich separiert, was über sogenannte Data-Marts organisiert werden kann. Bei den Data-Marts werden vorzugsweise häufiger benutzte Datenbereiche als Kopien separat abgespeichert, um zum einen einen schnelleren Zugriff auf diese Bereiche zu erhalten, als auch eigenständige Anwendungen zu begünstigen. Dadurch ergeben sich performante und auch transaktionsorientierte Abfragemöglichkeiten.
Betrieb des Datawarehouse und Anwendungen
Der Betrieb des Datawarehouse umfasst die Prozesse der Datenbeschaffung, der Verwaltung und der Auswertung. Bei der Beschaffung werden die Daten über den ETL-Prozesses in das Datawarehouse geladen und so in der gewünschten Formatierung integriert. Bei der Verwaltung werden die Zugriffe möglichst performant ausgelegt und auch den Anwendungen entsprechend optimiert, was im Regelfall über die Data-Marts geschieht, also mit Ausszügen anwendungspezifischer Daten gearbeitet wird.
Die Analyse und Datenbereitstellung generell wird über Data-Mining realisiert. Beim Data-Mining werden verdeckte Zusammenhänge und neue Muster auf den Daten mit statistischen Methoden mathematisch ermittelt.
Da bei der Integration der Daten zwar strukturiert vorgegangen wird, aber auf Modellannahmen weitestgehend verzichtet wird, werden so die Datenstrukturen während des Betriebes ermittelt. Es findet also ein Lernprozess in der Datenbank statt, was oft als "knowledge discovery in databases" bezeichnet wird.
Neben dem turnusmäßigen Laden der Daten, was eine zeitliche Auswertung ermöglicht ist in den letzten Jahren als Weiterentwicklung das Real-Time-Data-Warehousing entstanden. Das heißt Auswertungen werden am Workflow orientiert und prozessgesteuert in Echtzeit gefahren, und das Datawarehouse kann auch zusätzlich mit zeitnahen Ananlyse- und Worklfowdaten weiter gepflegt werden. Das wiederum ist Voraussetzung für ein "active Data Warehouse", bei dem über ein geschlossenes Verfahren, dem "closed loop" die Analysedaten wieder in das Datawarehouse eingespielt werden, womit eine Aktualisierung mit frischen Auswertungen stattfindet und die Analyseergebnisse die Daten und die Qualität des Warehouse beeinflussen, was zum Beispiel bei Marktumfragen im Einzelhandel von großem Interesse ist oder bei Marketingaktionen in der Telekommunikationsbranche.
Mit den genannten Fähigkeiten ist ein Datawarehouse ein optimales Instrument um Abfragen im Bereich Business-Intelligence zu tätigen und als weiterentwickeltes aktives Datawarehouse auch fähig die Profitibiltät und Leistungsfähigkeit eines modernen Unternehmens zu steigern und ist daher unverzichtbarer Baustein eines zeitgerechten Enterprise, bzw. Business-Performance-Managements.
Weitere Informationen zu Data-Warehouse finden Sie auch auf Wikipedia unter http://de.wikipedia.org/wiki/Data-Warehouse
Linktip: www.ichbinsselbst.de
Europas großer Weber Grill Shop
Europas großer Zaun Shop