Datenaufbereitung
Data Mining erfordert in jedem Fall eine vorhergehende Aufbereitung der verwendeten Daten.
Liegen diese z.B. als einzelne Bestellvorgänge in einer Datenbank vor, müssen diese
Einzelbestellungen zuerst auf Kundenebene verdichtet werden. Weiterhin ist es notwendig,
Einzelbestellungen auf zeitlicher Ebene zu verdichten, also z.B. saisonbezogen. Auch eine
Verdichtung nach verschiedenen Produktgruppen ist sinnvoll.
Unsere Analysesoftware Score™ 4.0 ermittelt völlig
selbständig, welche Variablen sinnvoll für eine Data-Mining-Analyse verwendet werden
können und welche nicht. D.h. man muss gar nicht genau entscheiden, welche Art von
Daten man dem Tool genau zur Verfügung stellt: man übergibt der Software ganz
einfach ein Überangebot an Kundeneigenschaften (verschiedene Verdichtungsebenen der
Grunddaten) und lässt die Software selbständig aus diesem Angebot
auswählen.
Score™ 4.0 ist so leistungsfähig, dass ein Überangebot an Daten keinerlei
Hindernis darstellt. Wir verwenden zur Zeit bis zu 500 Variablen für unsere Analysen.
Dies ist keine obere Grenze, eine Erweiterung auf 1000 oder 2000 Variablen wäre einfach
möglich. Würde man diese Datenvielfalt von vorneherein einschränken, würde
man der Analysesoftware auf jeden Fall Entscheidungsmöglichkeiten rauben. Wir raten
unseren Kunden davon immer strikt ab, da die Data-Mining-Software selbst viel besser gute von
schlechten Variablen trennen kann, als ein Mensch dazu jemals in der Lage wäre.
Nach Ablauf einer Analyse kann man genau ermitteln, welche Daten von der Software
besonders stark berücksichtigt wurden, und welche ignoriert wurden. Dies
nachträgliche Analyse der Ergebnisse hat noch nie zu Widersprüchen geführt,
sondern stets zur Anerkennung durch menschliche Marketingexperten, die die Entscheidungen der
Software stets bestätigten.
Das automatische Auswählen der verwendeten Variablen kann natürlich auch zu
Fehlern führen, ein Computer ist immer noch ein dummer Rechenknecht und keine
intelligente Maschine. Die extrem hohe Transparenz von Score™ 4.0 erlaubt aber immer ein sehr
rasches Auffinden solcher Datenmängel. Per Mausklick können dann Einzelvariablen
oder ganze Variablengruppen von der Analyse ausgeschlossen werden. Die sehr hohe
Analysegeschwindigkeit von Score™ 4.0 erlaubt die Korrektur solcher Fehler innerhalb weniger
Minuten.
weiter zur
Datenanalyse...
|