Big Data Analyse oder Hypothesen testen?

Worum geht es

Big Data (große Datenmenge) meint zunächst die Zahlenkolonnen, die bei Webanwendungen, Sensoren an Maschinen oder für das Wetter und bei Fakturierungs- und CRM-(Kundenbeziehungsmanagement)-Software anfallen.

Arbeit mit Hypothesen bedeutet, dass eine Grundannahme existiert, z. B. wer Golf fährt wird wieder einen Golf kaufen. Diese Annahme kann nach einer repräsentativen Umfrage unter 500 Golf-Fahrern bestätigt oder verworfen werden. Verwerfen bedeutet, laut Umfrageergebnis sagt die Eigenschaft „Golf fahren“ überhaupt nichts über die Wahrscheinlichkeit des Kaufs eines weiteren Golfs aus.

Big Data Anwendungen sind Softwarepakete, die aus diesen Daten ohne Grundannahmen Zusammenhänge herauslesen können. Dazu werden die Daten betrachtet und Häufungen (Cluster) gesucht, oder Entscheidungsbäume gebildet. Beispiel für einen Entscheidungsbaum: ich möchte ausrechnen, ob eine Apfelbaum dieses Jahr Ertrag haben wird. Gemessen habe ich folgende Daten über mehrere Jahre an vielen Bäumen: Alter, Sorte, Bodennährstoffe, Sonneneinstrahlung, Ertrag. Mit Entscheidungsbäumen und Clustern kann ich den Ertrag vorhersagen.

Schätzung und Realität
Schätzung und Realität – hier hat es funktioniert

Gerne werden daher Big-Data Anwendungen zur Umsatzprognose bei Händlern, zur Lagerhaltung und zum Errechnen von Maschinenstandzeiten ausgerechnet. Händler profitieren, indem sie die Bestellmengen und die Lagerhaltung dem erwarteten Umsatz anpassen können, einige können sogar Bestellungen ausliefern, die noch gar nicht getätigt wurden. Der Computer wußte, dass der Kunde noch kommt.

Es entsteht doch Nutzen

Weiter können neue Korrelationen gefunden werden, die traditionell nach Hypothesenbildung aus den Datenbeständen statistisch errechnet und oft auch übersehen wurde. Es ist keine theoretische Begründung für den Zusammenhang mehr nötig.

Die Auswertung von Big Data ist insofern eine Verlängerung des menschlichen Gehirns. Die Fundierung durch Daten gibt den Zusammenhängen mehr Gewicht. George Soros, der vor einigen Jahrzehnten mal legal mit Leerverkäufen die Bank von England knackte, ließ nach eigenen Angaben nach die Milliarden dann los, wenn es ihn rechts im Bauch.
zwickte. Sein Gehirn wertete demnach unbewußt die vorhandenen Daten aus und signalisierte die Entscheidung.

Ziele auf deine Kunden - Hochdruckverkauf
Ziele auf deine Kunden – Hochdruckverkauf

Big Data automatisiert – und macht genauso Fehler wie Menschen, die etwas abschätzen. Berüchtigt und für jeden sichtbar sind die Retargeting-Kampagnen in der Online-Werbung, bei denen aus vergangenen Käufen die Wahrscheinlichkeit zukünftiger Käufe errechnet werden soll. Die Vorschläge sorgen oft für Heiterkeit. Der Entwickler und Daten-Analyst kann natürlich unplausible Zusammenhänge verwerfen.

Lesenswert zur Thematik ist folgender Artikel, welcher die Bedeutung der Big-Data(nalyse) realistisch sieht. Für die Versprechen der Hersteller siehe: Hier klicken für computerwoche.ch