Big Data ist DataMining 2.0

Big DataBig Data scheint das Schlagwort des Jahres 2013 zu werden.

Alles redet über den Begriff, aber so ganz klar ist die Definition noch gar nicht. Was steckt hinter dem Begriff, wohin wird es gehen?

Viele Fragen stehen im Raum, die meisten Antworten wird die Zeit bringen.


Nähern wir uns dem Thema Big Data doch ein wenig an.

Big Data ist eigentlich die konsequente Fortführung EDV-gestützter Auswertungen für betriebswirtschaftliche Zwecke. Der Begriff „Business Intelligence“ ist der klassische Begriff, wenn es um diese Auswertungen im direkten innerbetrieblichen Umfeld geht. Hier wird schon seit langem das verfügbare Zahlenmaterial umgegraben und visualisiert, um unternehmerische Entscheidungen zu treffen.

Immer komplexere Simulationen durch eigens erstellte Datenbanksysteme ermöglichen es über „Was-wäre-wenn“-Spiele zu brauchbaren Vorhersagen zu kommen. Hierzu werden die Rohdaten des Betriebs über Schnittstellen so umgeformt, dass sie ein „Data Warehouse“ bilden. In diesem „Datenkaufhaus“ kann man dann in Ruhe herumstöbern.

Big Data geht noch einen Schritt weiter.

Im klassischen „Data Warehouse“ weiß man, was für Basiszahlen zur Verfügung stehen. Stückzahlen, Produktnummern, Vertriebsgebiete. Alles ist im Grunde vordefiniert und muss nur angepasst und in der richtigen Art und Weise abgefragt werden.

Bei „Big Data“ gibt es da mehrere Probleme. Einerseits handelt es sich um riesige Datenmengen, die gespeichert und verwaltet werden wollen.
Andererseits sind die Daten aber völlig unstrukturiert. Das ist nämlich der Trick dabei. Im Grunde werden nämlich sämtliche anfallende Rohdaten gesammelt und erst im Bedarfsfall aufbereitet.

Vorteil dabei: Man hat immer das Rohmaterial zur Verfügung, wenn sich Methoden ändern. Dieser Vorteil ist nicht zu unterschätzen. Denn je nach Aufgabenstellung muss man verschieden an die Daten herangehen. Und die Herangehensweisen können sich im Laufe der Zeit verändern. Und da wäre es doch schade, das Rohmaterial nicht mehr zu haben.

Wie sehen diese Daten eigentlich aus?

Das ist genau die Krux. Keiner weiß das genau. Oder doch. Wir wissen das alle. Es sind all die kleinen Einzeldaten, die wie im Wasserkreislauf vom Tropfen auf der Wiese, über Bäche und Flüsse zum Ozean werden. Es sind die kleinen Standort- oder Verbindungsdaten des Handy. Oder die Trackingdaten unseres Flottenmanagement im Fahrzeug. Undere Einkäufe. Unsere Suchabfragen bei Suchmaschinen. Alles fließt in den Pool. Sogar Sätze, die wir in sozialen Netzwerken schreiben. Auch diese Texte werden semantisch analysiert und bewertet.

Big Data ist faszinierend und universell.

„Big Data“ macht Angst. Denn wir werden ausgewertet. Aber werden wir das nicht schon jetzt? All diese Daten sind doch heute schon da und werden genutzt. Haben Sie sich noch nie gefragt, warum Ihnen nach einer thematischen Recherche per Google auf einmal über Amazon passende Buchtitel vorgeschlagen wurden?

Oder warum sich die Vorschlagslisten beim Buchkauf immer so seltsam ändern und offenbar genau zu ihren aktuellen Vorlieben passen? Hier passiert schon lange, was bald im großen Stil auf uns zukommt.

Das ist Big Data.