Veröffentlicht am

Big Data – Think Big But Start Small

Can you see the light?Macht es klassisch. Fangt klein an.

Alles redet über Big Data. Aber was ist das eigentlich?

Überall geistert dieses Gespenst herum. Big Data und was man alles damit machen kann. Aber muss man wirklich alles damit machen? Ist nicht auch hier der Ansatz besser, dass man besser etwas zum eigenen Unternehmen passendes sucht?


Seit einiger Zeit werdem immer wieder neugierige Fragen zum Thema Big Data gestellt.

Bislang stellte sich im Vorgespräch immer heraus, dass der Kunde eigentlich gar nicht in der Lage ist, Fragen zu formulieren, die Big Data beantworten kann.

Und das ist ein Problem, wenn wir über Big Data reden. Ohne den Kontext der Frage und den Blickwinkel des Fragestellers kann die Antwort einer solchen Datenanalyse niemals hinreichend sicher sein.

Natürlich sind sind bei den Fragen immer ein paar tiefer gehende Zusammenhänge bei, aber in den meisten Fällen geht es dann doch um eher klassische Dinge. Das Marketing weiß oft gar nicht, wie „Das Netz“ funktioniert und sieht die Zusammenhänge verschiedener Daten nicht. Manche wissen nicht einmal, welche sozialen Netzwerke mit anderen in einem Konzern stecken und wie sich deren Daten aggregieren.

Im Kern kristallisiert sich bei unseren Kunden in der Größenordnung von 1-150 Arbeitsplätzen eigentlich immer heraus, dass man Antworten auf eher alltägliche Fragen sucht:

  • Wer sieht sich meine Webseiten an?
  • Wie bekomme ich mit, ob meine Webseiten für die Nutzer gut anzuzeigen sind?
  • Wie erreiche im Internet mehr Aufmerksamkeit?
  • Brauche ich Accounts in verschiedenen Sozialen Netzen?
  • Wie werte ich aus, was in diesen Netzen passiert?
    • Werden meine Mitteilungen gelesen?
    • Wird darauf reagiert?
    • Wie wird reagiert?
  • Wie kann ich möglichst automatisch Aufmerksamkeit steigern im Netz?

Das alles ist kein Ansatz für Big Data Analysen. Das bewegt sich im Bereich „Small Data“.

„Small Data“ fasst es als Begriff eigentlich ganz gut zusammen. Die meisten unserer Kunden brauchen keine allwissende Müllhalde, der man undifferenzierte Fragen stellt und sich dann über die Antwort wundert. Sie suchen Antworten auf genau diese kleinen Fragen.

Eigentlich reden wir gar nicht über echte Datenanalysen. Die meisten unserer Kunden haben auch keine verlässliche Datenbasis, die zu einer Analyse herangezogen werden kann. Oft ist es schon ein Problem, aus einer vorhandenen Warenwirtschaft die Daten so zu extrahieren, dass sich aus einer Preisveränderung zu einem bestimmten Zeitpunkt eine nachlaufende Veränderung der Abverkaufszahlen ablesen lässt. Und so etwas wäre die Basis einer Analyse, wenn dann noch die zum Zeitpunkt X bekannten Kennzahlen aus sozialen Netzwerken bekannt wären. Nur mit einem solchen Zusammenhang lassen sich aus der Verbreitung einer Information in sozialen Netzwerken und dem Abverkauf dann auch Zahlen generieren, die den Erfolg der Aktion messbar machen.

Wir reden noch lange über klassisches Monitoring.

Für die meisten Fragesteller geht es um klassisches Website- und Social Media Monitoring. Klick-Konversionen, Affiliate-Werbung AdWords, Absprungraten oder Reichweitengewinne durch Kampagnen gehen für die Unternehmen in unserem Kundensegment am Ziel vorbei. Die meisten sind noch lange nicht so weit.

Das ist natürlich keine allgemein gültige Einschätzung. Es gibt Firmen, die genau das schon machen. Aber es sind noch lange nicht so viele, das Big Data zum Renner wird.

Deutschland ist zu klein für Big Data

Neulich habe ich so eine Zahl aufgeschnappt, die ich bislang leider nicht verifizieren konnte. Irgendwo wurde behauptet, dass rund 93% aller Unternehmen in Deutschland unter 12 Mitarbeitern haben. Wenn diese Zahl wirklich stimmt, kann man davon ausgehen, dass Big Data nur für eine ganz geringe Zahl von Unternehmen Sinn macht.

Denn wer von den 12 Mitarbeitern soll sich denn die Fragen ausdenken, die beantwortet werden sollen? Wer davon soll all die Datenpools ausfindig machen und sie so zusammenstellen, dass Daten daraus abgeleitet werden können?

Selbst das interne Controlling arbeitet in solchen Größenordnungen ja eher noch Excel-basiert. Kaum jemand leistet sich eine Datenbank basierte Auswertung, die auf Knopfdruck alle Unternehmenskennziffern ausspuckt.

Und ein solches System soll nun in die Cloud wandern und Big Data auswerten?

Also bleiben wir doch erst einmal am Boden und nutzen „Small Data“ bevor wir mit Big Data loslegen.

 

Veröffentlicht am

Big Data ist DataMining 2.0

Big DataBig Data scheint das Schlagwort des Jahres 2013 zu werden.

Alles redet über den Begriff, aber so ganz klar ist die Definition noch gar nicht. Was steckt hinter dem Begriff, wohin wird es gehen?

Viele Fragen stehen im Raum, die meisten Antworten wird die Zeit bringen.


Nähern wir uns dem Thema Big Data doch ein wenig an.

Big Data ist eigentlich die konsequente Fortführung EDV-gestützter Auswertungen für betriebswirtschaftliche Zwecke. Der Begriff „Business Intelligence“ ist der klassische Begriff, wenn es um diese Auswertungen im direkten innerbetrieblichen Umfeld geht. Hier wird schon seit langem das verfügbare Zahlenmaterial umgegraben und visualisiert, um unternehmerische Entscheidungen zu treffen.

Immer komplexere Simulationen durch eigens erstellte Datenbanksysteme ermöglichen es über „Was-wäre-wenn“-Spiele zu brauchbaren Vorhersagen zu kommen. Hierzu werden die Rohdaten des Betriebs über Schnittstellen so umgeformt, dass sie ein „Data Warehouse“ bilden. In diesem „Datenkaufhaus“ kann man dann in Ruhe herumstöbern.

Big Data geht noch einen Schritt weiter.

Im klassischen „Data Warehouse“ weiß man, was für Basiszahlen zur Verfügung stehen. Stückzahlen, Produktnummern, Vertriebsgebiete. Alles ist im Grunde vordefiniert und muss nur angepasst und in der richtigen Art und Weise abgefragt werden.

Bei „Big Data“ gibt es da mehrere Probleme. Einerseits handelt es sich um riesige Datenmengen, die gespeichert und verwaltet werden wollen.
Andererseits sind die Daten aber völlig unstrukturiert. Das ist nämlich der Trick dabei. Im Grunde werden nämlich sämtliche anfallende Rohdaten gesammelt und erst im Bedarfsfall aufbereitet.

Vorteil dabei: Man hat immer das Rohmaterial zur Verfügung, wenn sich Methoden ändern. Dieser Vorteil ist nicht zu unterschätzen. Denn je nach Aufgabenstellung muss man verschieden an die Daten herangehen. Und die Herangehensweisen können sich im Laufe der Zeit verändern. Und da wäre es doch schade, das Rohmaterial nicht mehr zu haben.

Wie sehen diese Daten eigentlich aus?

Das ist genau die Krux. Keiner weiß das genau. Oder doch. Wir wissen das alle. Es sind all die kleinen Einzeldaten, die wie im Wasserkreislauf vom Tropfen auf der Wiese, über Bäche und Flüsse zum Ozean werden. Es sind die kleinen Standort- oder Verbindungsdaten des Handy. Oder die Trackingdaten unseres Flottenmanagement im Fahrzeug. Undere Einkäufe. Unsere Suchabfragen bei Suchmaschinen. Alles fließt in den Pool. Sogar Sätze, die wir in sozialen Netzwerken schreiben. Auch diese Texte werden semantisch analysiert und bewertet.

Big Data ist faszinierend und universell.

„Big Data“ macht Angst. Denn wir werden ausgewertet. Aber werden wir das nicht schon jetzt? All diese Daten sind doch heute schon da und werden genutzt. Haben Sie sich noch nie gefragt, warum Ihnen nach einer thematischen Recherche per Google auf einmal über Amazon passende Buchtitel vorgeschlagen wurden?

Oder warum sich die Vorschlagslisten beim Buchkauf immer so seltsam ändern und offenbar genau zu ihren aktuellen Vorlieben passen? Hier passiert schon lange, was bald im großen Stil auf uns zukommt.

Das ist Big Data.

Veröffentlicht am

Ein Handy auf Reisen

Die Vorratsdatenspeicherung und was allein mit den beim Handynetzbetreiber gespeicherten Daten möglich ist:

http://www.zeit.de/datenschutz/malte-spitz-vorratsdaten

Das muss man eigentlich nicht weiter kommentieren. Was man daraus so alles in Kombination mit Daten aus sozialen Netzwerken machen kann mag jeder einmal selber überlegen.

Und das die Daten ohne Rechtsgrundlage genutzt werden hat Dresden klar bewiesen. Ein Beitrag des Magazins Fakt:

http://www.youtube.com/watch?v=DXIBOjMg6l0

Im Grunde kann aus diesem Beispiel nur eines ableiten: Öfter mal das Handy ausmachen. Oder in Keksdosen legen wie in so manchem Unternehmen, Evonik wird schon wissen warum man das macht. Quelle: Spiegel Online

 

Veröffentlicht am

Google überarbeitet Suche

Google SucheOffenbar richtet Google seine Suchmaschine wieder ein wenig anders aus.

Laut Wall Street Journal beabsichtigt Google nicht mehr nur Suchergebnisse zu präsentieren, sondern direkt aus den vorhandenen Suchergebnissen konkrete Inhalte zu generieren.

Google wird versuchen, durch semantische Analysen von gefundenen Webseiten, Antworten zu liefern. Antreibende Kraft ist offenbar das Problem hinter „we cross our fingers and hope there’s a Web page out there with the answer“.

Man will dem Suchenden also diese Unsicherheit abnehmen und Ergebnisse liefern. Eigentlich ein Schritt in Richtung einer dynamischen Enzyklopädie.

Ich finde das Vorhaben zweischneidig. Auf der einen Seite bringt es schneller Zugang zur gesuchen Information, das macht es in vielen Fällen schneller und bequemer. Die Nutzer werden vermutlich diese schnelle Aufbereitung mögen.

Als größten Nachteil sehe ich, dass es zu einer „virtuellen Wahrheit“ führt. Quellenrecherche wird noch weniger in der breiten Masse. Man wird sich auf die von Google semantisch ermittelte Wahrheit verlassen und diese als gegeben hinnehmen. Möglicherweise wird es so dazu kommen, dass Behauptungen als Fakten wahrgenommen werden. Und was passiert bei Antworten aus anderen Sprachen? Wird dann automatisch Googles Übersetzer einspringen?
Bei Wikipedia wird das durch reale Gehirne überprüft und kenntlich gemacht. Wie wird das bei Google sein?

Nebenbei wird es für die Betreiber von Websites sehr nachteilig sein. Die eigene Website wird nur noch als Ausriss vom Zielpublikum wahrgenommen. Es bedeutet weniger Traffic auf der Seite und damit auch weniger Wahrnehmung für den Anbieter insgesamt.