Veröffentlicht am

Big Data ist DataMining 2.0

Big DataBig Data scheint das Schlagwort des Jahres 2013 zu werden.

Alles redet über den Begriff, aber so ganz klar ist die Definition noch gar nicht. Was steckt hinter dem Begriff, wohin wird es gehen?

Viele Fragen stehen im Raum, die meisten Antworten wird die Zeit bringen.


Nähern wir uns dem Thema Big Data doch ein wenig an.

Big Data ist eigentlich die konsequente Fortführung EDV-gestützter Auswertungen für betriebswirtschaftliche Zwecke. Der Begriff „Business Intelligence“ ist der klassische Begriff, wenn es um diese Auswertungen im direkten innerbetrieblichen Umfeld geht. Hier wird schon seit langem das verfügbare Zahlenmaterial umgegraben und visualisiert, um unternehmerische Entscheidungen zu treffen.

Immer komplexere Simulationen durch eigens erstellte Datenbanksysteme ermöglichen es über „Was-wäre-wenn“-Spiele zu brauchbaren Vorhersagen zu kommen. Hierzu werden die Rohdaten des Betriebs über Schnittstellen so umgeformt, dass sie ein „Data Warehouse“ bilden. In diesem „Datenkaufhaus“ kann man dann in Ruhe herumstöbern.

Big Data geht noch einen Schritt weiter.

Im klassischen „Data Warehouse“ weiß man, was für Basiszahlen zur Verfügung stehen. Stückzahlen, Produktnummern, Vertriebsgebiete. Alles ist im Grunde vordefiniert und muss nur angepasst und in der richtigen Art und Weise abgefragt werden.

Bei „Big Data“ gibt es da mehrere Probleme. Einerseits handelt es sich um riesige Datenmengen, die gespeichert und verwaltet werden wollen.
Andererseits sind die Daten aber völlig unstrukturiert. Das ist nämlich der Trick dabei. Im Grunde werden nämlich sämtliche anfallende Rohdaten gesammelt und erst im Bedarfsfall aufbereitet.

Vorteil dabei: Man hat immer das Rohmaterial zur Verfügung, wenn sich Methoden ändern. Dieser Vorteil ist nicht zu unterschätzen. Denn je nach Aufgabenstellung muss man verschieden an die Daten herangehen. Und die Herangehensweisen können sich im Laufe der Zeit verändern. Und da wäre es doch schade, das Rohmaterial nicht mehr zu haben.

Wie sehen diese Daten eigentlich aus?

Das ist genau die Krux. Keiner weiß das genau. Oder doch. Wir wissen das alle. Es sind all die kleinen Einzeldaten, die wie im Wasserkreislauf vom Tropfen auf der Wiese, über Bäche und Flüsse zum Ozean werden. Es sind die kleinen Standort- oder Verbindungsdaten des Handy. Oder die Trackingdaten unseres Flottenmanagement im Fahrzeug. Undere Einkäufe. Unsere Suchabfragen bei Suchmaschinen. Alles fließt in den Pool. Sogar Sätze, die wir in sozialen Netzwerken schreiben. Auch diese Texte werden semantisch analysiert und bewertet.

Big Data ist faszinierend und universell.

„Big Data“ macht Angst. Denn wir werden ausgewertet. Aber werden wir das nicht schon jetzt? All diese Daten sind doch heute schon da und werden genutzt. Haben Sie sich noch nie gefragt, warum Ihnen nach einer thematischen Recherche per Google auf einmal über Amazon passende Buchtitel vorgeschlagen wurden?

Oder warum sich die Vorschlagslisten beim Buchkauf immer so seltsam ändern und offenbar genau zu ihren aktuellen Vorlieben passen? Hier passiert schon lange, was bald im großen Stil auf uns zukommt.

Das ist Big Data.

Veröffentlicht am

IPv6 – Ein erstes Fazit

Seit zehn Monaten sprechen meine Geräte IPv6.

Warum ist das so erwähnenswert? Die Erklärung ist einfach: Nachdem die letzten IPv4 Adressen vergeben wurden, wird es langsam eng im IPv4-Adressraum.

Natürlich ist jetzt nicht schlagartig Schluss mir neuen IP-Adressen, denn durch Wechsel bei den Providern und Hostinganbietern werden immer auch wieder einmal Adressen frei.

Obwohl also kein akuter Zeitdruck herrscht, habe ich mich entschlossen den nächsten Schritt zu vollziehen und praktische Erfahrungen zu sammeln. Nach den erfolgreichen Tests am IPv6 Tag im Juni 2011 besteht nur noch geringe Skepsis, dass ein zweigleisiger Betrieb funktionieren wird.

Wie sieht jetzt das Fazit nach rund zehn Monaten Dualstack-Betrieb aus?

Ganz einfach. Im Grunde hat niemand von der Umstellung etwas bemerkt. Für den Empfänger/Kunden/Besucher ändert sich in der Regel auch nichts. Die Implementierung des neuen IP-Protokolls ist so ausgelegt, dass beide Verfahren nebeneinander funktionieren. So sind alle unsere Maschinen auch weiterhin über die altbewährten IPv4 Adressen erreichbar.

Kurz zur Erinnerung ein paar Grundlagen:

Was ist IPv6 eigentlich?

IPv6 ist eigentlich nichts anderes als was wir mit den neuen Postleitzahlen gemacht haben: Die Anzahl möglicher Adressen wurde ausgeweitet. Unter IPv4 ist die Länge einer IP-Adresse begrenzt auf 32 Bit. Hier stehen somit insgesamt 2^32 Adressen (ca. 4.2 Milliarden Adressen) zur Verfügung. Das klingt eigentlich viel, nur sind diese Adressen nicht einzeln vergebbar, sondern werden in der Regel in Blöcken vergeben. Und diese Blöcke sind derzeit erschöpft.

Was liegt also näher, als die Anzahl der Adressen zu vergrößern? Es wurde also beschlossen, die Länge der Adressen auf 128 Bit auszuweiten. Das bedeutet dann 2^128 Möglichkeiten. Und diese Anzahl dürfte erst einmal reichen.

Wie sieht man etwas von IPv6?

Eigentlich gar nicht. Weder bei den Mailadressen, noch beim Aufruf von Webseiten ändert sich für den Nutzer etwas. Nur die Administratoren im Netzwerk haben ein wenig zu tun.

Neue Routen müssen gesetzt werden, Firewallregeln angepasst werden und Router umkonfiguriert werden.

Aus den alten Adressen der Form „178.63.52.37“ wird jetzt „2a01:4f8:120:7386::2“. Beides wird aber im Webbrowser immer noch als „www.vico.de“ angesprochen. Im Hintergrund laufen die eigentlichen Abfragen vor dem Aufruf der Seite automatisch ab. Alle Browser und Hilfsprogramme sind mittlerweile so ausgelegt, dass sie je nach Konfiguration zunächst versuchen, das Ziel per IPv6 anzusprechen. Wenn das nicht klappt, wird einfach auf das altbewährte IPv4 zurück geschaltet.

Und wie sieht die Empfehlung aus?

Erfahrungen sammeln schadet nicht. Also einfach in bestimmten Bereichen den Schritt wagen und auf den Dualbetrieb wechseln. Also zum Beispiel externe Server und Firewalls umstellen und Erfahrungen sammeln.

Danach dann IPv6 in einzelnen (unkritischen!) Bereichen des eigenen Netzwerks in Betrieb nehmen und sehen, ob alles wie geplant funktioniert. Also vielleicht erst einmal nur einen Proxyserver mit einem Tunnel an den IPv6 Backbone anbinden. Und wieder Erfahrungen sammeln. Denn hier wird es spannend: Bislang vorhandene Zugriffsbeschränkungen auf Basis der IP-Adresse greifen möglicherweise nicht. Also aufgepasst, das nicht plötzlich mehr erlaubt ist, als geplant.

Spätestens wenn Endgeräte im internen Netzwerk mit IPv6 angebunden werden, muss man sich darüber im Klaren sein, dass jetzt das interne Netz nicht mehr durch ein bislang vorhandenes NAT abgetrennt wird. Das Internet reicht also möglicherweise bis auf den lokalen Schreibtisch!

Um einen gangbaren Weg in Ihrem Unternehmen aufzuzeigen und Fehler zu vermeiden, stehen wir gerne zur Verfügung. Sprechen Sie uns an.