BIG DATA FÜR ANFÄNGER | PROXIGY
742
post-template-default,single,single-post,postid-742,single-format-standard,ajax_fade,page_not_loaded,,qode-title-hidden,qode_grid_1300,side_area_uncovered_from_content,qode-content-sidebar-responsive,transparent_content,wpb-js-composer js-comp-ver-4.12,vc_responsive

BIG DATA FÜR ANFÄNGER

Big Data ist zu Recht einer der meist-gehyptesten Begriffe der letzten Jahre. Viele wollen, wenige wissen und noch weniger verstehen, was es mit dem viel benutzen Begriff tatsächlich auf sich hat. Mit dem Hintergrund, dass viele Agenturen und Unternehmen den Begriff vielleicht ein wenig besser kennenlernen wollen, machen wir das, was wir sehr gut können: Wir erklären als dass es jeder versteht.

Ein Wort aus vielen Wörtern

Big Data steht nicht, wie viel glauben, dafür, unüberblickbar viele Daten zu interpretieren – das ist die Analyse der Resultate eines Data Mining Prozesses, also der Extraktion der schlagenden Daten aus einem Konvolut vieler, vieler Datenbanken. Data Mining ist also der Weg, um Big Data auf das Wesentliche zu komprimieren. Insofern beginnt alles mit einer Ausgangslage die unbefriedigend ist und der daraus folgenden Neugierde, Neues herauszufinden.

Step 1: Ausgangslage

Man nehme an, wir haben viele Kilo Jelly Beans in den Farben rot, gelb, grün und blau. Es sind unüberblickbar viele Jelly Beans, die auf unterschiedliche Weisen verpackt wurden. Einerseits haben wir Säckchen mit 20 Stück, dann große Boxen zu einigen Kilos und vereinzelt haben wir auch lose herumliegende Jelly Beans gefunden. Diese Statusaufnahme ist das Fundament auf dem wir arbeiten.

Step 2: Neugierde

Ohne die richtigen Fragen im Vorfeld zu stellen, können große Mengen nicht verarbeitet werden. Deshalb stellen wir uns bereits im Vorfeld die richtigen Fragen, um zu wissen, welche Aufgabenbereiche sich daraus ergeben. Uns interessiert beispielsweise wie viele Jelly Beans wir von jeder Farbe haben. Also müssen wir diese Frage in Arbeitsschritte ausformulieren, als dass unsere treuen 4 Mitarbeiter wissen, was genau sie zu tun haben. Währenddessen wollen wir uns einen Kaffee machen und den Mitarbeitern über die Schulter schauen als dass wir gegebenenfalls eingreifen können, sollten wir einen Schritt nicht genügend ausformuliert haben und Fehler passieren.

Step 3: Arbeitsschritte

Die Grundsätzliche Frage, wie viele Stück Jelly Beans pro Farbe wir haben, teilen wir folglich in einfache Handgriffe auf:

Packe alle Jelly Beans aus

Lege alle Jelly Beans zusammen in eine (womöglich sehr große) Kiste.

Wiege diese Kiste.

Teile dieses Gewicht durch 4 als dass 4 Mitarbeiter parallel etwas zu tun haben.

Ordne die Teilstapel in Farben und zähle die Stück Jelly Beans pro Farbe währenddessen.

Führe die Jellybeans einer Farbe mit derselben Farbe der anderen Mitarbeiter zusammen.

Zähle die Jelly Beans einer Farbe.

Checke, ob die Summe der Jelly Beans pro Farbe mit der vorherigen Zählung zusammenpasst.

Gib das Ergebnis an uns weiter.

Step 4: Lass arbeiten!

Die vier Mitarbeiter machen sich also an die Arbeit und geben mir meine gecheckte Antwort zurück. Wir sind zufrieden und loben die Mitarbeiter.

Step 5: Wie geht es weiter?

Die Antwort die wir bekommen haben ist zufriedenstellend aber was machen wir mit der Information? Hier treten wir in die Welt der Datenanalyse ein und diese kann – je nach Komplexität der Fragestellung – leichter oder schwieriger zu bewältigen sein.

Heute haben wir gelernt…

…, dass Big Data salopp gesprochen für einen unüberwältigbaren Berg von Daten steht, der mit Data Mining Prozessen in manage-bare Größen aufgeteilt werden soll um Antworten auf Fragen zu finden, die wir uns stellen. Datenanalyse verknüpft mehrere Data Mining Ergebnisse um Verbindungen zu finden, die anfangs gar nicht möglich schienen.

Das bedeutet, dass Big Data Prozesse an mehreren Ecken verschiedene Herangehensweisen benötigen.

Es braucht einen neugierigen Kopf um Fragen zu stellen. Das kann jeder machen.

Man braucht Programmier- und Datenbanken-Kenntnisse um Daten aus verschiedenen Quellen zusammenzuführen.

Spezifisches Data Mining Programm know how wird für die Implementierung der Arbeitsschritte an die Programm-Schnittstellen benötigt.

Statistik Kenntnisse sind gut, wenn man Korrelationen zwischen den Ergebnissen der Datenanalysen finden will.

Aber am Wichtigsten ist es, einen klugen Kopf zu haben, der die richtigen Schlüsse daraus zieht.

Wir haben gelernt, dass Big Data vielschichtig ist und viele verschiedene Skills benötigt um stichhaltig zu sein. Reicht ein Studienabschluss in Psychologie dazu? Möglich. Wirtschafts-Informatik? Durchaus. Aber ein neugieriger und kluger Kopf wir in keinem Studium ausgebildet sondern mit der Möglichkeit zum Freien Denken genährt.

Wir hoffen, Sie wir konnten ein wenig Licht in die Sache bringen.

No Comments

Post A Comment

*