Big Data zu Smart Data

„We are drowning in data but starving for knowledge.”
John, Naisbett

Der Begriff Big Data bezeichnet riesige Datenströme, welche in jedem Unternehmen entstehen. Diese große Menge an strukturierten und unstrukturierten Daten sind bisher zumeist ungenutzt, können aber analysiert werden, sodass dem Unternehmen eine Vielfalt neuer Erkenntnisse zur Verfügung stehen.  Jedoch darf man die anfallende Datenmenge nicht mit Informationen gleichsetzen. Erst durch Umformung, Strukturierung und Interpretation von Daten entstehen verwertbare Erkenntnisse und Informationen, welche unter dem Begriff Smart Data zusammengefasst werden. Smart Data sind also Daten, die für einen späteren, potenziellen Nutzen aufbereitet, klassifiziert und entsprechend lesbar gemacht werden. 

In welchem Zusammenhang stehen Big Data Analytics und Data Mining?

Spricht man von Big Data Analytics werden häufig Begriffe wie ‘Data Mining’ ‘Predictive Maintenance’ oder ‘Machine Learning’ verwendet. Doch in welchem Zusammenhang stehen diese? Die nachfolgende Erklärung bietet Ihnen einen groben Einblick, nähere Informationen finden sie auf den nächsten Seiten.  

1. Projektdefinition: Projektergebnisse und die zu erbringenden Leistungen definieren, den Umfang des Aufwands, die Geschäftsziele und Datensätze identifizieren, die verwendet werden sollen.

2.  Datensammlung: Nach der Zielsetzung werden vorhandene Unternehmensdaten sowie externe Daten in einem Data Warehouse gesammelt.

3. Datenaufbereitung: Durch Descriptive Analytics werden die historischen Daten grob zusammengefasst um sich einen ersten Überblick zu verschaffen. Dies stellt den ersten Schritt der Analyse dar.

4. Datenanalyse: Je nach Zielsetzung werden im zweiten Schritt verschiedenste Methoden angewendet. Im Marketing ist es überwiegend die Predictive Analytics, also das Erkennen und Vorhersagen von Trends und Verhaltensmustern.

4.1 Techniken: Durch Techniken wie dem Data Mining, also dem Erkennen von Strukturen und Mustern in den Daten, ist die Basis für jede Datenanalyse. Ein paar Beispiele für häufig genutzte Techniken: Neuronale Netzwerke, Regressionsanalyse oder Decision Trees. 

5. Handlungsempfehlung: Im dritten Schritt, der Precriptive Analytics,  werden die zuvor gesammelten Informationen übersichtlich zusammengestellt, dargestellt und gegebenenfalls Handlungsempfehlungen ausgesprochen oder Machine Learning Algorithmen integriert.

Gewusst wie, kann aus einer Vielfalt an Daten Wertschöpfung gelingen. Es lohnt sich also, an der Weiterentwicklung der Big Data Analytics und Smart Data Technologien zu arbeiten. Zumal man gewiss sein darf, dass die Menge produzierter, gespeicherter und abrufbarer Daten täglich weiter wächst.