Big Data ist erst mal nur eine
Sammlung von dummen Rohdaten und bezeichnet
Datenmengen, die mit herkömmlichen Methoden der
Datenverarbeitung nicht mehr zu verarbeiten sind. Diese
Datenmengen wachsen aufgrund der technischen
Entwicklung und der des Internets, da es immer leichter
wird, große Datenmengen zu sammeln, zu speichern und zu
analysieren.
Big Data ist quasi ein Sammelbegriff für digitale
Massendaten, die in technischer Hinsicht vollkommen
neue Möglichkeiten eröffnen.
Der Mehrwert von Big Data entsteht allerdings erst
dann, wenn diese Rohdaten (
Data
Lake) durch Heuristiken bzw.
Mustererkennung (
Data
Mining) veredelt werden. Dadurch kommt man
zu neuartigem Erkenntnisgewinn (
Smart
Data).
Die Definition von Big Data beinhaltet folgende 5
Dimensionen:
1️⃣ volume (Umfang der
Datenmenge)
2️⃣ velocity (Geschwindigkeit,
mit der die Datenmengen unterwegs sind)
3️⃣ variety (Varianz bzw.
Vielfalt der Daten)
4️⃣ value (unternehmerischer
Mehrwert durch die Daten)
5️⃣ validity (Richtigkeit der
Daten)