Das Herausfiltern spezifischer Informationen aus einer
großen Datenmenge wird als
„Data-Mining" oder
Mustererkennung bezeichnet.
Dazu werden Massendaten mit Datenanalyse- und
Entdeckungsalgorithmen durchsucht mit dem Ziel, neue
Muster, Querverbindungen und Trends zu erkennen.
Findet man solche Muster, dann werden die Daten zu
Smart Data die neuen Erkenntnisgewinn bringen. (💡 Siehe
auch die Erklärung zum Begriff: Smart
Data)
Um Fehlinterpretationen weitestgehend zu vermeiden,
müssen die Entdeckungsalgorithmen Ausreißer und
manipulierte Daten erkennen und aus der Bewertung
entfernen.
Falls es nicht gelingt durch Data-Mining neue Erkenntnisse zu gewinnen, dann ist entweder die dazu verwendete KI (künstliche Intelligenz) noch nicht ausreichend oder der DataLake ist bereits zu einem DataSwamp versumpft.
Merke:
Data-Mining macht Big Data zu Smart Data