Das Herausfiltern spezifischer Informationen aus einer
            großen Datenmenge wird als
            „Data-Mining" oder
            Mustererkennung bezeichnet.
            Dazu werden Massendaten mit Datenanalyse- und
            Entdeckungsalgorithmen durchsucht mit dem Ziel, neue
            Muster, Querverbindungen und Trends zu erkennen.
            Findet man solche Muster, dann werden die Daten zu
            Smart Data die neuen Erkenntnisgewinn bringen. (💡 Siehe
            auch die Erklärung zum Begriff: Smart
            Data)
            Um Fehlinterpretationen weitestgehend zu vermeiden,
            müssen die Entdeckungsalgorithmen Ausreißer und
            manipulierte Daten erkennen und aus der Bewertung
            entfernen.
        
Falls es nicht gelingt durch Data-Mining neue Erkenntnisse zu gewinnen, dann ist entweder die dazu verwendete KI (künstliche Intelligenz) noch nicht ausreichend oder der DataLake ist bereits zu einem DataSwamp versumpft.

    Merke:
    Data-Mining macht Big Data zu Smart Data

