Der Begriff Data Swamp (dt. „Datensumpf“) steht für einen „versumpften“ Data Lake.
Sämtliche Data
Mining Ansätze laufen ins Leere, weil aufgrund
verlorengegangener bzw. nicht gespeicherter
Informationen oder fehlender Metadaten aus den
gespeicherten Rohdaten keinerlei Mehrwert generierbar
ist.
Mit geeigneten Data-Governance-Maßnahmen
muss das jede Firma für sich verhindern, denn
blindwütiges Sammeln von Daten ohne Plan kann schnell
zu einem Data Swamp führen. Um
ein Versumpfen zu verhindern, sollten zudem veraltete
oder nicht mehr benötigte Daten automatisch im
Data Lake erkannt und gelöscht werden.