Vorlesung Data Mining in Datenbanken

Alexander Hinneburg


Aktuelles


Inhalte

Angesichts stark wachsender Datenmengen werden automatische Analyseverfahren immer wichtiger. Beispielsweise generieren kommerzielle Geräte wie Scannerkassen oder wissenschaftliche Instrumente wie Erdbeobachtungssatelliten immer größere Mengen von immer komplexeren Daten. Diese Daten enthalten potentiell wichtiges Wissen. Eine manuelle Analyse all dieser Daten übersteigt jedoch bei weitem die menschlichen Kapazitäten. Diese Vorlesung gibt einen Überblick über das vergleichsweise junge Forschungsgebiet 'Knowledge Discovery in Databases (KDD)' - deutsch: 'Wissensentdeckung in Datenbanken'. Das Gebiet befindet sich an der Schnittstelle von Statistik, maschinellem Lernen, sowie Datenbanksystemen und behandelt Methoden zur (semi-)automatischen Extraktion von gültigem, neuem und potentiell nützlichem Wissen aus großen Datenbanken. Es werden verschiedene Verfahren zur Analyse von relationalen Daten als auch von Daten mit räumlichem Bezug dargestellt. Insbesondere: Klassifikation, Regression, Assozationsregeln, Clusteranalyse, Erkennen von Abweichungen/Ausreissern und Trenderkennung.

Die Vorlesung wird sich stark an die neue Auflage des Buches Data Mining: Practical Machine Learning Tools and Techniques (Second Edition) Ian H. Witten, Eibe Frank, Morgan Kaufmann, June 2005, 525 pages, ISBN 0-12-088407-0 anlehnen. In den Übungen wird die WEKA Data Mining Suite in Verbindung mit dem DBMS Oracle verwendet werden.

Um den Schein der Vorlesung zu erwerben, müssen 50% der Punkte in den Übungen erreicht werden und die Klausur am Ende der Vorlesung bestehen. Sie können als Gruppe bis max. 3 Personen abgeben. Wenn Sie sich über die Veranstaltung prüfen lassen wollen, wird der Stoff aus Vorlesung und Übung relevant sein, d.h. wenn Sie nur die Vorlesung können, haben Sie nur die Hälfte des Wissens. Wirtschaftinformatiker können 6 Leistungspunkte erwerben.


Termine, Übungen, Material