Seminar Big Data Mining

S2, Modulbereich Praxis, 2 SWS (4 ECTS)


Data Mining

Das Ziel von Data Mining ist die Analyse von großen Datenmengen mittels verschiedener, oft statistisch geprägter Verfahren. Als Resultat des Data Mining entsteht ein "Modell" der Daten welches beispielsweise die Form einer Zusammenfassung oder einer Datenselektion annehmen kann. Prominente Beispiel für Data Mining Techniken sind Googles Pagerank Verfahren zur Beurteilung der Relevanz von Webseiten für ein gegebenes Suchthema und Amazons Artikelvorschlagssystem, das auf Basis von angesehenen Artikeln weitere relevante Artikel empfehlen kann. Im Kontext von großen Datenmengen, wie sie in unserer modernen Welt zunehmend verfügbar sind (Stichwort "Big Data"), spielt Data Mining heute in vielen Anwendungen der Informatik eine zentrale Rolle. Das Seminar beschäftigt sich mit dem Mining großer Datenmengen und basiert auf dem Buch

Organisation

Das Seminar basiert auf dem Buch Mining of Massive Datasets (von Jure Leskovec, Anand Rajaraman and Jeffrey D. Ullman, erschienen bei Cambridge University Press), dass auch online unter http://www.mmds.org/ verfügbar ist.

Die Teilnehmer wählen nach der Vorbesprechung ein Buchkapitel, das sie in einer 2er Gruppe bearbeiten. Das Kapitel soll von den bearbeitenden Teilnehmern zunächst gelesen und verstanden werden sollen, wobei ihnen ein Betreuer zur Seite steht. Jede Gruppe fertigt eine ca. 15-seitige, lesbare Ausarbeitung an, deren Form den Standards wissenschaftlichen Arbeitens genügt. Am Ende des Semesters findet ein Blockseminar statt, in dem jede Gruppe ihr Thema in einem Vortrag den anderen Teilnehmern in verständlicher Weise darstellt. Die Zeitplanung und das Vereinbaren von Terminen mit dem Betreuer gehört zu den Aufgaben der Teilnehmer.

Ein Teil der Betreuung wird auf englisch stattfinden.


Ablaufplan Blockseminar

Wird später bekannt gegeben.

Terminplan

Der folgende Plan soll als Orientierung dienen.

bis 09.05. Literatur lesen, verstehen und diskutieren, Unklarheiten mit dem Betreuer klären
spätestens 10.05. Beginnen, an der Hausarbeit zu schreiben
25.05. Gemeinsames Treffen aller Seminarteilnehmer 12-14 Uhr in Cartesium 0.01
17.06. Abgabe der ersten Version der Hausarbeit
24.06. Rückgabe der korrigierten Hausarbeit durch den Betreuer
01.07. Abgabe der endgültigen Hausarbeit
letzte Woche des Semesters Blockseminar







AG Theorie der künstlichen Intelligenz