ISID: Data Science

Dozenten:
AHProf. Dr. Andreas Heuer
, Hannes Grunert
      Az.
0.1 - Begriffe: Information, Informationssystem, Informationsdienst   2
0.2 - Data Science   3
1.1 - Dimensionen: Strukturierung, Komplexität, Größe   4
1.2 - Dimensionen: Updates, Evolution, Heterogenität   5
2.1 - Einführung und Motivation     
2.2 - Strukturierte Daten: Relationenmodell   1
2.3 - Strukturierte Daten: Objektorientiertes Datenbankmodell   6
2.4 - Semistrukturierte Daten: XML-Datenbankmodell   2
2.5 - Semistrukturierte Daten: NoSQL / JSON   2
3.1 - Systeme für unstrukturierte Dokumente   4
3.2 - Text Information Retrieval   2
3.2.1 - Grundprinzipien, Ziele   5
3.2.2 - Deskribierung   5
3.2.3 - Zugriffsstrukturen   1
3.2.4 - Recherche   5
3.2.5 - Retrieval-Modelle und Ranking   11
3.2.6 - Suchmaschinen     
3.3 - Datenmodell: Graphen     
4 - Datenvorbereitung   1
4.1 - Grundbegriffe und Motivation   10
4.2 - Verteilung, Autonomie, Heterogenität, Transparenz     
4.3 - Heterogenitäten und Konflikte   6
4.4 - Schemamanagement   10
4.5 - Datenintegration   18
5.1 - Analytical Processing - Einführung   8
5.2 - Data Warehouse: Architekturen   4
5.3 - Multidimensionales Datenmodell   1
5.4 - MOLAP, ROLAP und Data Warehouse Entwurf   6
5.5.1 - MOLAP-Operationen   7
5.5.2 - MOLAP-Sprache MDX   3
5.5.3 - ROLAP-Sprache SQL ab SQL:1999 / SQL:2003   10
6 - Data Mining und Maschinelles Lernen   2
6.1 - Phasen des Data Mining   3
6.2 - Klassifikation von Verfahren und Problemen   6
6.3 - Assoziationsregeln   1
6.3.1 - Einleitung   8
6.3.2 - Grundbegriffe und Konzepte   8
6.3.3 - Arten von Assoziationsregeln   1
6.3.4 - A-priori-Algorithmus   5
6.3.5 - FP-growth-Algorithmus   2
6.3.6 - Weitere Arten von Assoziationsregeln     
6.4 - Clusterverfahren   10
6.5 - Maschinelles Lernen   3
6.5.1 - Überblick über ML-Verfahren   5
6.5.2 - Dimensionsreduktion: Hauptkomponentenanalyse   6
6.5.3 - Support Vector Machines     
6.5.4 - Hidden-Markov-Modelle   6
7.1 - Big Data und Big Data Analytics   1
7.2 - MapReduce   4
7.3 - Grundoperationen und Anwendungen   1
7.6 - Hidden-Markov-Modell mit parallelem SQL   3
8 - Nachbereitung und Rahmenbedingungen   2
8.1 - Ergebnisverifikation: Signifikanz, Bonferroni-Prinzip   2
8.2 - Data, Responsibly   1
8.3 - Provenance Management   5
8.4 - Privacy und Datensparsamkeit   8
8.5.2 - Forschungsdatenmanagement   7