LZS

  • Increase font size
  • Default font size
  • Decrease font size
E-Mail Drucken

Hauptkomponentenanalyse (PCA) und deren Erweiterungen

Betreuer: M.Sc. Tobias Rumpel

Vortragender: Xianghe Luan

Problemstellung: Es sollen große Datensätze effektiv bearbeiten werden können. Als Vorbereitung dafür müssen diese jedoch zuerst möglichst verlustfrei komprimiert werden, sodass die Dimension der Daten sinkt und somit Rechenzeit gespart werden kann. Die PCA berechnet die Eigenvektoren der Covarianzmatrix aus den gegebenen Datensatz. Diese Eigenvektoren werden als Hauptkomponenten bezeichnet und repräsentieren abfallend die Varianz der Daten. D. h. die erste Hauptkomponente enthält die größte Varianz und die letzte die geringste. Aus diesen Hauptkomponenten bilden sich die neuen Dimensionen des Datensatzes. Durch entfernen der Hauptkomponenten mit geringer Varianz reduziert sich die Dimensionalität des Datensatzes mit geringem Informationsverlust.

Problemlösung: Für die Hauptkomponentenanalyse gibt es mehrere Erweiterungen, diese sollen als Pythonprogramm geschrieben und strukturtreu implementiert werden. Die Hauptkomponenten sollen identifiziert und der Datensatz entsprechend dargestellt werden.

Durchführung:
Gegeben sei eine Datenbank mit Messdaten

  • Einarbeitung in Python
  • Programmierung der PCA-Verfahren
  • Vergleich der Ergebnisse

Termin: 03.02.2022

 

 

Suche

LZS-Intern