Dimensionsreduktionsverfahren
Wie kann man die Ähnlichkeit von Patienten und Tumoren auf hochdimensionalen Daten bestimmen und visuell darstellen? Teste die Verfahren selbst und entdecke versteckte Muster in genetischen Daten!
Multi-Omics Datentabellen
| Mutation | Expression | |
|---|---|---|
| Gen1...Gen20123 | Gen1...Gen20123 | |
| Patient 1 | 0 1 0 5 |
|
| ... | ||
| Patient 666 | 34 | 34 |
Dimensionen
2D Visualisierung
Dimensionen
1. Wähle einen Datensatz
Linear
Linearer Zusammenhang zwischen X und Y.
Quadratisch
Quadratischer Zusammenhang in Parabelform.
Geclustert
Mehrere getrennte Gruppen von Datenpunkten.
2. Wähle ein Verfahren zur Dimensionsreduktion
Die Hauptkomponentenanalyse (PCA) ist ein lineares, deterministisches Verfahren, das durch sehr effiziente Berechnungen korrelierte Variablen in unkorrelierte Hauptkomponenten umwandelt, um maximal viel Information (Varianz) der Daten zu erhalten.
UMAP (Uniform Manifold Approximation and Projection) ist ein nicht-deterministisches, nachbarschaftsbasiertes Verfahren zur nicht-linearen Dimensionsreduktion, das lokale Strukturen in den Daten erhält und gleichzeitig ihre globale Form möglichst gut abbildet.
Autoencoder sind Deep-Learning Netzwerke, die lernen hoch-dimensionale Daten in wenige Dimensionen darzustellen durch eine Flaschenhals-Architektur bestehend aus Encoder, Latent Space und Decoder.