Datenbank-Normalisierung - Aufgaben und Lösungen
1. Was sind Redundanzen?
Definition: Redundanzen in Bezug auf Datenbanken sind Doppelungen von Daten. Daten sind doppelt in der Datenbank vorhanden.
2. Erste Normalform (1NF)
Definition: Alle Daten in der Tabelle müssen atomar sein. Jedes Datenfeld hat nur einen Wert und kann nicht weiter unterteilt werden.
Regeln der 1NF:
- ✅ Jede Zelle enthält nur einen Wert
- ✅ Keine wiederholenden Gruppen
- ✅ Eindeutige Spaltennamen
- ✅ Atomare Werte (nicht weiter teilbar)
3. Tabelle Patienten - Überführung in 1NF
Original Tabelle (nicht in 1NF):
Patient_ID | Name | Nachname | Diagnosen | Therapien
1 | Clemens | Meyer | Erkältung, Grippe | Antibiotika, Ruhe
✅ Tabelle in 1NF:
Patient_ID | Name | Nachname | Geburtsdatum | Diagnose_Nr1 | Diagnose_Nr2 | Diagnose_1 | Diagnose_2 | Datum_Diagnose_1 | Datum_Diagnose_2 | Therapie_1 | Therapie_2 |
---|---|---|---|---|---|---|---|---|---|---|---|
1 | Clemens | Meyer | 13.12.1986 | 1 | / | Erkältung | / | 24.07.2014 | / | Antibiotika | / |
2 | Max | Forster | 27.04.1975 | 2 | 1 | Alkoholvergiftung | Erkältung | 12.12.1996 | 27.03.2001 | Entgiftung | Antibiotika |
3 | Sieghold | Kim | 32.06.2000 | 3 | 1 | Oberschenkelfraktur | Erkältung | 01.01.2017 | 24.02.2017 | Gips | Antibiotika |
⚠️ Hinweis: Das Geburtsdatum von Patient 3 (32.06.2000) ist ungültig und sollte korrigiert werden.
4. Redundanzen in der Tabelle Fachbelegung (1NF)
Identifizierte Redundanzen: - Fachinformationen werden bei jedem Lehrer wiederholt - Lehrerinformationen bei mehreren Fächern dupliziert
5. Redundanzen in der Tabelle Patienten (1NF)
🔍 Identifizierte Redundanzen:
- Diagnose Nummern - sich wiederholende Diagnose-IDs
- Diagnosen - gleiche Diagnosen bei verschiedenen Patienten
- Therapien - identische Therapien mehrfach gespeichert
⚠️ Weitere Probleme:
- Ungültige Datumsangaben
- Inkonsistente Datenformate
- Schwierige Wartbarkeit
6. Anomalien in Datenbanken
📊 Übersicht der Anomalien
1. 🆕 Einfügeanomalie
Definition: Neue Daten können nicht vollständig eingegeben werden.
Beispiel: Ein neues Fach soll in einer Schule eingeführt werden, aber es gibt noch keinen Lehrer dafür. Daher können die Daten nicht vollständig eingegeben werden.
2. 🗑️ Löschanomalie
Definition: Beim Löschen gehen ungewollt weitere Informationen verloren.
Beispiel: Wenn ein Lehrer aus der Datenbank gelöscht wird, gehen auch alle Informationen über die von ihm unterrichteten Fächer verloren.
3. 🔄 Mutationsanomalie
Definition: Änderungen werden nicht korrekt durchgeführt.
Beispiel: Eine Mutation tritt auf, wenn eine Änderung in der Datenbank nicht korrekt durchgeführt wird, z.B. wenn ein Schüler seinen Namen ändert, aber die Änderung nicht in allen relevanten Tabellen übernommen wird.
4. ✏️ Änderungsanomalie
Definition: Inkonsistenzen durch unvollständige Updates.
Beispiel: Wenn die Adresse eines Schülers geändert wird, aber nicht in allen Datensätzen aktualisiert wird, führt dies zu Inkonsistenzen.
🎯 Zusammenfassung
Unterscheidung der Anomalien:
Anomalie-Typ | Ursache | Auswirkung | Lösung |
---|---|---|---|
Einfügung | Fehlende Abhängigkeiten | Unvollständige Datensätze | Normalisierung |
Löschung | Gekoppelte Daten | Datenverlust | Fremdschlüssel |
Mutation | Inkorrekte Verarbeitung | Datenkorruption | Transaktionen |
Änderung | Redundante Speicherung | Inkonsistenzen | Normalisierung |
📋 Präsentationsvorbereitung
Kernpunkte für die Präsentation:
- ✅ Redundanzen identifizieren und erklären
- ✅ 1NF-Regeln anwenden
- ✅ Anomalien mit konkreten Beispielen demonstrieren
- ✅ Lösungsansätze durch Normalisierung aufzeigen
Visualisierungen einsetzen:
- Tabellen vor/nach Normalisierung
- Diagramme für Anomalien-Typen
- Praktische Beispiele aus dem Schulkontext