Aufgabe zur Modellierung III (Adresshandel)

../../_images/adresse.jpg

Ziel- und Aufgabenstellung

Adresshändler, Spammer, die Werbebrache, alle wollen Adressen sammeln und nutzen! In dieser Serie werden einige Grundlegende Technicken zum Verwalten großer Datenbestände in einer Datenbank thematisiert.

Ausgangspunkt und Übungsbeispiel ist die kostenlos zum Download angebotene Adressensammlung:

http://csv-daten.de/firmenadressen.html

  1. Laden Sie die Daten herunter.

  2. Erstellen Sie aus dem Header der ersten Zeile eine Tabelle.

  3. Wandeln sie die Daten in das UTF8-Format um.

  4. Importieren Sie die Daten (Fehler können den ersten Import behindern oder unmöglich machen!), korrigieren Sie die Fehler, meistens ungülige Zeichen (;) oder doppelte Einträge.

  5. Die Daten sind nicht normalisiert, erstellen Sie ein Datenmodell, das die Daten in der dritten Normalform abbildet.

  6. Kopieren Sie die Daten aus der großen Tabelle in die neu erschaffene Tabellenstruktur.

  7. Beschleunigen Sie die Abfragen, durch die Anlage von Indexen, Views und Trigger.

  8. Messen Sie für alle Kommandos die Zeit und protokollieren Sie die Verbesserung der Ablaufgeschwindigkeit.