Datenbanken helfen Datensammlungen zu strukturieren

Grundlagen zu Datensammlungen in Form von Datenbanken

Grundsätzlich kann jede wesentliche Datensammlung als «Datenbank» bezeichnet werden. Beispielsweise ein Adressbuch in einer Agenda oder die Termine in der Agenda selbst. Auch die für ein Unternehmen sehr wichtigen Kundendaten in einem CRM-System stellen eine Datenbank dar.

Im Sinn einer Definition jedoch besteht eine Datenbank aus einer oder mehreren Dateien, die aus Datensätzen bestehen. Diese Datensätze sind jeweils aus Feldern aufgebaut. Zu einer Datenbank gehören weiterhin Operationen zum Suchen bzw. Abfragen, Sortieren, Bilden neuer Kombinationen und andere Funktionen.

Normalerweise werden Datensätze in Form einer Tabelle geordnet, es kann deshalb folgende allgemeine Struktur für eine Datenbank gebildet werden:

Feld --> Datensatz --> Tabelle

Datensätze werden auch als Tupel bezeichnet. Dabei muss der Datensatz nicht in einer Tabelle als Zeile dargestellt sein, der Datensatz repräsentiert eine logische Menge von Attributen die gemeinsam den Datensatz bzw. den Tupel darstellen. Der Begriff «Tupel» (das Tupel) stammt aus der Mathematik, es handelt sich um ein Kunstwort zur Verallgemeinerung der Begriffe Paar, Tripel, Quadrupel usw.
Datenbank-Management-System
Das Datenbank-Management-System (DBMS) ist eine Softwareebene zwischen der physischen Datenbank und dem Benutzer. Ein Datenbank-Managementsystem nimmt Anforderungen, Befehle usw. von Benutzern für Datenbankaktionen entgegen und ermöglicht die Kontrolle hinsichtlich Sicherheit und Datenintegrität.

Eine Datenbank-Verwaltungssystem kann deshalb als Softwareebene im Kontext von Betriebssystem und Rechner-Hardware schematisch wie folgt dargestellt werden:

Schematische Sicht auf die Anwendung von Datenbanken

Datenbank-Verwaltungs-System
Spezialisiertes Software-System zur Verwaltung von gleichartigen Informationen

Benutzer-Sicht
Benutzer erhalten aus der Menge der gespeicherten Daten jenen Ausschnitt den sie benötigen bzw. den sie sehen dürfen

Logische Sicht
Struktur der Daten welche Verknüpfungen zwischen den Daten beinhaltet

Technische Sicht
Möglichst sinnvolle, effiziente Verwaltung der Daten auf Speichermedien wie Festplatten, Bandlaufwerken usw.

Hierarchische Datenbank
Eine Datenbank, in der die Anordnung der Datensätze eine verzweigte, baumartige Struktur bildet. Diese Form wird am häufigsten bei Datenbanken für Gross-Computer bzw. Mainframes verwendet. Sie eignet sich besonders für die Organisation von Informationen, bei denen sich eine logische Untergliederung in zunehmend grössere Detailebenen anbietet. Dabei sollte die Organisation der Datensätze im Hinblick auf die gebräuchlichsten oder zeitkritischsten Arten des erwarteten Zugriffs erfolgen.

Relationale Datenbank
Unter einer relationalen Datenbank wird die Organisation einer Datenbank oder eines Datenbank-Managementsystem (DBMS) nach dem relationalen Modell (nach E. F. Codd, siehe SQL) verstanden. Danach sind die Informationen in Tabellen - Daten in Zeilen und Spalten - gespeichert.

Für Suchoperationen verwendet man Daten in speziellen Spalten einer Tabelle, um zusätzliche Daten in einer anderen Tabelle zu ermitteln. In einer relationalen Datenbank stellen die Zeilen einer Tabelle die Datensätze (Sammlungen von Informationen über separate Elemente) und die Spalten die Felder (besondere Attribute eines Datensatzes) dar.

Muster einer Tabelle einer Datenbank

Bei Suchoperationen (bzw. Abfragen beispielsweise mittels SQL) vergleicht eine relationale Datenbank die Informationen eines Feldes in der einen Tabelle mit Informationen in einem korrespondierenden Feld einer anderen Tabelle, um eine dritte Tabelle zu produzieren, die die angeforderten Daten aus beiden Tabellen kombiniert. 

Enthält eine Tabelle z. B. die Felder Personalnummer, Nachname, Vorname und Einstellungsdatum und eine andere die Felder Abteilung, Personalnummer und Gehalt, dann kann eine relationale Datenbank das Feld Personalnummer in beiden Tabellen vergleichen, um so Informationen wie die Namen aller Beschäftigten mit einem bestimmten Gehalt oder die Abteilungen aller Beschäftigten mit einem bestimmten Einstellungsdatum zu finden.

Eine relationale Datenbank verwendet also übereinstimmende Werte in zwei Tabellen, um die Informationen einer Tabelle mit den Informationen in der anderen in Verbindung zu bringen. Die übereinstimmenden Werte bilden den sogenannten Primär- bzw. Fremd-Schlüssel.

Entitäten oder Tabellen
Eine Tabelle in einer relationalen Datenbank beinhaltet eine definierte Informationseinheit, eine sogenannte Entität. Die Tabelle aus diesem Beispiel mit Personalnummer, Nachname, Vorname und Einstellungsdatum könnte beispielsweise die Entität «Mitarbeiter-Stamm» in einer Datenbank sein.

Attribute oder Felder
Die einzelnen Felder in einer Entität werden auch als «Attribute» bezeichnet. Der Mitarbeiter-Stamm beinhaltet folglich die Attribute Nachname, Vorname, Personalnummer und Einstellungsdatum. Die Personalnummer könnte - je nach Datenbank-Modell - ein referenzielles Attribut sein, wenn es zum Primärschlüssel gehört.

Objektorientierte Datenbank
Ein flexibler Datenbanktyp, der den Einsatz von abstrakten Datentypen, Objekten sowie Klassen unterstützt und eine Vielzahl unterschiedlicher Datenarten speichern kann, neben Texten und Zahlen auch Klänge, Videos und Grafiken. 

Einige objektorientierte Datenbanken erlauben es, Datenrückgewinnungsprozeduren und Datenverarbeitungsregeln zusammen mit den Daten oder anstelle der Daten zu speichern, diese Technik wird als «Stored Procedures» bezeichnet. Auf diese Weise können Daten auch ausserhalb der physikalischen Datenbank (-Datei) untergebracht werden, was häufig wünschenswert ist, wenn die Dateien sehr gross werden, was beispielsweise in Verbindung mit Videodateien der Fall ist.