| Was sind Daten? |
|
|
|
Was sind DatenDaten beginnen bereits bei einer simplen Zahl. Fünf Zahlen zwischen Eins und Zehn sind bereits ernst zu nehmende Daten. Man unterscheidet auch zwischen konstanten Daten und variablen Daten. Die Zahl pi ist so eine konstante Zahl. Wechselkurse diveser Währungen gelten aber als variable Datenkonstrukte. Mein Programm hat aber ein Problem - ich muss es wahrscheinlich jeden Tag umprogrammieren, was darauf hindeutet, dass diese Idee keine gute war. Worauf es da aber mehr ankommt ist, dass unser Programm nicht jeden Tag neu geschrieben werden muss, denn jetzt liest es ja das täglich aktualisierte datafile aus! Tolle Sache! user@host> cat datafile Frankreich FR 6.559570 Deutschland DEM 1.955830 Italien ITA 1936.270020 Belgien Bef 40.339901 user@host> Dieses flat-file (flaches file=) sind also unser Datenspeicher (data storage) und sind in der Tat in gewissen Bereichen sehr nützlich. /etc/passwd ist ja eigentlich auch so ein flat file, nicht wahr? Jede Zeile enthält also genau einen Eintrag. Auf zu einem neuen Problem! Was nämlich, wenn das file um eine Spalte erweitert werden soll? Sagen wir, es soll um die Landessprache erweitert werden. Dann wird jeder annehmen, KEIN PROBLEM - user@host> cat datafile Frankreich französisch FR 6.559570 Deutschland deutsch DEM 1.955830 Italien italienisch ITA 1936.270020 Belgien flämisch, französisch Bef 40.339901 Schweiz deutsch, itaienisch, franz&oum;sisch, räto-romanisch ...... user@host> OUPS. JETZT habe ich ein Problem. Nicht jedes Land hat nur eine offizielle Sprache! Wenn ich nun dieses datafile mit meinem fiktiven Programm auslesen will, dann muss ich wohl sehr viele Verrenkungen anstellen, wenn das überhaupt so gelöst werden kann ... Diese Sprachenspalte, in der mehr als ein Wert stehen kann, nennt man in der Datenbank-Faschsprache "repeating groups" (eine sich wiederholende Gruppe). Dieses Problem tauchte in der Datenvverarbeitung relativ früh auf, und brachte, wenn man so will, die Entwicklung der "Datenbanken" mit sich! In unserem flat-file ist es eigentlich unmöglich festzustellen, wo die Sprachenspalte aufhört und die Zahlenspalte beginnt. In strukturierten Textfeldern kann dieses Problem möglicherweise aufgefangen werden. Gehen wir über zu einem anderen Beispiel: Eine Film-DVD - da haben wir den Filmtitel, den einen Regisseur, oder zwei, den Produzenten, das Jahr der Produktion, die Spieldauer, und die Hauptdarsteller, von denen wir die Anzahl auch nicht kennen. Das folgende Beispiel habe ich aus einem Buch abgekupfert user@host:> cat filmdata [20014 Odysee im Weltraum] jahr=1968 regisseur="Stanley Kubrik" genre="science fiction" hauptrolle="kerr dalba" hauptrolle="Leonard Rossiter" [Krieg der Sterne] ... user@host:> So also sieht ein strukturiertes file aus - so oder anders .. das erinnert manche von uns auch an die smb.conf oder an die win.ini vom MS-Riesen. Es wurde hier das Problem der "repeating groups" also so gelöst, dass man die Felder , wo mehr Angaben yu treffen sind, öfter angibt, wie das bei den hauptdarstellern war, und somit bekommt jeder "key" (linke Seite) bekam genau einen Wert (rechte Seite) zugewiesen. Natürlich wird unser Programm, das dieses strukturierte file auslesen können soll, auch immer komplexer und komplizierter, dadurch auch fehleranfälliger. Diese strukturierten files können ein Längenproblem bekommen und sind in sich schwer erweiterbar. Eine mögliche Erweiterung könnten Kundendaten jener sein, die sich diese DBD's ausleihen. Es ist zwar nicht schwer, dieses file abzufragen, aber je länger und grösser diese files werden, umso länger wird das Ergebnis auf sich warten lassen, was uns also ein performance-Problem erwarten lässt. Es muss jedes Mal das ganze file nach den gewünschten Daten abgesucht werden. Und all diese Überlegungen führen uns zu dem Schluss, dass wir eine Datenbank brauchen, die von einem "Datenbank Management System" ausgelesen werden kann. DBMS steht für Database Management System |
|
| Letzte Aktualisierung ( Wednesday, 9. May 2007 ) |
| Weiter > |
|---|



