Menu Content/Inhalt
Home arrow PostgreSQL arrow Was sind Daten?
Was sind Daten? PDF Drucken E-Mail

Was sind Daten

Daten beginnen bereits bei einer simplen Zahl. Fünf Zahlen zwischen Eins und Zehn sind bereits ernst zu nehmende Daten.

Man unterscheidet auch zwischen konstanten Daten und variablen Daten. Die Zahl pi ist so eine konstante Zahl. Wechselkurse diveser Währungen gelten aber als variable Datenkonstrukte.
Und schon sind wir mitten drin in unserem Thema. Ich könnte ein Programm schreiben, das eine Tabelle beinhaltet, und das auf Anfrage den aktuellen Wechselkurs für eine bestimmte Währung ausgibt. Der Euro wird gerne als sechsstellige Zahl einer Fremdwährung angegeben.

Mein Programm hat aber ein Problem - ich muss es wahrscheinlich jeden Tag umprogrammieren, was darauf hindeutet, dass diese Idee keine gute war.
Was aber, wenn ich das Programm so gestalte, dass es ein fiile ausliest, das die Daten der Begierde beinhaltet? Gute Idee!
Und da dieses fiile unsere Daten beinhaltet, nennen wir es Datafile.

Worauf es da aber mehr ankommt ist, dass unser Programm nicht jeden Tag neu geschrieben werden muss, denn jetzt liest es ja das täglich aktualisierte datafile aus! Tolle Sache!
Das datafiile ist simpel gehalten.
Es besteht aus Zeilen, wo jede Zeile die Info enthält, wieviel was gerade wert ist. Solche fiiles nennt man auch flat files was jetzt folgt ist eine fiktive Tabelle - dient ja bloss als banales Beispiel und erinnert an die Tage vor "Euro-fixata"

user@host> cat datafile Frankreich FR 6.559570 Deutschland DEM 1.955830 Italien ITA 1936.270020 Belgien Bef 40.339901 user@host>

Dieses flat-file (flaches file=) sind also unser Datenspeicher (data storage) und sind in der Tat in gewissen Bereichen sehr nützlich. /etc/passwd ist ja eigentlich auch so ein flat file, nicht wahr? Jede Zeile enthält also genau einen Eintrag. Auf zu einem neuen Problem! Was nämlich, wenn das file um eine Spalte erweitert werden soll? Sagen wir, es soll um die Landessprache erweitert werden. Dann wird jeder annehmen, KEIN PROBLEM -

user@host> cat datafile Frankreich französisch FR 6.559570 Deutschland deutsch DEM 1.955830 Italien italienisch ITA 1936.270020 Belgien flämisch, französisch Bef 40.339901 Schweiz deutsch, itaienisch, franz&oum;sisch, räto-romanisch ...... user@host>

OUPS. JETZT habe ich ein Problem. Nicht jedes Land hat nur eine offizielle Sprache! Wenn ich nun dieses datafile mit meinem fiktiven Programm auslesen will, dann muss ich wohl sehr viele Verrenkungen anstellen, wenn das überhaupt so gelöst werden kann ... Diese Sprachenspalte, in der mehr als ein Wert stehen kann, nennt man in der Datenbank-Faschsprache "repeating groups" (eine sich wiederholende Gruppe). Dieses Problem tauchte in der Datenvverarbeitung relativ früh auf, und brachte, wenn man so will, die Entwicklung der "Datenbanken" mit sich! In unserem flat-file ist es eigentlich unmöglich festzustellen, wo die Sprachenspalte aufhört und die Zahlenspalte beginnt. In strukturierten Textfeldern kann dieses Problem möglicherweise aufgefangen werden. Gehen wir über zu einem anderen Beispiel: Eine Film-DVD - da haben wir den Filmtitel, den einen Regisseur, oder zwei, den Produzenten, das Jahr der Produktion, die Spieldauer, und die Hauptdarsteller, von denen wir die Anzahl auch nicht kennen. Das folgende Beispiel habe ich aus einem Buch abgekupfert

user@host:> cat filmdata [20014 Odysee im Weltraum] jahr=1968 regisseur="Stanley Kubrik" genre="science fiction" hauptrolle="kerr dalba" hauptrolle="Leonard Rossiter" [Krieg der Sterne] ... user@host:>

So also sieht ein strukturiertes file aus - so oder anders .. das erinnert manche von uns auch an die smb.conf oder an die win.ini vom MS-Riesen. Es wurde hier das Problem der "repeating groups" also so gelöst, dass man die Felder , wo mehr Angaben yu treffen sind, öfter angibt, wie das bei den hauptdarstellern war, und somit bekommt jeder "key" (linke Seite) bekam genau einen Wert (rechte Seite) zugewiesen. Natürlich wird unser Programm, das dieses strukturierte file auslesen können soll, auch immer komplexer und komplizierter, dadurch auch fehleranfälliger. Diese strukturierten files können ein Längenproblem bekommen und sind in sich schwer erweiterbar. Eine mögliche Erweiterung könnten Kundendaten jener sein, die sich diese DBD's ausleihen. Es ist zwar nicht schwer, dieses file abzufragen, aber je länger und grösser diese files werden, umso länger wird das Ergebnis auf sich warten lassen, was uns also ein performance-Problem erwarten lässt. Es muss jedes Mal das ganze file nach den gewünschten Daten abgesucht werden. Und all diese Überlegungen führen uns zu dem Schluss, dass wir eine Datenbank brauchen, die von einem "Datenbank Management System" ausgelesen werden kann. DBMS steht für Database Management System

Letzte Aktualisierung ( Wednesday, 9. May 2007 )
 
Weiter >

Scroll-news

Mailingliste:
http://mlists.in-berlin.de/mailman/listinfo/lieo-mlists.in-berlin.de 

 

Das Forum ist online gegangen

 


Who's Online

Aktuell 119 Gäste online

Google AdSense