Datensatz

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

EinDatensatz(anhören/?) ist (beispielsweise nach Mertens[1]) eine Gruppe von inhaltlich zusammenhängenden (zu einem Objekt gehörenden)[2]Datenfeldern,z. B. Artikelnummer und Artikelname. Datensätze entsprechen einer logischen Struktur, die bei derSoftwareentwicklung(z. B. im konzeptionellen Schema derDatenmodellierung) festgelegt wurde.[3]

In derDatenverarbeitungwerden zu Datensätzen zusammengefasste Daten inDatenbankenoder inDateiengespeichert. Sie sind Gegenstand der Verarbeitung vonComputerprogrammenund werden von diesen erzeugt, gelesen, verändert und gelöscht (sieheCRUD). Bei derEingabewird der Inhalt von Datensätzen oft in der Form einesFormularsdargestellt, bei derAusgabe oder Anzeigeauch inListen­form, ggf. nur mit einem Teil der Datenfelder.

Auchnicht-elektronische Datenkönnen zu Datensätzen zusammengefasst sein, zum Beispiel ist eineKarteikartein einerKarteiein Datensatz.[4]

Neben der Bedeutung von „Datensatz “im engeren Sinn – alsSammlung konkreter Daten(z. B. die Adressdaten von Kunde Müller) – wird der Ausdruck im Kontext der Softwareentwicklung auch alsTypbegriffbei derDeklarationvon Daten verwendet; Beispiel: Datensatz ‚Adressdaten‘. Abhängig von den dabei angewendeten Methoden, Programmiersprachen etc. werden anstelle von ‚Datensatz‘ auchTerminiwie Satz (englischRecord),Entitätstyp,Klasse,Tupel,Struktur,Verbundusw. benutzt. Deren logischer Aufbau wird im Rahmen des Konzeptionellen Schemas derDatenmodellierungfestgelegt.[5]

Abgrenzung:Obwohl Daten eigentlich immer als Aneinanderreihung mehrererDatenelementeauftreten, nennt man nicht alle Erscheinungsformen von Daten ‚Datensatz‘, sondern nur Datengruppierungen, die zu einem bestimmten Objekt gehören und die innerhalb einesDatenbestandsidentische Strukturen aufweisen. Die Datenfelder ‚Name‘, ‚Adresse‘ und ‚Geburtsdatum‘ könnten also einen Datensatz zu einer Person bilden.Nichtals Datensätze in diesem Sinn gelten zum Beispiel:Fließtexte,Drucker- oder Video-Datenströme,Inhalte vonausführbaren Dateien,Fotodaten oder die Daten vonGrafiksoftware.

Abweichende Bedeutung in der Statistik

[Bearbeiten|Quelltext bearbeiten]

Zusammenfassend bezeichnet der Datensatz in derInformatik– wie oben beschrieben – eine eindimensionale, strukturierte Folge vonAttributeneines Elementseiner übergeordneten Menge (z. B. eine Karteikarte einer Kartei, eine Bestellung einer Datenbank für Bestellungen, eine Zeile einer Adressliste).

Dagegen bezeichnet der Datensatz in derStatistikdieGesamtheitvon Daten in einem bestimmten Zusammenhang. Hier ist er also gleichbedeutend mitDatenbestand(ein Satz bzw. eine Sammlung von Daten, auch aus der Übersetzung vonData Set,früher bei IBM fürDateiverwendet[6]) – beispielsweiseallein einer statistischenErhebungermittelten Daten oder die „Steuersünder-CD“.[7]

Varianten bei der Speicherung

[Bearbeiten|Quelltext bearbeiten]

Im Allgemeinen entspricht ein Datensatz, mit den Ausdrucksmitteln vonProgrammiersprachendeklariert,demDatentypVerbundbzw. Record, ggf. innerhalb einesassoziativen Arrays.Das mathematische Modell eines Datensatzes ist einTupel.

Bezüglich der Speicherung von Datensätzen lassen sich zahlreiche Unterscheidungen treffen. Zum Beispiel:

  • Speicherung in normalenDateien:Hier bieten sich Alternativen wie:
    • Benutzerdefinierte individuelle Datenformate und -strukturen,
    • CSV-Dateienmit Feldtrennzeichen wie Strichpunkt o. ä.,
    • XML-Formatin der Form <Feldname = Feldinhalt> und mit weiteren strukturbezogenen, textlich formulierten Informationen,
    • RDF-Formatfür Internet-Informationen.
  • Speicherung in Datenbanken:
    • Inrelationalen Datenbankenwerden Datensätze in Tabellenform gespeichert, wobei ein Datensatz i. d. R. einer Tabellenzeile entspricht.
    • Spaltenorientierte Datenbankenspeichern nicht alle Datenfelder je Datensatz hintereinander, sondern für jedes Datenfeld die Inhalte aller Datensätze, eine Spalte (mit all ihren Zeilen) steht hier also für 'Datensatz'.[8]

Im Detail ist ‚Datensatz‘ jedoch kein technischer, sondern ein logischer Begriff, für den es zahlreiche technische Erscheinungs- und Implementierungsfomen gibt. Dabei können Datensätze nach den folgenden Merkmalen/Eigenschaften unterschieden werden:

  • Allgemeingültigkeit: Verbindlich festgelegte Strukturen und Formate (wie binäre Daten oder Text, Länge, sonstige Regeln), z. B. für bestimmteSoftwarelösungen(wie beimDTA-Verfahren) vs. individuell vomAnwenderdefinierte Formate.
  • Satz-/Datenfeldlänge: Fixe und einheitliche Länge je Feld vs. variabel lange Felder (z. B. mit Feldtrennzeichen wie bei CSV oder mit Feldlängenangabe); führt entsprechend zu Datensätzen mit fixer oder variabler Länge.
  • VerwendeteZeichenkodierung:Nur Textzeichen z. B. imASCII-Code vs. andere Datentypen in einemBinärcode.
  • Feldattribute: Nur Nettodaten vs. weitere Informationen je Feld (wie fett, unterstreichen, Schrifttyp usw., meist nicht sichtbar).
  • Datensatzbegrenzung: Satzende-Kennzeichnung vs. feste Satzlänge.
  • Homogenität: Einheitliche vs. unterschiedliche Datenarten in derselben Datei, erkennbar z. B. durch ein Datenfeld ‚Satzart‘.

In Anwendungen zurTabellenkalkulationwird ein Datensatz meist durch eine Zeile, je nach Anordnung alternativ durch eine Spalte repräsentiert. Ein klassisches Beispiel für einen Datensatz ist eineLochkarte.

Für elektronische Daten gilt: Sie existieren in ihrem Speichermedium als Bit-/Bytefolgen beliebiger Länge. In dieser Datenmenge werden die einzelnen Datensätze und Datenfelder durch meist von derProgrammierspracheund/oder derSystemsoftwarebereitgestellte Verfahren identifiziert und adressiert und zum Beispiel in Zeilen und Spalten dargestellt.

Logische/physische Datensätze: Auf elektronischenDatenträgernwerden in der Regel mehrere Datensätze zu größeren Speichereinheiten zusammengefasst. Solche Einheiten werden je nach Computersystem unterschiedlich bezeichnet, zum Beispiel als ‚Page‘ (Seite, bei vielen Datenbanksystemen) oder als Block (bei konventioneller Speicherung).[9]In einem Computerprogramm sind der Verarbeitung des einzelnen Datensatzes Routinen vorgeschaltet (meist desBetriebssystemsoder desDBMS), die das tatsächliche Lesen oder Schreiben auf dem Datenträger aus Optimierungsgründen block-/seitenweise durchführen und den jeweils einzelnen Datensatz innerhalb des Datenblocksiterativpositionieren und zur Verarbeitung imHauptspeicherbereitstellen.

  1. P. Mertens et al.:Grundzüge der Wirtschaftsinformatik.5. Auflage. Springer Verlag, Berlin 1998, S. 59
  2. Datensatz.In: GablerWirtschaftslexikon
  3. Henry Herper:Informatisches Modellieren.(PDF) Uni Magdeburg, 2004,abgerufen am 11. März 2014.
  4. Datensatz.Fremdwort.de
  5. Dr. Henry HerperInformatisches Modellieren[1]Seite 46 Datenmodellierung - Schichtenmodell (2004)
  6. TechtargetWhatIs /de[2]Datensatz
  7. Anzahl der Dokumenten- und Datensätze im Berliner Datenportal(PDF; 149 kB)
  8. Zeilen- und spaltenorientierte Datenbanken.Eliteinformatiker
  9. Sebastian Dworatschek:Grundlagen der Datenverarbeitung.books.google.deKap. 1.2.1Logische und physische Sätze