Index

Metadaten

Metadaten beschreiben andere Daten mithilfe von Informationen, die zur Interpretation und (automatischen) Verarbeitung der eigentlichen Daten, etwa der digitalen Forschungsdaten, notwendig oder sinnvoll sind; also ‚Daten über Daten‘.

Dies können elementare Beschreibungen sein wie Länge, Codierung und Typ (Zahl, Zeichenkette, Datum und Uhrzeit, Währungsbetrag usw.). Viel wichtiger sind Metadaten, die dazu beitragen, die Eigenschaften digitaler Objekte zu kategorisieren und zu charakterisieren sowie weiterführende Informationen zur Verfügung zu stellen und somit etwas über deren Bedeutung sagen. Für Messwerte, die in Forschungsdaten vorkommen, sind das beispielsweise: verwendetes Messgerät bzw. verwendeter Sensor, Genauigkeit oder Ort der Messung. Schon die Bezeichnung (der Name) eines Datenobjekts sagt etwas über die Bedeutung, meist genügt das aber noch nicht. Oft sind diese Bezeichnungen zu kurz und zu allgemein (eben nur „Messung“ oder so etwas). Was damit gemeint ist, erschließt sich oft auch erst aus dem Kontext der Verwendung. So entwickeln Forschungsprojekte ihre gebräuchlichen Bezeichnungen, die aber außerhalb des Projekts missverstanden werden können.

Ontologien sind dafür gedacht, solche spezifischen Bezeichnungen in Bezug zu setzen zu einer allgemeinen Begriffssystematik.

Man unterscheidet verschiedene Kategorien von Metadaten:

  • Technische Metadaten beinhalten beispielsweise Angaben zu Datenvolumen und Datenformat und sind für eine nachhaltige Datenspeicherung von zentraler Bedeutung.
  • Deskriptive Metadaten (auch beschreibende oder Content-­‐Metadaten genannt) geben Auskunft über die in digitalen Objekten enthaltenen Informationen und entscheiden damit über deren Auffindbarkeit, Referenzierung und Nachnutzbarkeit. Hierzu gehören auch Erläuterungen der zugrundeliegenden Messmethode, ein Abstract oder Schlagwörter. Strukturelle Metadaten beschreiben Beziehungen zwischen einzelnen Elementen eines Datensatzes oder die interne Struktur der Daten selbst.
  • Administrative Metadaten beinhalten Informationen für die Qualitätssicherung der Daten (etwa Prüfsummen), Informationen zu Zugriffsrechten und Lizenzen oder Provenienz-­‐Informationen.