Index

European Science Cloud

Die „European Open Science Cloud“ (EOSC) ist ein multi-disziplinärer Informationsdienst, in dem veröffentlicht, nach Daten gesucht und Werkzeuge und Dienstleistungen gefunden werden können. Dieser Dienst ist einer der Leuchtturmprojekte der Europäischen Forschungsförderung. Das Portal ist hier erreichbar.

Personenbezogene Daten

Personenbezogene Daten sind alle Informationen, die sich auf eine identifizierte oder identifizierbare natürliche Person beziehen. Zu beachten ist, dass dies auch gilt, wenn eine Identifikation indirekt möglich ist. Seit dem 25.05.2018 gelten das BDSG-neu (DE) und die DSGVO (EU). Beide Gesetzestexte behandeln Datenschutz und Privatsphäre.

Weitere Informationen zu diesem Thema sind u.a. auf der FAU Seite des Datenschutzes und hier zu finden.

Data Literacy

„Data Literacy“ (de: „Datenkompetenz“) gilt als Schlüsselkompetenz des 21. Jahrhunderts und beschreibt kurz gesagt die Fähigkeit eines Individuums mit Daten umzugehen. Welches Wissen, welche Fähigkeiten und welche Haltung benötigt man in Gesellschaft, Arbeitswelt und Wissenschaft? Die einzelnen Bestandteile dieses Prozesses sind tabellarisch hier aufgelistet. Die Relevanz dieser grundlegenden Datenkompetenz gilt für den gesamten Forschungsprozess von der Erhebung, der Organisation und Nutzung, der Veröffentlichung und der Nachnutzung von Daten.

Folgendes Video veranschaulicht die Bedeutung der Schlüsselkompetenz Data Literacy.

Persistente Identifikatoren (PI)

Ein Persistenter Identifikator (PI) erlaubt eine dauerhafte Adressierung von digitalen Ressourcen. Ein PI stellt einen eindeutigen Namen für digitale Objekte jeglicher Art (Aufsätze, Daten, Software, etc. im Rahnen des Forschungsdatenmanagements vor allem Datensätze) dar. Dieser Name, meist eine längere Abfolge von Ziffern und / oder alphanumerischen Zeichen, wird mit der Web-­URL der digitalen Ressource verknüpft. Wenn sich die URL zu der Ressource ändert, muss nur die Adresse geändert werden, auf die der PI verweist, während der PI selbst gleich bleiben kann. Dies garantiert beispielsweise, dass eine einmal über einen PI zitierte Ressource auch dann noch gefunden werden kann, wenn sich ihr physikalischer Speicherort verändert hat. Beispiele für persistente Identifikatoren sind Digital Object Identifier (DOI), Uniform Resource Name (URN) und Handle.

An einem konkreten Beispiel erklärt das verlinkte Video anschaulich, was Persistente Identifikatoren sind.

 

Datenorganisation

Der Umgang mit Forschungsdaten ist für viele Wissenschaftlerinnen und Wissenschaftler die Grundlage ihrer täglichen Arbeit. Es spart daher Zeit und Aufwand, wenn diese Daten von vorneherein effizient strukturiert, dokumentiert und gesichert werden.

Die meisten Daten werden zunächst in Dateien abgelegt. Dateien haben unterschiedliche Typen oder Dateiformate, die manchmal als Suffix des Dateinamens kenntlich gemacht werden, z.B. im Betriebssystem Windows. Weiterhin werden Dateien in Verzeichnissen (Ordnern) abgelegt. Ganz wichtig ist eine systematische Benennung von Dateien wie auch Verzeichnissen. Hinweise dazu gibt z.B. das Stanford File Naming Handout.

Alternativ können Daten auch in Datenbanken abgelegt werden. Hier ist der Aufwand höher, weil erst ein Datenbank-Management-System wie z.B. MySQL eingerichtet werden muss. Zentral ist die Definition eines Datenbank-Schemas, mit dem die Strukturen für die zu speichernden Daten angelegt werden. Auch hier ist die Namensgebung von großer Bedeutung. Datenbanken unterstützen den geregelten gemeinsamen Zugriff auf Daten sehr viel besser als Dateien. Es gibt verschiedene Arten von Datenbanken: relationale, hierarchische, Graph-basierte, RDF Triple Stores und noch einige weitere mehr.

Folgendes Animationsvideo fasst die Thematik der Datenorganisation anschaulich zusammen.

Langzeitarchivierung

Der Standard für die Aufbewahrungsfrist von Forschungsdaten ist mindestens zehn Jahre [1]. Das stellt sowohl organisatorische, als auch technische Herausforderungen.
Aus der organisatorischen Sicht muss geregelt sein, wer die Verantwortung und Kontrolle über Daten hat, wenn der/die ursprüngliche Besitzer*in die FAU verlässt.
Aus technischer Sicht bedarf es spezialisierter Archivierungssysteme und Plänen, die Datenverlust verhindern. Zudem ist das Dateiformat relevant, da manche Formate sich eventuell nicht mehr öffnen lassen.

[1]: https://forschungsdaten.info/praxis-kompakt/glossar/#c269839

Dateiformat

Das Dateiformat definiert die Struktur der in der Datei enthaltenen Daten. Dadurch wird Anwendungen erlaubt den Inhalt einer Datei zu interpretieren.

Viele Dateinamen enthalten eine, durch einen Punkt getrennte, Endung. Diese deklariert das Dateiformat.

Unter dem folgenden Link finden Sie Details und eine Auflistung welche Formate für eine langfristige Speicherung geeignet sind.

openBis

openBis ist eine Open Source Kombination von elektronischem Laborbuch (ELN), Datenmanagementplattform und Labor-Bestandsmanagementsystem, die seit 2007 aktiv entwickelt wird. Je nach Bedarf können alle oder nur ausgewählte Funktionalitäten genutzt werden. Der modulare Aufbau von openBIS ermöglicht eine flexible Anpassung an die Anforderungen unterschiedlichster Arbeitsgruppen. Zudem besitzt es eine Schnittstelle, die eine Benutzung von Jupyter Notebooks zur Datenanalyse in openBIS ermöglicht. Des Weiteren existiert eine Schnittstelle für den Datenexport in das Repositorium Zenodo.

Elektronisches Laborbuch (ELN)

Elektronische Laborbücher (engl. Electronic Laboratory Notebooks, kurz: ELNs) sind Softwareanwendungen, die zur Dokumentation von Forschungsdaten eingesetzt werden und somit die analogen Papierlaborbücher ersetzen.

ELNs bieten mehrere Vorteile gegenüber ihrer analogen Variante:

  • Daten-Auffindbarkeit durch Such- und Filterfunktionen
  • Erreichbarkeit: Netzzugriff unabhängig von Ort & Zeit
  • Sicherheitsbackup der Laborbücher (und damit eine Wiederherstellung einer vorherigen Version)
  • Wiederverwendbarkeit von Vorlagen, Protokollen & Prozessen
  • Zeitersparnis durch Templates, Standardisierung & bereits vorliegende digitale Daten
  • automatische Erfassung von Messergebnissen

Die Entscheidung für eine ELN-Software sollte gut bedacht sein, da damit i.A. über einen langen Zeitraum hinweg gearbeitet wird. Wichtige Punkte, die bei der Entscheidung berücksichtigt werden sollten, finden sich z.B. hier.

Labfolder

LabFolder ist ein elektronisches Laborbuch, ein Inventarmanagementwerkzeug und der Name des 2013 gegründeten Unternehmens, welches die gleichnamige Software anbietet.

Als proprietäre Software ist die Nutzung mit monatlichen Kosten pro User verbunden. Eine kostenlose Version ist ebenfalls erhältlich, allerdings mit limitiertem Funktionsumfang und beschränkter Anzahl an Nutzern pro Gruppe.

Eingetragene Daten sind nur als XHTML und PDF exportierbar. Labfolder ist über das Universitätsklinikum beziehbar, weitere Informationen erhalten Sie auf der Informationsseite der Medizinischen Fakultät.