Informationen zum Forschungsdatenmanagement (FDM)
Professionelles Forschungsdatenmanagement ist bei nahezu allen Fördergebern Voraussetzung für eine erfolgreiche Antragsstellung. Die Deutsche Forschungsgesellschaft (DFG) hat diesen Punkt bereits im Kodex für gute wissenschaftliche Praxis aufgenommen. Neben Publikationen erzielen reine Datenveröffentlichungen eine immer größere Sichtbarkeit der eigenen Forschungsleistungen.
Der Umgang mit Forschungsdaten ist nahezu so individuell wie das Forschungsvorhaben selbst. Neben der Organisation grundlegender Infrastruktur (wie der Zugriff auf Speichermöglichkeiten) spielt vor allem ein logischer und nachvollziehbarer Umgang mit den Datensätzen selbst die maßgebliche Rolle.
Forschungsdatenmanagement ist sehr fachspezifisch und orientiert sich an den bisherigen Abläufen. Sind diese bisher nicht digitalisiert, sind größere Umstellungen bei Forschungsvorhaben notwendig. Im Rahmen der Nationalen Forschungsdateninfrastruktur (NDFI) werden Konsortien gefördert, welche Standards für die einzelnen Disziplinen definieren. Die Umsetzung an der FAU wird durch das CDI begleitet.
Erste Schritte
Im Fokus steht dabei immer die Nachnutzbarkeit durch Dritte. Jedoch helfen alle beigefügten Informationen auch den Beteiligten selbst bei der nachhaltigen Nutzung der eigenen Daten. Am Beginn steht immer eine Inventur der vorhandenen bzw. der vermutlich erzeugten Daten.
- Welche Datenformate werden benutzt?
- Welche Geräte erzeugen Daten(-ströme)?
- Wo erfolgt die Speicherung?
- Wer hat auf welche Daten Zugriff?
- Unterliegen manche Daten besonderem Schutz?
- Welches Datenvolumen muss verwaltet werden?
- Wie erfolgt der Datenaustausch in der Gruppe und nach außerhalb?
- Wie können Datensätze veröffentlicht werden?
- …
FAIR - Prinzipien
Viele Mittelgeber, allen voran DFG und EU, fordern die Forschenden auf, möglichst viele Datensätze unter den Regelungen der FAIR-Prinzipien zu veröffentlichen. Ausgeschrieben bedeutet dies:
- F = findable (kurz: ich oder eine Maschine kann Datensätze über Suchmaschinen leicht finden)
- A = accessible (kurz: es gibt Informationen darüber, wie ich oder eine Maschine auf die Datensätze zugreifen kann)
- I = interoperable (kurz: Verwendung von Standards)
- R = resusable (kurz: klare Nutzungsrechte)
Nähere Erläuterungen zu den einzelnen Bereichen sind auf forschungsdaten.org nachzulesen. Besonderes Augenmerk aus Sicht der Forschenden muss auf interoperable gelegt werden. In diesem Bereich müssen gemeinsame Standards, abgestimmte Workflows, Regelungen für die Annotation der Daten und eine möglichst breite Erfassung von ergänzenden Daten (rich meta-data) zumindest im Fach, besser noch fachübergreifend, entwickelt, angepasst und benutzt werden. In Deutschland fördert die DFG verschiedene Konsortien innerhalb der Nationalen Forschungsdaten-Infrastruktur (NFDI) zur Entwicklung dieser Regelungen. Verschiedene Fachgesellschaften definieren bereits jetzt umfangreiche Kataloge für das Forschungsdatenmanagement. Aus universitärer Sicht ist die Sicherstellung der dauerhaften Datenspeicherung eine Herausforderung, die Datensätze sollten über einen Zeitraum von mindestens 10 Jahren nach Projektende verfügbar gehalten werden.
FDM an der FAU
An der FAU wird das Forschungsdatenmanagement flankiert durch
- Forschungsdatenpolicy (10.5281/zenodo.5095730),
- Open Science Policy (10.5281/zenodo.5602559),
- zentrale Unterstützung durch das FAU CDI:
- Antragsberatung,
- Schaffung höherer Services für das FDM (semantische Datenbanken, elektronische Laborbücher, …),
- Organisation von Basisdiensten (FAUDataCloud, Datenbanken, …) zusammen mit dem Regionalen Rechenzentrum (RRZE) und dem Medizinischen Zentrum für Informations- und Kommunikationstechnik (MIK) am Universitätsklinikum Erlangen,
- Vernetzung und Ausbildung der Forschenden,
- …