"Daten sind der Goldstaub der Forschung"Was Sie über Forschungsdatenmanagement wissen müssen - ein Überblick
10. Januar 2023
Foto: UHH/Nadler
"Forschungsdatenmanagement", ein abstrakter Begriff. Was verbirgt sich dahinter, und warum ist es nicht nur für Wissenschaftler:innen wichtig zu verstehen? Prof. Dr. Sandra Schulz (Didaktik der Informatik) im Interview mit Michael Wuppermann (Leitung eScience-Büro) zum Thema Forschungsdatenmanagement.
Michael Wuppermann: Moin Sandra, du bist bei uns an der Fakultät eine Expertin zum Thema Forschungsdatenmanagement. Was können sich Laien unter dem sperrigen Begriff Forschungsdatenmanagement vorstellen?
Sandra Schulz: Moin Michael. In der Forschung erheben wir verschiedene Daten, um Erkenntnisse zu gewinnen. Beim Forschungsdatenmanagement (oder kurz FDM) geht es unter anderem darum, wie diese Daten zu erheben und zu sichern sind. Auch die Fragen, wer Zugriff zu den Daten haben darf und wie sie aufbereitet werden, gehören dazu. Ein Ziel des FDMs ist, dass wir eine hohe Qualität der Daten sowie eine hohe Transparenz in der Gewinnung von Forschungserkenntnissen erreichen. Die Daten sollen langfristig nutzbar gemacht werden, so dass auch zukünftige Forschende mit den gleichen Daten arbeiten können, ohne sie erneut erheben zu müssen. Das ist äußerst ressourcensparend.
Wuppermann: Was sind das für Daten, die die Forschenden speichern und die für Dritte interessant sein können?
Schulz: Die Daten können sehr vielfältig sein. Beispielsweise arbeite ich oft mit “qualitativen Daten” wie Interviews, dass heißt ich analysiere die Abschriften eines Interviews. Es gibt auch Videodaten, beispielsweise von Unterrichtsstunden, die gefilmt werden. Ein Beispiel für “quantitative Daten” sind Fragebögen. Ganz konkret kann das heißen, dass wir Fragebögen in Klassen geben, die die Motivation der Schüler:innen am Fach Informatik teilzunehmen erfragen. Die Antworten werten wir dann statistisch aus.
Wuppermann: Gibt es einen großen Speicher für alle Forschungsdaten auf den jede:r zugreifen kann oder wie kann man sich die langfristige Speicherung vorstellen?
Schulz: Prinzipiell gibt es verschiedene Speichermöglichkeiten und Dienste, die Speicherkapazitäten für Forschungsdaten anbieten. Ein Dienst ist zum Beispiel “Zenodo”, dort kann man viele verschiedene publizierte Daten finden, die teilweise für alle offen zugreifbar sind. Darüber hinaus ist es aber auch möglich und nötig, dass Daten nur mit gewissen Einschränkungen veröffentlicht werden. Das kann heißen, dass sie nur an Forschende mit einem begründeten Forschungsinteresse weitergegeben werden. Dafür kann ein Datennutzungsvertrag erforderlich sein, der zwischen den Wissenschaftler:innen geschlossen wird und die getroffenen Vereinbarungen zwischen Forschenden und Proband:innen einhält. Letztendlich hängt es unter anderem von der Art der Daten ab und als wie sensibel sie eingestuft werden, ob und wie sie zugänglich sein können. Im Sinne der Guten wissenschaftlichen Praxis ist es unsere Aufgabe als Forschende unsere Proband:innen zu schützen.
Wuppermann: Was heißt es für Teilnehmende in einem Forschungsprojekt, dass Daten veröffentlicht werden?
Schulz: Zunächst müssen die Daten nicht unbedingt öffentlicht sein, aber zugänglich. Wichtig ist dabei, dass die Daten nur in anonymisierter oder pseudonymisierter Form veröffentlich werden, so dass ein Rückbezug auf die Person nicht möglich sein soll. In der erziehungswissenschaftlichen Forschung werden zumeist nicht die Rohdaten veröffentlicht. Insbesondere bei Interviews (als Audioaufnahme) ist das wichtig, da es in der Sprache viele Merkmale gibt, um eine Person zu identifizieren. Diese Merkmale wie beispielsweise die Stimme oder spezielle Formulierungen müssen vor einer Veröffentlichung bearbeitet werden. Wann die Rohdaten (in diesem Beispiel die Audiodatei) gelöscht werden, wird unter anderem in einer informierten Einwilligungserklärung festgehalten,in der Proband:innen von den Forschenden aufgeklärt werden und in die Datenerhebung einwilligen können. Ob die Daten auch publiziert werden dürfen und in welcher Form, wird ebenfalls in der informatierten Einwilligungserklärung fixiert. Darüber hinaus gibt es weitere Möglichkeiten der Veröffentlichung. Wie schon angesprochen, kann es sein, dass Daten nur nach dem Abschluss eines Nutzungsvertrags an Personen weitergegeben werden. Auch ist es möglich nur die Metadaten, das heißt die Daten, die diese Daten beschreiben, zu veröffentlichen, die keinerlei Rückschlüsse auf die Teilnehmenden in der Forschung zulassen sollen.
Wuppermann: Wozu können die Daten genutzt werden und wie kann ein Mehr an Daten die Forschung und die Praxis unterstützen?
Schulz: Daten sind in der Forschung unser “Goldstaub” um Erkenntnisse zu gewinnen, da wir zumeist evidenzbasiert vorgehen. Das heißt, wir leiten aus den Daten Erkenntnisse ab, die wir beispielsweise für die Schulpraxis oder Bildungspolitik aufbereiten und Empfehlungen formulieren. Dafür brauchen wir viele Daten, beispielsweise aus den Schulen, um möglichst allgemeingültige aber auch sehr konkrete Erkenntnisse abzuleiten.
Wuppermann: Wenn man die Fachdiskussionen zum Thema Forschungsdatenmanagement verfolgt wird deutlich, dass die Nachnutzung von Forschungsdaten gewünscht ist und mittelfristig zunehmen soll. Welche Kompetenzen sind deiner Meinung nach bei Studierenden, Lehrkräften oder Entscheider:innen im Umgang mit (Forschungs-)Daten wichtig?
Schulz: Es gehören sehr umfangreiche Kompetenzen zu dem Bereich Forschungsdatenmanagement. Kürzlich habe ich mit Kolleg:innen eine Lernzielmatrix veröffentlicht, um sich dem Thema Kompetenzen für Forschungsdatenmanagement zu nähern. Für einen wichtigen Inhaltsbereich halte ich die Dokumentation von Daten. Es muss also detailliert beschrieben werden in welchem Zusammenhang und wie die Daten erhoben wurden, damit für Forschende klar wird, in welchem Zusammenhang sie diese Daten tatsächlich nachnutzen können ohne sie zu verfälschen. Des Weiteren ist ausgesprochen wichtig rechtliche Rahmenbedingungen zu kennen, um zu wissen unter welchen Voraussetzungen welche Daten erhoben und verarbeitet werden dürfen. Insbesondere bei der Arbeit mit Kindern und Jugendlichen müssen hier besondere rechtliche Aspekte berücksichtigt werden.
Wuppermann: Wir haben jetzt viel über den gegenwärtigen Umgang und die Chancen von Forschungsdaten in der erziehungswissenschaftlichen Forschung gesprochen. Was meinst du, worüber werden wir in den kommenden 10 Jahren beim Thema Forschungsdatenmanagement sprechen?
Schulz: Um Forschungsdaten zu erheben, verarbeiten und publizieren zu können, werden diverse Ressourcen benötigt. Beispielsweise müssen Speicherkapazitäten ausgebaut werden, Daten müssen aufbereitet und die Datenqualität muss sichergestellt werden - um nur ein paar Beispiele zu nennen. Neben der Infrastruktur schließt das auch personelle Ressourcen und institutionelle Weiterbildungsangebote an den Hochschulen mit ein. Das heißt, um akurat Forschungsdatenmanagement zu betreiben, müssen verschiedene Strukturen ausgebaut werden. Einigen Standorten und Institutionen ist das bereits äußerst gut gelungen, jedoch ist es noch kein Standard.
Autor:inneninfo
Prof. Dr. Sandra Schulz
leitet seit 2020 die Arbeitsgruppe Didaktik der Informatik/Computer Science Education an der Universität Hamburg. Der Umgang mit Daten ist ein Forschungsschwerpunkt in der Arbeitsgruppe, dazu gehören auch Themen wie Data Literacy und KI Bildung. Kürzlich ist auch das Buch “Forschungsdatenmanagement in der Informatik” (DOI: 10.30819/5490) von Katarzyna Biernacka und Sandra Schulz im Logos Verlag erschienen.
Michael Wuppermann
leitet seit Sommer 2020 das erste eingerichtete eScience-Büro der Universität Hamburg an der Fakultät für Erziehungswissenschaft. Er beschäftigt sich allgemein mit Digitaler Transformation in der Forschung und den Themen Hard- und Software, Forschungsdatenmanagement und rechtliche Aspekte in der Forschung.
Forschungsdatenmanagement an der Universität Hamburg
Das Zentrum für nachhaltiges Forschungsdatenmanagement (ZFDM) unterstützt Forschende der Universität Hamburg in Fragen zum Thema Forschungsdatenmanagement und betreibt das Forschungsdatenrepositorium der Universität Hamburg.
Mitglieder der Universität Hamburg haben im Forschungsdatenrepositorium (FDR) die Möglichkeit, kostenlos ihre Forschungsdaten zu publizieren. Die Fakultät für Erziehungswissenschaft ist im FDR zudem mit einer Fachcommunity vertreten.
Weitere Informationen und Unterstützung zum Thema Forschungsdatenmanagement erhalten Forschende beim eScience-Büro der Fakultät für Erziehungswissenschaft oder direkt beim ZFDM.