Themen

Forschungsdaten­­­management

Aus Sicht des RfII war der Umgang mit Forschungsdaten in Deutschland zum Zeitpunkt seiner Einsetzung im Jahr 2014 noch durch überwiegend schwach koordinierte, projektförmige Initiativen geprägt. Eine Grundversorgung der Forschenden mit niedrigschwelligen Services für das Forschungsdatenmanagement fehlte, und es bestand Handlungsbedarf in etlichen Feldern.

Dementsprechend hat der RfII dem Forschungsdatenmanagement sein erstes großes Positionspapier LEISTUNG AUS VIELFALT (2016) gewidmet. Neben einer Strukturierung der Materien und der Definition wichtiger Schlüsselbegriffe wird darin eine detaillierte, auch deutlich formulierte Diagnostik geboten. Die Spanne der Empfehlungen reicht von kurzfristig wirksamen Anpassungen (z. B. der Evaluation von Drittmittelanträgen) bis zu langfristig wirksamen Gestaltungsaufgaben, insbesondere dem Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI), die in den folgenden Jahren vom Bund und allen Ländern aufgegriffen und 2020 gegründet wurde.

Zu den besonderen Anforderungen der Forschung mit personenbezogenen Daten hat sich der RfII 2017 im Empfehlungspapier Datenschutz und Forschungsdaten geäußert. Im Interesse der Wissenschaft plädiert der RfII dafür, in der Umsetzung der europäischen Datenschutzgrundverordnung (DSGVO) die wissenschaftliche Nutzung personenbezogener Daten mit Augenmaß zu erleichtern und gibt dafür einige konkrete Impulse, u.a. bezüglich der Einrichtung von Datentreuhändern.

Der erste FACHBERICHT LÄNDERANALYSEN (2017) stellt parallele Entwicklungen und Pfadentscheidungen in Kanada, Großbritannien, den Niederlanden und Australien dar. Aus solchen Fallbeispielen leitet der RfII eine Reihe von Anregungen ab, die z. B. beim Aufbau der Nationalen Forschungsdateninfrastruktur (NFDI) hilfreich sind. Angesichts der komplexen paneuropäischen Entwicklungen, insbesondere dem Aufbau der European Open Science Cloud (EOSC), hat sich der Rat zuletzt diesem Bereich verstärkt zugewandt und mehrere Publikationen auch erfolgreich in internationale Institutionen hineingetragen. Ein weiterer Fachbericht zu Entwicklungen in europäischen Ländern und zur EOSC soll voraussichtlich 2022 veröffentlicht werden.

Mit der Stellungnahme zu aktuellen Entwicklungen rund um Open Access und Open Data reagierte der RfII 2019 auf die Novellierung der europäischen Open Data Richtlinie und positioniert sich auch zur „transition to openness“ im wissenschaftlichen Publikationssystem.

Angesichts vielfältiger Diskussionen zu diesem Thema hat der RfII 2021 in einem Positionspapier Empfehlungen zu „Nutzung und Verwertung von Daten im wissenschaftlichen Raum“ gegeben. Hierin hat er über die innerwissenschaftliche Nutzung und Verwertung noch hinausgehend auch Modelle der Vermarktung von digitalen Daten in unterschiedlichen Datendiensten an den Schnittstellen von Wissenschaft, Wirtschaft, Zivilgesellschaft und Verwaltung untersucht. Anhand einer Analyse und vergleichenden Bewertung von mehr als vierzig Datendiensten aus unterschiedlichen Domänen leitet er Empfehlungen ab, wie Wettbewerb und Pluralität unter den Datendiensten zum größtmöglichen Nutzen der Wissenschaft gewährleistet werden können. Dabei schreibt er der öffentlichen Hand als Garantin für fairen Wettbewerb und für langfristige Datensicherung wie auch der Nationalen Forschungsdateninfrastruktur (NFDI) als Mittlerin zwischen wissenschaftlichen Nutzungsbedürfnissen und teilweise kommerziell ausgerichteten Datendiensten und Serviceangeboten wichtige Rollen zu.

Empfehlungen des RfII

Leistung aus Vielfalt. Empfehlungen zu Strukturen, Prozessen und Finanzierung des Forschungsdatenmanagements in Deutschland, Göttingen 2016, 160 S.

Entwicklung von Forschungsdateninfrastrukturen im internationalen Vergleich. Bericht und Anregungen, Göttingen 2017, 93 S.

Stellungnahme des Rates für Informationsinfrastrukturen (RfII) zu den aktuellen Entwicklungen rund um Open Data und Open Access, Göttingen, 2019, 8 S.

Nutzung und Verwertung von Daten im wissenschaftlichen Raum − Empfehlungen zur Ausgestaltung von Datendiensten an der Schnittstelle zwischen Wissenschaft und Wirtschaft, Göttingen 2021, 120 S.

Weitere Publikationen

DOKUMENTE

Nationale Forschungsdaten­infrastruktur (NFDI)

Eine zentrale Empfehlung des RfII lautete 2016, eine koordinierte Forschungsdateninfrastruktur für Deutschland (NFDI) aufzubauen. Der RfII schlug vor, mit diesem neuartigen Konstrukt einen langfristigen Entwicklungspfad einzuschlagen. Die noch schwach koordinierte und zum Teil nicht nachhaltig geförderte Landschaft der Dateninfrastrukturen in der Wissenschaft wird so in eine effizientere und kooperativere Richtung gelenkt. Eine Systematisierung der Datenbestände, gute Zugänglichkeit der Forschungsdaten und kontinuierliche Weiterentwicklung der Dienste stärken die Forschung in Deutschland und ihre globale Wettbewerbsposition.

Der RfII hat flankierend zum Aushandlungsprozess in der gemeinsamen Wissenschaftskonferenz 2018 und 2019 eine Serie von Diskussionsimpulsen publiziert, die das Grundkonzept der NFDI skizzieren und einen frühen Diskurs in den wissenschaftlichen Fachgemeinschaften/Communities stimulieren sollten. Die NFDI ist als ein arbeitsteilig angelegtes, bundesweites und in Stufen aufzubauendes Netzwerk konzipiert. Sie soll ein verlässliches und nachhaltiges Dienste-Portfolio bereitstellen, welches generische und fachspezifische Bedarfe des Forschungsdatenmanagements in Deutschland abdeckt. Die NFDI entsteht stufenweise und wissenschaftsgetrieben. Ihre Dienste stehen Forschenden fach-, institutionen- sowie bundesländerübergreifend zur Verfügung.

Mit Programmbeginn am 1. Januar 2019 ging die Verantwortung für die Realisierung der NFDI in die Hände der Aktiven über. Nach ihrer Einsetzung begleitet der RfII die weitere Entwicklung. Flankierend zu den Aufbauarbeiten der NFDI und EOSC hat er 2020 den übergreifenden Diskussionsimpuls Datendienste nachhaltig gestalten herausgegeben.

Weiterführende Informationen zur Realisierung der NFDI sowie eine Übersicht der Akteure und ihrer Informationsangebote finden Sie auf https://www.nfdi.de/

Diskussionsimpulse des RfII

Datendienste nachhaltig gestalten. Ein Diskussionsimpuls zur Weiterentwicklung von Forschungsdateninfrastrukturen, Göttingen 2020, 6 S.

In der Breite und forschungsnah: Handlungsfähige Konsortien. Dritter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland, Göttingen 2018, 6 S.

Zusammenarbeit als Chance. Zweiter Diskussionsimpuls zur Ausgestaltung einer Nationalen Forschungsdateninfrastruktur (NFDI) für die Wissenschaft in Deutschland, Göttingen 2018, 4 S.

Weitere Publikationen

DOKUMENTE

Datenqualität

An Daten aus der wissenschaftlichen Forschung werden aus gutem Grund besonders hohe Maßstäbe angelegt. Wissenschaftlichkeit steht für Qualität – und Qualität über den gesamten Datenlebenszyklus hinweg sichert Wissenschaftlichkeit. Der RfII fordert daher in seinem 2019 erarbeiteten Positionspapier HERAUSFORDERUNG DATENQUALITÄT, der Aufgabe einer wissenschaftlichen Qualitätssicherung von Daten mehr Aufmerksamkeit zu widmen, und empfiehlt, die Dokumentation von Forschungsdaten als methodische Kernaufgabe in der Forschungspraxis zu verankern. Dem Wissenstransfer kann die Entwicklung von qualitätsgesicherten Datenprodukten einen positiven Schub geben. Hochschulen und Wissenschaftsorganisationen fordert der RfII auf, die Sicherung und Steigerung der Datenqualität in ihre jeweiligen Forschungsstrategien zu integrieren. Auch die Forschungsförderung kann hier Anreize setzen und zeitliche Freiräume gewähren. Zu den förderpolitischen Empfehlungen zählen auch die Unterstützung genuiner Datenprodukte und deren Anerkennung – zum Beispiel durch das Ausloben von Preisen, den Aufbau einer Begutachtungskultur für Daten und der stärkeren Berücksichtigung datenbezogener Leistungen bei Berufungen. Bund und Länder fordert der RfII auf, in ihrem Bemühen, Perspektiven für die Weiterentwicklung der Forschungsdateninfrastruktur zu schaffen, nicht nachzulassen und hier auch Infrastrukturen und Services außerhalb der NFDI weiterhin im Blick zu behalten.

„Datenqualität“ sieht der RfII als ein Thema an, mit welchem sich Wissenschaft und Politik bislang eher wenig auseinandersetzen und das – stärker als andere – aktiv „gesetzt“ werden muss. Deshalb möchte er die im Positionspapier beschriebenen Herausforderungen durch einen übergreifenden Qualitätsdiskurs stärker thematisieren. Hierzu hat der Rat mit Unterstützung der VolkswagenStiftung im Februar 2020 eine interdisziplinäre Konferenz auf Schloss Herrenhausen in Hannover abgehalten, die sehr gut besucht war und ein breites Echo gefunden hat.

Empfehlungen des RfII

Herausforderung Datenqualität – Empfehlungen zur Zukunftsfähigkeit von Forschung im digitalen Wandel, zweite Auflage, Göttingen 2019, 172 S.

RfII-Tagungsdokumentation „Herausforderung Datenqualität“, Februar 2020 in Hannover, Göttingen, 6 S.


Kompetenz­entwicklung

Die fortschreitende Digitalisierung der Arbeitswelt und insbesondere der Wissenschaft erfordert mit großer Dringlichkeit mehr Fachpersonal für Datenmanagement und -analyse, wie auch neue methodische Kompetenzen in den Fachwissenschaften. Gleichzeitig fehlt es jedoch an konkreten Aus- und Weiterbildungsmöglichkeiten, die neben den technischen auch den speziellen organisatorischen und fachwissenschaftlich-inhaltlichen Anforderungen der Wissenschaft gerecht werden.

Der RfII rückt daher in seinem 2019 veröffentlichten Empfehlungspapier Digitale Kompetenzen – dringend gesucht! den Arbeitsmarkt Wissenschaft in den Mittelpunkt. Ausgehend von sich verändernden Aufgaben, Prozessen und Organisationsformen betrachtet er die besonderen Herausforderungen in diesem Arbeitsmarktsegment. Dazu gehören beispielsweise eine hohe Befristungsquote, ein stark formalisiertes Tarif- und Entgeltsystem, oder die zunehmende „Verwissenschaftlichung“ von forschungsnahen Unterstützungsaufgaben. Letztere erfordern aus Sicht des RfII eine engere Verzahnung des Personals im Forschungs- und Infrastrukturbereich. Angesichts der hohen Konkurrenz am Arbeitsmarkt plädiert der RfII dafür, Wissenschaft als ein Netzwerk mit gemeinsamen Personalentwicklungsinteressen aufzufassen und verstärkt auf gemeinschaftlich organisierte, wissenschaftsspezifische Lösungen zu setzen.

Sowohl Hochschulen als auch außeruniversitäre Forschungseinrichtungen haben als Lehr- und Lernorganisationen aus Sicht des RfII grundsätzlich gute Voraussetzungen für Qualifizierung. Sie sind aber auch gefordert, ihre Rolle als Ausbildungsstätten und Personalentwickler aktiv wahrzunehmen. Gleichwohl gilt es auch, die öffentlich-rechtlichen Beschäftigungsverhältnisse im Wissenschaftsbereich mit Hilfe von Bund und Ländern attraktiv und konkurrenzfähig auszugestalten.

Empfehlungen des RfII

Digitale Kompetenzen – dringend gesucht! Empfehlungen zu Berufs- und Ausbildungsperspektiven für den Arbeitsmarkt Wissenschaft, Göttingen 2019, 56 S.


Schlüsselbegriffe

Die Teilprobleme im Themengebiet des RfII sind oft komplex und voraussetzungsreich. Daher nimmt der RfII in Abständen Klärungen wichtiger Begriffe und ihrer Übertragbarkeit ins Englische vor. Die Verwendung einer einsichtigen und einheitlichen Terminologie ist unverzichtbar für einen informierten Diskurs.

[data quality]

Diese Begriffsklärung wurde 2017 in überarbeiteter Fassung vom RfII verabschiedet

Der Begriff Datenqualität bezeichnet sowohl allgemeine, u. a. unter Methodengesichtspunkten geforderte, typische Eigenschaften der Daten selbst als auch deren durch qualitätssichernde Maßnahmen ggf. zusätzlich geschaffene Eignung für eine weitere Nutzung. Die Bewertung von Datenqualität richtet sich zum einen nach den abhängig von der jeweiligen Forschungsfrage und damit von der Verwendung zur Erarbeitung eines Forschungsergebnisses zu definierenden Ansprüchen an die Daten. Diese umfassen etwa die Genauigkeit von Messwerten, die Zuverlässigkeit eines empirisch gewonnenen Ergebnisses, die Vollständigkeit oder Aktualität von Daten und die Dokumentation der Datengewinnung und der Datenspeicherung. Darüber hinaus sind aber auch Nachhaltigkeitsgesichtspunkte von der Bewertung der spezifischen Qualität von Daten nicht zu trennen. Solche Gesichtspunkte umfassen die Datenbeschaffenheit, etwa die Transferierbarkeit der Daten, die Haltbarkeit von Datenträgern etc. Sie betreffen insbesondere die vorausschauende Haltung von Forschungsdaten für spätere, idealerweise viele und ggf. auch noch unbekannte, Formen der wissenschaftlichen, wirtschaftlichen und gesellschaftlichen Nutzung. Unter dem Gesichtspunkt einer weiteren Nutzung („Nachnutzung“) wird Datenqualität dadurch bestimmt, dass Datensätze und -sammlungen leicht zu recherchieren/findbar sind, sowie dass sie ausreichend Zusatzinformationen beinhalten. Diese sollten in Form von möglichst standardisierten technischen und fachlichen Metadaten zu Qualitätsaspekten vorliegen und Auskunft über die Datengenerierung, Weiterverarbeitung und die verwendeten Instrumente und Methoden geben. Voraussetzung für die Nachvollziehbarkeit und wenn möglich Nachnutzung von digitalen Forschungsergebnissen ist, dass die enthaltenen Daten bezüglich der ihnen zugrundeliegenden Datenmodelle (verwendete Vokabulare, Formate, etc.) und der verwendeten Methoden (etwa Messgeräte, Befragungen, Algorithmen etc.) umfassend dokumentiert sind. Wo immer möglich, sollten nicht nur Metadaten, sondern auch weitergehende, ggf. spezielle Dokumentationen, anerkannten, verfügbaren Standards folgen. Die – auch langfristige – Verfügbarkeit, Zugänglichkeit und Zitierbarkeit von Forschungsdaten einschließlich ihrer Metadaten sind wiederum Aspekte der Qualität von Informationsinfrastrukturen und -services, welche die sichere Speicherung, das zielgenaue Auffinden (Retrieval), den Zugriff auf die Daten und ihre Nachnutzung (auch im Kontext der Langzeitarchivierung) ermöglichen. Die Klärung von rechtlichen Rahmenbedingungen einer möglichen Datennutzung gehört, im Zusammenhang mit informationsinfrastrukturellen Diensten, ebenfalls zur Datenqualität.

RfII (2017) – Arbeitsthema Datenqualität (unveröffentlicht), S. 11

[information infrastructures (RfII), e-infrastructures (EU)]

Informationsinfrastrukturen sind technisch und organisatorisch vernetzte Dienste und Angebote für den Zugang zu und die Erhaltung von Daten-, Informations- und Wissensbeständen. Im Sinne des RfII dienen sie primär Forschungszwecken, sie sind häufig Forschungsgegenstand und haben stets eine ermöglichende Funktion.

Informationsinfrastrukturen müssen berücksichtigen, dass Wissensbestände in Universitäten, Forschungseinrichtungen, Archiven, Bibliotheken und Museen in analogen, digitalen oder in Mischformen vorliegen. Die digitale Erschließung analoger Wissensbestände zielt auf die Integration und Konvergenz zwischen digitalisierten und nativ digitalen Daten in einheitlichen, integrierten Arbeitsumgebungen mit dem Ziel dynamischer Wissensintegration. Wie der englische Ausdruck ‚e-Infrastructures‘ referenziert deshalb auch der deutsche Begriff ‚Informationsinfrastrukturen‘ zunehmend auf digitale Informations- und Kommunikationstechnologien für die Forschung.

Die Leistungsfähigkeit von digitalen Informationsinfrastrukturen hängt maßgeblich von den Investitionen für die Erschließung der Inhalte, nutzungsfreundlichen Zugangsformen, technischer Ausstattung, internationalen Standards und effektiven Werkzeugen ab. Ebenso relevant ist die informationsfachliche Kompetenz von Nutzern und Personal und – damit zusammenhängend – die Qualität passgenauer Dienstleistungen.

[research data, research data management]

Diese Begriffsklärung wurde 2017 in überarbeiteter Fassung vom RfII verabschiedet

FORSCHUNGSDATEN sind nicht allein die (End-)Ergebnisse von Forschung. Es handelt sich vielmehr um jegliche Daten, die im Zuge wissenschaftlichen Arbeitens entstehen, z. B. durch Beobachtungen, Experimente, Simulationsrechnungen, Erhebungen, Befragungen, Quellenforschungen, Aufzeichnungen, Digitalisierung, Auswertungen. Zu Forschungsdaten werden auch solche, nicht selbst gewonnenen Daten, auf die die Wissenschaft zu Forschungszwecken zugreift, um sie für den konkreten Forschungsprozess als methodisch erforderliche Grundlage zu nutzen. Dies ist z.B. gegeben, wenn amtliche Statistiken oder andere Behördendaten oder Produkte nichtwissenschaftlicher Dienstleister wissenschaftlich verarbeitet werden. Dass auch die verwendeten Forschungswerkzeuge sowie die mitlaufend entstehenden Spuren wissenschaftlicher Arbeit – also Prozessdaten, wie sie namentlich die digitale Forschung vielfach automatisch hervorbringt – zu den Forschungsdaten zählen, ist überall dort von Bedeutung, wo die Dokumentation und Archivierung von Forschungsprozessen und Forschungsdaten zu deren Qualitätssicherung gehört oder aber unter Nachhaltigkeitsgesichtspunkten sowie für die historische Forschung geboten ist.

Pragmatisch, wenn auch nicht immer trennscharf, lassen sich Forschungsdaten von METADATEN unterscheiden. Metadaten dokumentieren und kontextualisieren den Entstehungsprozess von Forschungsdaten. Im Forschungsprozess können Metadaten selbst wieder Gegenstand von Forschung werden, was u.a. für den Lebenszyklus von Forschungsdaten von Bedeutung ist.

Das FORSCHUNGSDATENMANAGEMENT umfasst alle – über das Forscherhandeln im engeren Sinne hinaus auch organisationsbezogenen – Maßnahmen, die getroffen werden müssen, um qualitätsvolle Daten zu gewinnen, um die gute wissenschaftliche Praxis im Datenlebenszyklus einzuhalten, um Ergebnisse reproduzierbar zu machen und um ggf. bestehenden Dokumentationsverpflichtungen Rechnung zu tragen (z.B. im Gesundheitswesen). Auch ist die (ggf. domänenübergreifende) Verfügbarkeit von Daten zur Nachnutzung ein wichtiger Punkt. Zunehmend finden Datenmanagementpläne in wissenschaftlichen Institutionen Anwendung. Datenmanagementpläne, die zu Anfang eines Projekts entwickelt und niedergelegt werden oder das Ergebnis einer Forschungsarbeit sind, sollen die zu nutzen-den und zu generierenden Daten und die notwendigen Dokumentationen, Metadaten und Standards beschreiben, mögliche rechtliche Einschränkungen (z. B. Datenschutz) rechtzeitig benennen, benötigte Speicherressourcen einplanen sowie Kriterien festlegen, welche Daten Externen in welcher Form verfügbar gemacht werden und wie die Daten langfristig zu sichern sind. Auf der Organisationsebene müssen forschende Einrichtungen (z. B. Hochschulen) den Zugang zu entsprechenden Infrastrukturdiensten innerhalb der Einrichtung (z. B. durch Auf- und Ausbau passender Kapazitäten) oder in Zusammenarbeit mit externen Partnern (durch Kooperationsverträge etc.) ermöglichen. Dabei sollte aktiv auch auf das übergeordnete Ziel einer domänenübergreifenden, wissenschaftsweiten Datennutzung hingearbeitet werden.

Arbeitspapiere des RfII

Begriffsklärungen: Bericht des Redaktionsausschusses Begriffe an den RfII (RfII Berichte No. 1), Göttingen 2016, 31 S.