Glossar
Auffindbarkeit
Auffindbarkeit bedeutet, dass Metadaten und Daten sowohl für Menschen als auch für Computer leicht zu finden sind. Wichtig dafür sind eine eindeutige und dauerhafte Kennung der Daten sowie maschinenlesbare Metadaten für die automatische Erkennung von Datensätzen. Auffindbarkeit ist eines der Hauptkriterien für FAIRe Daten.
Wilkinson, Mark D.; Dumontier, Michel; Aalbersberg, I. Jsbrand Jan; Appleton, Gabrielle; Axton, Myles; Baak, Arie et al. (2016): The FAIR Guiding Principles for scientific data management and stewardship. In: Sci Data 3 (1), S. 160018. DOI: 10.1038/sdata.2016.18. forschungsdaten.info (2023): FAIRe Daten. Online verfügbar unter https://forschungsdaten.info/themen/veroeffentlichen-und-archivieren/faire-daten/, zuletzt geprüft am 16.01.2024.
Cold Storage
Ein Cold Storage ist eine Speicherlösung für Daten, die nicht häufig gebraucht werden. Daher werden Speichermedien eingesetzt, die auf lange Speicherzeiten, große Kapazitäten, Langlebigkeit und kosteneffiziente Nutzung ausgerichtet sind. Typische Anwendungen sind Datensicherungen, Archivierung von Daten mit gesetzlichen Aufbewahrungsfristen oder historische Archive, die selten benötigt werden.
Ehneß, Jürgen; Luber, Stefan (2019): Was ist Cold Storage? In: Storage-Insider, 24.04.2019. Online verfügbar unter https://www.storage-insider.de/was-ist-cold-storage-a-816004/, zuletzt geprüft am 10.08.2023.
Data Steward
Der Data Steward ist die Ansprechperson für Forschende bei Fragen zum Thema zum Forschungsdatenmanagement. Diese Person berät und unterstützt dabei, Daten zu organisieren und Datenmanagementpläne zu erstellen.
Chue Hong, Neil P.; Katz, Daniel S.; Barker, Michelle; Lamprecht, Anna-Lena; Martinez, Carlos; Psomopoulos, Fotis E. et al. (2021): FAIR Principles for Research Software (FAIR4RS Principles). Research Data Alliance. DOI: 10.15497/RDA00068.
Dateiformat
Das Dateiformat wird bei der Speicherung von Daten erstellt und beinhaltet Informationen über die innere Struktur der Daten in einer Datei. Beispiele für Dateiformate sind: .doc, .txt, .pdf, .html, .jpg, .gif und .mp3.
ITWissen.info (2024): Dateiformat. Online verfügbar unter https://www.itwissen.info/Dateiformat-file-format.html, zuletzt geprüft am 06.12.2023.
Datenart
Es gibt verschiedene Arten von Daten, die je nach Art der gespeicherten Informationen und ihrer Verwendung kategorisiert werden können. Dazu gehören beispielsweise strukturierte Daten wie Tabellen und Datenbanken, unstrukturierte Daten wie Texte, Bilder und Videos sowie semi-strukturierte Daten wie XML-Dateien.
Institut für Integrierte Produktion Hannover (2023): Was ist Datenmanagement? Definition und Umsetzung. Online verfügbar unter https://www.iph-hannover.de/de/dienstleistungen/data-science/datenmanagement/, zuletzt geprüft am 06.12.2023.
Datenelement
Das Datenelement ist die kleinste Einheit eines Datensatzes. Beispielsweise setzt sich die Information "Zeitpunkt der letzten Bearbeitung dieses Dokuments" aus zwei Datenelementen zusammen: Datum und Uhrzeit.
Wirtschaftslexikon (2023): Datenelement. Online verfügbar unter https://www.wirtschaftslexikon24.com/d/datenelement/datenelement.htm, zuletzt geprüft am 16.08.2023.
Datenkuration
Die aktive und laufende Datenverwaltung während des gesamten Datenlebenszyklus wird als Datenkuration bezeichnet. Dazu gehören insbesondere Managementaktivitäten, um Forschungsdaten (langfristig) für die Wiederverwendung zu pflegen.
Chue Hong, Neil P.; Katz, Daniel S.; Barker, Michelle; Lamprecht, Anna-Lena; Martinez, Carlos; Psomopoulos, Fotis E. et al. (2021): FAIR Principles for Research Software (FAIR4RS Principles). Research Data Alliance. DOI: 10.15497/RDA00068.
Datenprovenienz
Die Dokumentation über die Herkunft von Daten und die Prozesse und Methoden, mit denen die Daten produziert wurden, wird als Datenprovenienz bezeichnet.
eResearch Alliance (2023): Explain! Data Provenance | eResearch Alliance. Online verfügbar unter https://www.eresearch.uni-goettingen.de/knowledge-base/explain-data/explain-data-provenance/, zuletzt geprüft am 09.08.2023.
FAIR-Prinzipien
Das Ziel der FAIR-Prinzipien für das wissenschaftliche Datenmanagement ist es die Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit digitaler Ressourcen zu verbessern.
GO FAIR (2022): FAIR Principles - GO FAIR. Online verfügbar unter https://www.go-fair.org/fair-principles/, zuletzt geprüft am 10.08.2023.
FAIRsharing
FAIRsharing ist ein webbasiertes, kuratiertes Portal mit Ressourcen zu Daten- und Metadatenstandards, Datenbanken und Forschungsdatenpolicies.
re3data.org (2023): FAIRsharing. Online verfügbar unter https://www.re3data.org/repository/r3d100010142, zuletzt geprüft am 06.12.2023.
Interoperabilität
Interoperabilität ist die Fähigkeit des nahtlosen Zusammenspiels zwischen unterschiedlichen Systemen. Interoperable Systeme sind in der Lage, Daten auf effiziente Weise auszutauschen, sie maschinell zu interpretieren und automatisiert mit anderen Datensätzen zu kombinieren. Interoperabilität ist eines der Hauptkriterien für FAIRe Daten.
forschungsdaten.info (2023): Glossar. Interoperabilität. Online verfügbar unter https://forschungsdaten.info/praxis-kompakt/glossar/#c274055, zuletzt geprüft am 19.02.2024.
Metadaten
Metadaten sind unabhängige Daten, die strukturierte Informationen über andere Daten bzw. Ressourcen und deren Merkmale enthalten. Sie werden unabhängig oder zusammen mit den Daten, die sie näher beschreiben, abgespeichert.
forschungsdaten.info (2023): Glossar. Metadaten. Online verfügbar unter https://forschungsdaten.info/praxis-kompakt/glossar/#c269911, zuletzt geprüft am 06.12.2023.
Metadatenstandard
Metadatenstandards bieten Regeln zur inhaltlich und strukturell gleichförmigen Beschreibung von Forschungsdaten. Eine Standardisierung der verwendeten Felder und Werte hilft dabei, verschiedene Datensätze miteinander in Beziehung zu setzen und auch über Institutions-, Sprach- und Disziplingrenzen hinweg auffindbar und verständlich zu machen.
Kontaktstelle Forschungsdatenmanagement (2023): Metadaten und Metadatenstandards. Friedrich-Schiller-Universität Jena. Online verfügbar unter https://www.researchdata.uni-jena.de/information/metadatenstandards, zuletzt geprüft am 06.12.2023. forschungsdaten.info (2023): Metadaten und Metadatenstandards. Beschreiben hilft verstehen. Online verfügbar unter https://forschungsdaten.info/themen/beschreiben-und-dokumentieren/metadaten-und-metadatenstandards/, zuletzt geprüft am 19.02.2024.
Ontologie
Eine Ontologie beschreibt einen Wissensbereich mit Hilfe einer Sammlung von standardisierten Begriffen (einer sogenannten Terminologie) und legt auch die Beziehungen zwischen den definierten Begriffen fest. Häufig werden Ontologien auch als kontrolliertes Vokabular mit festgelegten Verwandtschaftsbeziehungen (genannt Taxonomie) definiert.
Wolfgang Hesse (2005): Ontologie(n). Gesellschaft für Informatik. Online verfügbar unter https://gi.de/informatiklexikon/ontologien, zuletzt geprüft am 06.12.2023.
Personenbezogene Daten
Das Bundesdatenschutzgesetz (BDSG) definiert personenbezogene Daten als „Einzelangaben über persönliche oder sachliche Verhältnisse einer bestimmten oder bestimmbaren natürlichen Person (Betroffener)“. Daten können dann als personenbezogen gelten, wenn sie eindeutig einer bestimmten natürlichen Person zugeordnet werden können. Typische Beispiele sind Name, Beruf, Körpergröße oder Nationalität der Person.
forschungsdaten.info (2023): Glossar. Personenbezogene Daten. Online verfügbar unter https://forschungsdaten.info/praxis-kompakt/glossar/#c269858, zuletzt geprüft am 19.02.2024.
PPSR Core
PPSR Core ist eine Sammlung von globalen und transdisziplinären Daten- und Metadatenstandards für die Verwendung in partizipativer Forschung und Citizen Science-Projekten.
PPSR Core (2021): PPSR Core. Online verfügbar unter https://core.citizenscience.org/, zuletzt geprüft am 06.12.2023.
Pseudonymisierung
Pseudonymisierung bezeichnet den Prozess der Verarbeitung von personenbezogenen Daten mit dem Ziel den Bezug zu einer natürlichen Person zu verbergen. Häufig werden dabei eindeutige Merkmale einer Person wie beispielsweise der Name durch ein Pseudonym (einen Buchstaben- und/oder Zahlencode) ersetzt. Ist der Schlüssel zur Erstellung des Pseudonyms bekannt, kann dieser Bezug aber wiederhergestellt werden.
DSGVO in einfachen Worten (2023): Pseudonymisierung. Online verfügbar unter https://eu-datenschutz-grundverordnung.net/pseudonymisierung/, zuletzt geprüft am 06.12.2023.
Referenzdaten
Referenzdaten sind bereits existierende Daten, die zur Interpretation anderer Daten verwendet werden können. Ein Beispiel aus der Biologie ist "UniProt" (abgeleitet von "universal protein database", die größte bioinformatische Datenbank für Proteine aller Lebewesen und Viren) in den Biowissenschaften, aber auch Ressourcen wie einen "5-Jahres-Twitter-Trend" können dazu verwendet werden die eigenen Daten einzuordnen.
Mons, Barend (2018): Data Stewardship For Open Science: implementing FAIR principles. Boca Raton: CRC Press, Taylor & Francis Group.
Repositorium
Repositorien sind Speicherorte zur Aufbewahrung, Dokumentation und Publikation von digitalen Objekten. Sie können dazu beitragen, die Daten eines Forschenden besser auffindbar und zugänglich zu machen, um eine potenzielle Nachnutzung der Daten zu fördern. Dafür werden in Repositorien eindeutige und dauerhafte Identifikatoren vergeben und Daten mit umfangreichen und maschinenlesbaren Metadaten versehen, die sie über webbasierte Suchmaschinen im Internet auffindbar machen.
TU Wien (2023): Datenrepositorien. Online verfügbar unter https://www.tuwien.at/forschung/fti-support/forschungsdaten/fdm-infos-tipps/aufbewahren-und-publizieren/datenrepositorien, zuletzt geprüft am 06.12.2023.
Vokabular
Ein kontrolliertes Vokabular ist eine Sammlung von Worten, die eindeutig jeweils einem Begriff zugeordnet sind. Das bedeutet, es gibt keine Synonyme.
Wikipedia – Die freie Enzyklopädie (2021): Kontrolliertes Vokabular. Online verfügbar unter https://de.wikipedia.org/wiki/Kontrolliertes_Vokabular, zuletzt geprüft am 19.02.2024.
Forschungsdaten planen
Erstellen Sie einen Datenmanagementplan für Ihr Citizen Science-Projekt!