Forschungsdaten dokumentieren & aufbereiten
Warum und wie sind Forschungsdaten zu dokumentieren? Bei der Dokumentation von Forschungsdaten geht es darum, Daten und Forschungsergebnisse, die auf diesen Daten beruhen, nutzbar und nachvollziehbar zu machen. Dies ist sowohl für die eigene Arbeit – jetzt und in Zukunft, die Arbeit im Team, als auch für Dritte notwendig, die die Forschungsdaten nachnutzen wollen. Auf dieser Seite erfahren Sie, was bei der Dokumentation von Forschungsdaten zu beachten ist.
Hier gelangen Sie zu den einzelnen Inhalten:
Warum dokumentieren? – NachvollziehbarkeitWas bedeutet Dokumentation?Wie umfangreich soll ich dokumentieren?Welche Inhalte soll ich dokumentieren?How-to Forschungsdaten dokumentieren & aufbereitenInside VerbundFDB: Was sind „Metadaten“?Weiterführende Informationen und Quellen
Warum dokumentieren? – Nachvollziehbarkeit
Dokumentation gehört nicht zu den beliebtesten oder angesehensten Tätigkeiten wissenschaftlicher Praxis. Sie ist meist aufwendiger als erwartet und erfolgt häufig erst am Ende eines Projekts. Dennoch gilt: Dokumentation gehört zu den wichtigsten Tätigkeiten wissenschaftlichen Arbeitens. Dokumentation macht Daten und die darauf beruhenden Forschungsbefunde nachvollziehbar. Sie ist Teil der Guten Wissenschaftlichen Praxis, sorgt für Transparenz und Legitimität von Wissenschaft.
Im Stamp, dem „Standardisierten Datenmanagementplan für die Bildungsforschung“ ist folgender Standard definiert:
„Daten und Begleitmaterialien werden im Projektverlauf so verarbeitet und dokumentiert, dass Projektbeteiligte ebenso wie Dritte 1) die gesamte Datengenese nachvollziehen und 2) die Daten und Begleitmaterialien im Projekt ebenso wie in neuen Vorhaben nutzen können.“
Was bedeutet Dokumentation?
Der Begriff Dokumentation bezeichnet die Beschreibung der Daten, die als eine Art Bedienungsanleitung für diese fungiert. Zur Dokumentation von Forschungsdaten gehört eine systematische Benennung der Dateien selbst ebenso wie die Ergänzung der Daten um zusätzliche, die Studie und den Erhebungsprozess beschreibende Informationen.
Wir dokumentieren, damit die Daten
- interpretierbar und nachvollziehbar sind.
- langfristig und personenunabhängig verstanden werden.
- sichtbar und wiederauffindbar sind, etwa in Datenbestandskatalogen.
Wie umfangreich soll ich dokumentieren?
Bei der Dokumentation ist es hilfreich zu überlegen für welche Zwecke, welche Informationen erforderlich sind. Diese Überlegung kann dabei helfen zu entscheiden, wie tiefgehend oder umfangreich Sie dokumentieren.
- Welche Informationen benötigen Rezipienten Ihrer Arbeit, um beurteilen zu können, wie aussagekräftig und repräsentativ die Daten und Forschungsergebnisse sind?
- Welche Informationen benötigen Sekundärnutzende, um die Forschungsdaten für eigene Forschungsfragen auswerten zu können?
- Welche Informationen benötigen Sekundärnutzende, um die durchgeführten Analysen replizieren zu können?
- Welche Informationen benötigen Projektmitarbeitende, die nicht an der Datenerhebung beteiligt waren?
- Welche Informationen benötigen Projektmitarbeitende, die nicht an der Datenaufbereitung und/oder den Datenanalysen mitgearbeitet haben?
- Welche Informationen benötige ich selbst, wenn ich nach einigen Jahren meine Ergebnisse replizieren möchte oder die Daten für neue Forschungsfragen auswerten möchte?
Welche Inhalte soll ich dokumentieren?
Um zu überblicken, welche Inhalte zu dokumentieren sind, gibt es zwei Herangehensweisen – das Dokumentieren entlang des Datenlebenszyklus oder das Dokumentieren entlang der verschiedenen Kontexte der Daten.
Informationen entlang des Datenlebenszyklus
- Forschungsdesign: Was sollte wie erhoben werden, um welche Forschungsfragen zu untersuchen?
- Datenerhebung: Was wurde wie erhoben?
- Datenaufbereitung: Schritte von den Rohdaten bis zu den aufbereiteten und zu analysierenden Daten
- Datenanalyse: Wie ist der Forschungsbefund entstanden?
Informationen hierzu finden sich üblicherweise in Codebüchern und Methodenberichten.
Informationen entlang der verschiedenen Kontexte:
In der qualitativen Forschung wird im Zusammenhang mit Dokumentation häufig von Kontextualisierung gesprochen und auf die Bedeutung des Kontextes für die Interpretation qualitativer Daten hingewiesen.
Verschiedene Arten von Kontext können unterschieden werden (vgl. Bishop 2006):
- der extra-situationale Kontext: projektspezifische Informationen, aber auch der kulturelle, soziopolitische oder historische Kontext
- der situationale Kontext: Merkmale der Beteiligten, Raum und Zeit, Setting; Informationen dazu finden sich etwa in Feld- oder Interviewnotizen
- der konversationale, kommunikative Kontext: Video-/Audioaufzeichnungen, Transkripte, Beobachtungsprotokolle; hier finden sich Informationen über Wechsel der Sprechenden, Sequenzen, Überlappungen, Pausen, non-verbale Kommunikation
Projektbegleitend fortlaufend zu dokumentieren ist weniger aufwendig als die nachträgliche Dokumentation eines Projekts.
How-to Forschungsdaten dokumentieren & aufbereiten
Übersicht über die einzelnen Aufgaben:
Erstellen Sie einen Methodenbericht.Dokumentieren Sie die Forschungsinstrumente.Erfassen Sie Informationen zur Datenerhebung und zur Feldphase.Erfassen Sie Informationen zur Datenaufbereitung und Transkription.Erfassen Sie Informationen zu Datenschutz und Anonymisierung.Erfassen Sie Informationen zur Datenanalyse.Erfassen Sie Informationen zu den Datensätzen und Datendateien.
Erstellen Sie einen Methodenbericht.
In einem Methodenbericht beschreiben Sie das Forschungsdesign, machen Angaben zu Grundgesamtheit sowie Stichprobe, beschreiben die Feldphase und die nachfolgenden Datenverarbeitungen. Methodenberichte werden manchmal auch als Feldberichte, Technical Report oder Studienreport bezeichnet.
Bei der Erstellung eines Methodenberichts können Sie verschiedene Hilfsmittel nutzen:
Stamp-Methodenbericht-Generator in RDMO
Checkliste zur Nachvollziehbarkeit im Stamp
Handreichung des VerbundFDB zur Erstellung eines Methodenberichts
Die Hilfsmittel enthalten Angaben dazu, was ein Methodenbericht enthalten sollte.
Beispiele für Methoden- und Feldberichte qualitativer Forschung:
Projekt Digitale Bildungspraktiken von Studierenden (DEPS)
Projekt Kulturelle Bildung und Inklusion (KuBIn)
Projekt Perceived Responsibility of Adult Education Practitioners (PRAEP)
Beispiele für Methodenberichte quantitativer Surveys:
Studie zur Entwicklung von Ganztagsschulen (StEG – Systemmonitoring 2018)
Studie Die Wahl des schulischen Fremdsprachenprofils (Dokumentation der Grundschulerhebung)
iFQ Wissenschaftler-Befragung 2010
Projekt Sprachbildung und -entwicklung im Kita-Alltag in Nordrhein-Westfalen (SEIKA-NRW)
Dokumentieren Sie die Forschungsinstrumente.
Fügen Sie die Forschungsinstrumente, die zur Erhebung und Messung eingesetzt wurden, wie Fragebogen, Listen- und Kartensätze, Testinstrumente, Ratingbögen, Leitfäden oder Beobachtungsprotokolle der Dokumentation bei. Wenn Sie Forschungsinstrumente nachgenutzt haben, dokumentieren Sie deren Nutzung.
Erfassen Sie Informationen zur Datenerhebung und zur Feldphase.
Hierzu gehören Interviewendenanweisungen, Kontaktprotokolle, Notizen zum Kontext und/oder Setting, Feldnotizen oder Postskripte, Dokumentations- oder Kontextualisierungsbogen. Diese Dokumente enthalten Angaben zu organisatorischen und interpersonellen Rahmenbedingungen während der Datenerhebung und Feldphase.
Dokumentations- oder Kontextualisierungsbögen dienen der Kontextualisierung der konkreten Erhebungssituation, etwa bei Interviews, Gruppendiskussion, Beobachtungen oder Videographien. Diese Bögen können Sie beispielsweise den Transkripten als Deckblatt hinzufügen oder als eigenständige Dokumente der Dokumentation beigefügen.
Erfassen Sie Informationen zur Datenaufbereitung und Transkription.
Hierzu gehörenTranskriptionsregeln, Codierregeln, Codierungen, Gewichtungsvariablen, imputierte Werte, sonstige generierte Variablen, Angaben zu durchgeführten Plausibilitäts-, Konsistenz- und Fehlerkontrollen. Diese Informationen können Sie im Rahmen von Codebüchern, Skalenhandbüchern, Datenhandbüchern dokumentieren und innerhalb der Syntax.
Hinweise zur Transkription
Form und Genauigkeit der Transkription entscheiden über die Möglichkeiten der Auswertung und Analyse – was nicht im Transkript übernommen wurde, ist für Analysen, die rein auf dem Transkriptionstext beruhen, nicht mehr existent. Transkriptionen umfassen die Verschriftlichung
- von Gesprochenem: Worte, Wortfolgen, gegebenenfalls lautliche Gestaltung, die Rede begleitende nicht sprachliche Gesten oder Handlungen
- von Beobachtetem: auditiv oder audiovisuell aufgezeichnete Daten
Über den Sprachtext hinaus können etwa Pausen, Dehnungen, Verzögerungen, Schweigephasen, gleichzeitiges Sprechen, Änderungen in Lautstärke und Sprechgeschwindigkeit beschrieben werden. Bei Videoaufnahmen können die nonverbale Kommunikation wie Gestik, Mimik oder sonstige Bewegungen beschrieben werden sowie die gesamte Szene.
Hilfestellungen zur Transkription
Überblick über Transkriptionssoftware
Transkriptionsregeln, Hinweise zur automatischen Transkription | 2022
Erfassen Sie Informationen zu Datenschutz und Anonymisierung.
Legen Sie dieMuster der Einverständniserklärungen oder Informationsblätter zum Datenschutz dem Methodenbericht bei und beschreiben Sie das Vorgehen bei der Pseudonymisierung oder Anonymisierung. Hilfreich sind auch Anonymisierungsprotokolle und die Liste der Pseudonyme.Für das Datenteilen und die Langfristsicherung nach Projektende ist es sinnvoll, das Reidentifikationsrisiko zu beschreiben und Daten mit sensiblen Informationen zu kennzeichnen. Dies kann beispielsweise mithilfe der Stamp-Bestandsliste geschehen.
Erfassen Sie Informationen zur Datenanalyse.
Informationen zu Ihrem Vorgehen bei der Datenanalyse sind erforderlich zur Reproduktion der Ergebnisse. Erfassen Sie diese beispielsweise innerhalb einer Ergebnispublikation, innerhalb der Syntax, anhand von QDA-Dateien oder mithilfe von Memos. Als „Memo“ werden in der qualitativen Forschung Notizen bezeichnet, die im Rahmen der Analyse (Kodierung) an jeweiliger Stelle in Transkripten oder Beobachtungsprotokollen eingefügt werden.
Erfassen Sie Informationen zu den Datensätzen und Datendateien.
Hierzu gehören Informationen zur Datenstruktur und Zusammengehörigkeit von Dateien und Begleitmaterialien. Hilfreich können auch Informationen zu den zu beachtenden Urheberrechten und den datenschutzrechtlichen Anforderungen auf Dateiebene sein.
Bei der Dokumentation der Dateien können Sie diese Stamp-Bestandsliste nutzen.Stamp-Bestandsliste
Achten Sie auf eine konsistente und verständliche Dateibenennung. Machen Sie sich mit unseren Hinweisen zur Organisation von Dateien vertraut.Zur Seite Dateien organisieren
Inside VerbundFDB: Was sind "Metadaten"?
Im Zusammenhang mit Nachvollziehbarkeit und Dokumentation fällt häufig der Begriff „Metadaten“. Metadaten dienen der standardisierten Beschreibung eines Datenbestands. Durch gute Metadaten werden Datenbestände auffindbar und suchbar in entsprechenden Portalen und Suchmaschinen. Damit dies funktioniert, müssen Metadaten standardisiert sein!
Wie entstehen standardisierte Metadaten?
Im Prozess der Übergabe von Forschungsdaten an ein Forschungsdatenzentrum (FDZ) oder Repositorium sind von den Datengebenden über ein Online-Formular oder Online-Fragebogen Angaben zu den Forschungsdaten zu machen. Auf Basis dieser Angaben und der übermittelten Begleitmaterialien werden durch das FDZ oder Repositorium standardisierte Metadaten und sogenannte kontrollierte Vokabulare erstellt. So entstehen Metadaten, die maschinenlesbar sind und zwischen verschiedenen Datenbanken und Suchportalen ausgetauscht werden können.
Zusammengefasst heißt das:
- Über Metadaten werden Forschungsdaten in Datenbanken und Datenbestandskatalogen sichtbar und wiederauffindbar.
- Metadaten dienen der Herstellung und dem Erhalt der Interpretierbarkeit von Forschungsdaten.
Arten von Metadaten
- Inhaltliche Metadaten: Titel, Schlagwörter, Thema
- Methodische Metadaten: Untersuchungsdesign, Grundgesamtheit, Stichprobenziehung/Fallauswahl, Erhebungsmethode, Analyseeinheit
- Formale Metadaten: Dateityp, Dateiformat, Dateigröße, bei Audio-/Videomaterial: Dauer der Aufzeichnung, Kameraperspektive, Sprache
- Administrativ-technische Metadaten: Bereitstellungsdatum, Bearbeitungsdatum, Freischaltung, Systemanforderungen
- Relationale Metadaten: Verweise auf dazugehörige Materialien, Literatur
- Identifizierende Metadaten: DOI
- Rechtliche Metadaten: Anonymisierungsgrad, Zugangskonditionen
Inhaltliche Metadaten | Titel, Schlagwörter, Thema |
Methodische Metadaten | Untersuchungsdesign, Grundgesamtheit, Stichprobenziehung/Fallauswahl, Erhebungsmethode, Analyseeinheit |
Formale Metadaten | Dateityp, Dateiformat, Dateigröße, bei Audio-/Videomaterial: Dauer der Aufzeichnung, Kameraperspektive, Sprache |
Administrativ-technische Metadaten | Bereitstellungsdatum, Bearbeitungsdatum, Freischaltung, Systemanforderungen |
Relationale Metadaten | Verweise auf dazugehörige Materialien, Literatur |
Identifizierende Metadaten | DOI |
Rechtliche Metadaten | Anonymisierungsgrad, Zugangskonditionen |
Weiterführende Informationen und Quellen
Hinweise Methoden-/Feldberichte
Hinweise zur Erstellung eines Methoden-/Feldberichts | 2017
Improving the Quality of Survey Data Documentation | 2018
Erstellung von Methodenberichten für die Archivierung von Forschungsdaten | 2010
Hinweise zur Kontextualisierung von qualitativen Daten
Leitfaden zur Kontextualisierung von qualitativen Befragungsdaten | 2021
Leitfaden für einen qualitativen Methoden- und Feldbericht | 2022
Kontextualisierung qualitativer Forschungsdaten für die Nachnutzung | 2020
Literatur zu qualitativen Daten
A Proposal for Archiving Context for Secondary Analysis | 2006
Praxisbuch Interview, Transkription & Analyse | 2018