Vorheriger Vorschlag

5. Anerkennungskultur in und für Citizen-Science

Nächster Vorschlag

7. Recht und Ethik

Einleitungstext für Annotation

Infografik zum Ablauf der Annotationsgrafik

Markieren Sie eine Textstelle. Es erscheint nun ein Button "Kommentieren" über den Sie zur fraglichen Textstelle einen Kommentar verfassen können. Sie können den Kommentar dann einer Kategorie von drei Kategorien zuordnen.

Mit einem Klick auf eine farblich markierte Stelle im Text können sich den dazugehörigen Kommentar anzeigen zu lassen.

6. Datenqualität und Datenmanagement

Einleitung

Citizen-Science-Projekte nutzen digitale sowie analoge Daten-Infrastrukturen, die als vertrauenswürdige und datenschutzkonforme Umgebungen die Durchführung von Projekten sowie die Teilnehmer:innen Akteur:innen unterstützen. So können Projektergebnisse langfristig  bereitgestellt werden. Um dem Anspruch eines echten Austauschs zwischen Wissenschaft und Gesellschaft gerecht zu werden, existiert auch für die Öffentlichkeit ein freier und auf ihre Bedürfnisse zugeschnittener Zugang zu Daten aus der Wissenschaft. Für Projektinitiierende und -durchführende existieren Unterstützungs- und Beratungsangebote. Finanzielle Ressourcen stehen für Datenmanagement und Qualitätssicherung in Citizen-Science-Projekten  ausreichend  zur Verfügung.

 

6.1.  State of the Art: Wo stehen wir mit dem Grünbuch?

Mit außerordentlichem Engagement und oft mit enormem Fachwissen tragen Bürgerinnen und Bürger zu wissenschaftlichen Projekten bei. Dieser Beitrag manifestiert sich insbesondere in den Daten, welche BürgerInnen im Rahmen von Projekten erheben. Citizen-Science-Daten stellen daher ein besonders wertvolles Ergebnis bürgerwissenschaftlicher Projekte dar. Die Datenerhebung durch engagierte BürgerInnen bietet insbesondere für die Wissenschaft Möglichkeiten mit erheblichem Potential. Dies geht aus der Citizen-Science -Umfrage 2020 eindeutig hervor. So sagten etwa drei Viertel der befragten ForscherInnen (n=75), dass durch bürgerwissenschaftliche Beiträge wissenschaftliche Daten in einem größeren räumlichen und zeitlichen Umfang erhoben werden können als dies im Rahmen traditioneller wissenschaftlicher Projekte möglich wäre. Rund die Hälfte der befragten ForscherInnen sehen durch die Bürgerbeteiligung eine Zeit- und Kostenersparnis bei Datenerhebung und -auswertung. Rund ein Drittel der ForscherInnen geben an, dass Citizen-Science-Daten dazu beitragen wissenschaftliche Daten zu komplementieren. So könnten bestimmte Daten aufgrund ihres Umfangs und der für die Erhebung notwendigen breiten Fachexpertise ohne die Beteiligung von Freiwilligen gar nicht erhoben werden, z.B. für die Biodiversitätsforschung wesentliche Daten zum Vorkommen von Tier- und Pflanzenarten (siehe bspw. die umfangreichen Datensätze der GBIF). Zahlreiche wissenschaftliche Publikationen der letzten Jahre belegen die grundsätzliche Verwendbarkeit und den Nutzen von Citizen-Science-Daten als zusätzliche Datenquelle für wissenschaftliche Untersuchungen in verschiedensten Fachdisziplinen, u.a. der Ökologie oder der Medizin [57,58,59,60,61].

 

Wesentliche Voraussetzung für die wissenschaftliche Verwertbarkeit von Citizen-Science-Daten ist die Gewährleistung der Datenqualität. Zudem können nachvollziehbare und transparente Konzepte der Qualitätssicherung und -kontrolle für bürgerwissenschaftliche Daten helfen, bestehende Barrieren und Vorbehalte gegenüber Citizen-Science auf Seiten der Wissenschaft abzubauen. Nur so kann Citizen-Science als Forschungsansatz anerkannt und etabliert werden. Bereits heute haben Maßnahmen der Qualitätssicherung und -kontrolle einen hohen Stellenwert in Citizen-Science-Projekten. Sowohl im Vorfeld als auch während und nach der Datenerhebung werden Maßnahmen zur Qualitätssicherung ergriffen. Diese sind insbesondere die Entwicklung von Leitlinien zur -Datenqualität, die Etablierung von standardisierten Vorgehensweisen für die Datenerhebung, das Training und die Begleitung der Teilnehmer:innen, das Sammeln von Belegen sowie die Beurteilung der erhobenen Daten durch Fachexperten. Dies geht aus der Citizen-Science -Umfrage 2020 hervor. Auch zahlreiche wissenschaftliche Arbeiten befassen sich mit Fragen der Qualitätssicherung und untersuchen den Wirkzusammenhang zwischen der Qualität der Daten und der Qualität der daraus abgeleiteten wissenschaftlichen Ergebnisse [62,63,64,65,66].

 

6.2.  Was sind die Bedürfnisse, Möglichkeiten und Herausforderungen?

Sicherung der Datenqualität

Qualitätssicherung und -kontrolle in Citizen-Science-Projekten erfolgt zum überwiegenden Teil manuell. Dies ist mit einem erheblichen Zeit- und Arbeitsaufwand verbunden. Automatische Verfahren zur Qualitätssicherung haben das Potential diesen Aufwand erheblich zu reduzieren (vgl. Handlungsfeld 12). Das betrifft insbesondere Verfahren zur automatischen Plausibilitäts- und Vollständigkeitskontrolle direkt bei der Dateneingabe, maschinelle Lernverfahren der Bild- und Texterkennung, der Detektion von auffälligen Datenpunkten sowie statistische Verfahren für die Normalisierung von Daten. Diese müssen aber noch weiterentwickelt und zu Werkzeugen ausgebaut werden, um in der Praxis einsetzbar zu sein. Darüber hinaus fehlt in Citizen-Science-Projekten oft die  Expertise, um existierende automatische Verfahren in Projekten sinnvoll einzusetzen. Unter 10% der Befragten in der Citizen-Science-Umfrage 2020 (n=309) gaben an, dass in ihrem Cs- Projekt automatische Verfahren zur Qualitätssicherung eingesetzt werden. Letztendlich müssen beide, also manuelle und automatische Verfahren zur Qualitätssicherung, Hand in Hand gehen.

 

Nachhaltige Nutzbarkeit von Citizen-Science-Daten

Um die langfristige Wirkung, Sichtbarkeit und Akzeptanz von Citizen-Science zu gewährleisten sollten Citizen-Science-Daten nachhaltig und für breite Teile von Wissenschaft und Gesellschaft nutzbar sein. Die in den FAIR Data Principles ([67], https://www.go-fair.org/fair-principles/) formulierten Grundsätze der Auffindbarkeit, der Zugänglichkeit, der Interoperabilität und der (Wieder-)verwendbarkeit für Forschungsdaten (Findable, Accessible, Interoperable und Re-usable) setzen dabei den Maßstab für eine nachhaltige Nutzbarkeit. Eine wichtige Rolle spielen beschreibende Daten zu den Daten (Metadaten). Diese gewährleisten die spätere Interpretierbarkeit und Interoperabilität der Daten und machen die Herkunft und Entstehung der Daten sowie Maßnahmen der  Qualitätssicherung und -kontrolle nachvollziehbar. Open Science sichert die Transparenz und Zugänglichkeit wissenschaftlicher Erkenntnisse und ermöglicht deren Weiterverbreitung und Weiterentwicklung [68]. Wo dies aus moralischer, ethischer und rechtlicher Sicht vertretbar ist (vgl. Handlungsfeld 7), sollten Citizen-Science-Daten und -methoden daher auch frei zugänglich und nutzbar sein.

 

Dieses Ziel ist bisher nicht erreicht. Nur rund 65% der Befragten in der Citizen-Science -Umfrage 2020 (n= 309) gaben an, dass die in ihren Projekten erhobenen Daten veröffentlicht wurden oder zukünftig veröffentlicht werden. Die Veröffentlichung erfolgt vorwiegend in auf Projektwebseiten (58%) oder in Fachpublikationen (44%), die Datenarchivierung auf Institutsservern und in für die Citizen Scientists relevanten Medien. Wissenschaftliche Archive und Repositorien werden kaum genutzt. Dies ist problematisch vor allem hinsichtlich der Auffindbarkeit der Daten und des nachhaltigen Zugangs zu diesen. Etablierte Veröffentlichungskanäle für Citizen-Science-Daten existieren kaum [69]. Zu berücksichtigen sind hier sowohl Zugangsmöglichkeiten für WissenschaftlerInnen wie auch für die Citizen Scientists und die interessierte Öffentlichkeit.

 

Metadatenstandards für die Beschreibung von Citizen-Science-Daten werden vom überwiegenden Teil der Befragten, die in Citizen-Science-Projekten für das Datenmanagement verantwortlich sind (n=98), nicht genutzt bzw. sind diesen gänzlich unbekannt. Dies ist vor allem hinsichtlich der Interoperabilität und Wiederverwendbarkeit der Daten, aber auch hinsichtlich der Qualitätskontrolle problematisch. Erste Initiativen zur Standardisierung und Verbesserung der Interoperabilität von Citizen-Science-Daten existieren, beispielsweise die Arbeitsgruppe 5 der COST Action CA15212 Citizen-Science oder die Data and Metadata Working Group der CSA, die das Metadatenvokabular PPSR (Public Participation in Scientific Research) Common Conceptual Model  (https://core.citizenscience.org) entwickelt. Ein breites Spektrum an domänenspezifischen Metadatenstandards für Forschungsdaten existiert. Diese Standards können auch im Kontext von Citizen-Science verwendet werden. Daneben müssen aber auch für Citizen-Science-Daten und -projekte spezifische Aspekte abgebildet werden. Diese betreffen unter anderem die Charakterisierung der ProjektTeilnehmer:innen (z.B. hinsichtlich ihrer Expertise und Fähigkeiten), aber auch die Beschreibung der für Citizen-Science-Projekte üblichen Datenerhebungsstrategien, die sich teils grundsätzlich von denen in traditionellen wissenschaftlichen Projekten unterscheiden [70].

 

Management von Citizen-Science-Daten

Ein effektives Datenmanagement ist die Basis für Nachhaltigkeit und Wiederverwendbarkeit von Citizen-Science-Daten. Das stetige Anwachsen der Datenbestände in Wissenschaft und Forschung macht das Management solcher Daten durch alle Stadien des Datenlebenszyklus hindurch zu einer komplexen Aufgabe. Dies stellt Wissenschaftler und Bürgerwissenschaftler in besonderem Maße vor große Herausforderungen. Auch im Bereich Citizen-Science wird Datenmanagement immer wichtiger, wobei sich dessen Bedeutung häufig noch nicht in Ausschreibungen und Finanzierungen von Drittmittelgebern widerspiegelt. Dieser Umstand wird auch vom mehrheitlichen Teil der Teilnehmer:innen der Citizen-Science-Umfrage 2020 hervorgehoben. Daneben wünschen sich die Teilnehmer:innen geeignete Leitlinien und Tutorials sowie Unterstützung bei der Datenarchivierung. Großer Beratungsbedarf besteht zu den Themen Datenqualität und Archivierung, weniger bei Planung und Umsetzung der Datenerhebung. Neben einer allgemeinen Beratung durch zentrale Stellen wünschen sich die Teilnehmer:innen vor allem das Austauschnetzwerk zu datenwissenschaftlichen Experten zu stärken. 

 

Daneben wünschen sich die Befragten frei verfügbare und benutzerfreundliche Werkzeuge zur Datenerhebung. Die Identifikation wichtiger Grundprinzipien für die Entwicklung solcher Werkzeuge [71] sowie die Entwicklung grundlegender Methoden für die Datenerhebung durch Laien sind Gegenstand der aktuellen Forschung. Wichtige Punkte sind dabei die Benutzerfreundlichkeit der Werkzeuge, die auch wissenschaftlichen Laien die Erhebung qualitativ hochwertiger Daten ermöglicht und diese zur Teilnahme motiviert, sowie die Wiederverwendbarkeit dieser Werkzeuge [71]. Entscheidend ist dabei, dass methodische Entwicklungen später direkt in Citizen-Science-Projekten einsetzbar sind. Dies ist heute meist noch nicht der Fall. Frei verfügbare Werkzeuge sind oft nur unter Mithilfe von IT-Experten einsetzbar [72], kommerzielle Software ist eine Alternative, stellt aber einen großen Kostenfaktor in Citizen-Science-Projekten dar und verhindert zudem die Weiterentwicklung von Werkzeugen durch die Citizen-Science-Community.

6.3.  Handlungsempfehlungen

 

(6).1.

Wissenschaftler:innen und Praktiker:innen sollten gezielt an der (Weiter-)Entwicklung von automatischen Methoden und Werkzeugen zur Qualitätssicherung und -kontrolle  arbeiten. Für die notwendige methodische Forschung, die Umsetzung als Werkzeug, deren Wartung und den Support für den Einsatz dieser Werkzeuge müssen Fördermittel zur Verfügung gestellt werden.

(6).2.

Förderinstitutionen sollten die Nachhaltigkeit von Projektergebnissen (einschließlich der erhobenen Daten) fördern. Gleichzeitig sollte die Veröffentlichung der in Citizen Science-Projekten entstandenen Daten gemäß der FAIR-Prinzipien verbindlich sein.

(6).3.

Wissenschaftler:innen und Praktiker:innen sollten Standards zur Dokumentation von Citizen Science-Daten schaffen. Dazu müssen geeignete Metadatenstandards für Citizen Science-Daten entwickelt werden, die auf existierenden Metadatenstandards für wissenschaftliche Daten (z.B. domänenspezifische Standards) aufbauen und diese ggf. erweitern. Gleichzeitig sollten durch Wissenschaftler:innen und Praktiker:innen Leitfäden und Werkzeuge erarbeitet werden, welche die Auswahl passender Metadatenstandards und die standardisierte Beschreibung von Citizen Science-Daten (auf einfache Weise) ermöglichen.

(6).4.

Um eine nachhaltige Nutzbarkeit von Citizen Science-Daten zu erreichen müssen Förderer, Wissenschaftler:innen, und Praktiker:innen  Strukturen für die Datenarchivierung, -publikation und den Zugang zu Citizen Science-Daten schaffen.

Dies macht die (Weiter-)entwicklung von Methoden, Werkzeugen und Richtlinien für die Anonymisierung von Citizen Science-Daten mit Personenbezug als Voraussetzung für eine Veröffentlichung der Daten notwendig. Wissenschaftliche Einrichtungen sollten einheitliche Möglichkeiten für die Archivierung von Citizen Science-Daten durch Öffnung existierender bzw. entstehender Strukturen (z.B. wissenschaftlicher Langzeitrepositorien wie die NFDIs) oder durch Neuschaffung von Strukturen ermöglichen. Gleichzeitig müssen Zugänge zu (bürger-) wissenschaftlichen Daten (z.B. Datenportale) für Bürgerforscher:innen geschaffen bzw. ausgebaut werden.

(6).5.

Wissenschaftler:innen und Praktiker:innen sollten Methoden und Werkzeuge für die Visualisierung und Exploration von Citizen Science-Daten durch Bürgerforscher:innen (weiter-)entwickeln.

(6).6.

Wissenschaftler:innen und Praktiker:innen sollten ein einheitliches Zitierformat für Citizen Science-Daten schaffen und umsetzen.

(6).7.

Wissenschaftler:innen, und Praktiker:innen sollten zur Sicherung der Datenqualität von Citizen Science-Daten ein effektives Management von Citizen Science-Daten etablieren. Das kann erreicht werden durch die Öffnung etablierter Unterstützungs- und Beratungsstrukturen für Datenarchivierung, Datenmanagement und Qualitätssicherung (z.B. Kontaktstellen für Forschungsdatenmanagement) für Citizen Science-Projekte (auch für Projekte ohne institutionelle Anbindung), durch die Etablierung und Stärkung eines Austauschnetzwerks zu datenbezogenen Fragen in Citizen Science-Projekten, und das Erstellen zielgruppengeeigneter Leitlinien/Tutorials zum Thema Datenmanagement und Qualitätssicherung für Citizen Science in leicht verständlicher Sprache, sowie die Schaffung von wiederverwendbaren und konfigurierbaren Werkzeugen für die Erhebung und Bereitstellung von Citizen Science-Daten.

(6).8.

Fördereinrichtungen sollten finanzielle Ressourcen für Datenmanagement und Qualitätssicherung bei der Förderung von Citizen Science-Projekten bereitstellen.

 

 

 

Die neuesten Beiträge

Annotation vom 05.10.2021 - 10:52
Annotation vom 05.10.2021 - 10:50
Annotation vom 05.10.2021 - 10:49
Annotation vom 05.10.2021 - 10:46
Annotation vom 05.10.2021 - 10:44