Citizen Science & Open Research Data: wie partizipative Datenanalyse gelingen kann

Daten werden immer wichtiger in der heutigen Gesellschaft und ebenso in der Wissenschaft über alle Disziplinen hinweg. Auch deswegen gehört Open Research Data (ORD) in vielen Bereichen zur guten Praxis oder ist gar obligatorisch. Im Rahmen der ECSA hat sich gezeigt, dass sich auch die Citizen Science Community mit ORD beschäftigt. Das ist nicht überraschend, gelten doch beide Bereiche als wichtige Pfeiler von Open Science (im Sinne der UNESCO).

 

Julia Gantenberg (c) Andreas Caspari

 

Dr. Julia Gantenberg ist Wissenschaftskommunikatorin am Zentrum für Arbeit und Politik (zap) der Universität Bremen.
Sie ist langjährige Praxisexpertin und forscht zu Citizen Science, der Beteiligung von Forschenden an Wissenschaftskommunikation
sowie zu partizipativen Forschungs- und Bildungsformaten.

 

Sophia Segler (c) E.D.

Sophia Segler ist aktuell Sozialwissenschaftlerin am Zentrum für Arbeit und Politik (zap)
sowie am interdisziplinären artec Forschungszentrum Nachhaltigkeit, beide mit Standort an der Universität Bremen.
Ihr besonderes Interesse gilt der sozialwissenschaftlichen Forschung zur sozial-ökologischen Transformation
und der stärkeren Einbindung von Citizen Scientists in der Analyse von Daten aller Art.
 
 

Nikola hoch

Tizian Zumthurm ist Projektleiter im Programm Citizen Science bei Science et Cité. 

 

So fällt Citizen Science in Finnland unter das National Open Science and Research Monitoring. M. Kallio und J. Karlsson haben aufgezeigt, wie herausfordernd es ist, dazu geeignete Indikatoren zu definieren. Klare Messgrössen für Citizen Science sind schwieriger zu definieren als für Open Access oder ORD. Open Science in Finnland wird von der Federation of Finnish Learned Societies mit finanzieller Unterstützung des Ministeriums für Bildung und Kultur koordiniert, was durch Expert:innengremien und Arbeitsgruppen geschieht. Die Arbeitsgruppe für Citizen Science erforscht die Schnittstelle zwischen offener Forschung und Gesellschaft durch Citizen Science. Sie hat Empfehlungen formuliert, basierend auf einer Umfrage im Jahr 2021. Eine solche wird dieses Jahr erneut durchgeführt, um die Befunde aktuell zu halten und den Impact der Empfehlungen zu messen.

Insgesamt macht ORD die Forschung eher komplexer. Das gilt natürlich auch für Citizen Science. Die Datenanalyse erfordert noch mehr Interdisziplinarität und stellt neue Fragen betreffend Ethik und Fairness, wie im Rahmen des Workshops «Leveraging data science for change» (L. Tupikina et al.) unter anderem besprochen wurde. Zwar können Citizen-Science-Daten noch mehr Data Science ermöglichen. Es sollte aber vermehrt auch darum gehen, die Perspektive der Citizen Scientists auf diese Daten und ihre Analyse anzusteuern. Dafür braucht es unter anderem mehr Betreuung in Data Literacy.

In der D-A-CH AG beobachten wir, dass innerhalb der diversen Citizen Science Community kein einheitliches Verständnis davon besteht, was denn mit ORD genau gemeint ist: eine Online-Karte, eine Excel-Datei im Netz oder die Nutzung eines internationalen Repositoriums. Es besteht zwar Nachfrage vonseiten Projektleitenden zu Informationen zum Thema. Aber die praktischen und institutionellen Hürden, um ORD in die Praxis umzusetzen, sind beträchtlich, wie wir bei der Konzeption der Veranstaltungsreihe „Open Data in Citizen-Science-Projekten“ festgestellt haben. Das liegt unter anderem daran, dass Open-Data-Lösungen sehr (sub-)disziplin-spezifisch sind, die institutionellen und technischen Strukturen von Repositorien sehr komplex und viele davon wegen Anmeldung und Gatekeepern gar nicht wirklich offen zugänglich sind.

So stellt sich die Frage wie ORD dabei helfen kann, die demokratischen Versprechen von Citizen Science einzulösen (und umgekehrt). Im Grundsatz sollen Forschungsdaten nach den FAIR Prinzipien geteilt werden: Sie sollen auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable) sein. Diese Prinzipien wurden nicht spezifisch für Citizen Science erarbeitet, und es ist gar nicht so offensichtlich, wie man vielleicht meinen könnte, ob sie auch in diesem Bereich relevant sind. Inwiefern der Anspruch an FAIR-Daten für Citizen Science eine Rolle spielt bzw. inwiefern die FAIR Prinzipien auf Citizen Science übertragbar sind, wollen wir am Beispiel des Projekts „GINGER – Gemeinsam Gesellschaft erforschen“ kurz reflektieren. Dazu diskutieren wir, wo mögliche Probleme liegen, wie man sie lösen kann und was es dazu braucht.

Dazu wurde auf der ECSA der dialogische Workshop „Let’s talk about data – What makes good data interpretation“ angeboten, der auf Erfahrungen aus dem Format Public Data Sprint (vgl. Segler, Gantenberg 2023; inspiriert von der Royal Danish Library in Kopenhagen und Aarhus) aufbaute. Darauf basierend stellen wir einige Überlegungen an, wie die kollaborative Datenauswertung im sozialwissenschaftlichen Kontext gelingen kann und was damit verbundene Herausforderungen und Unterschiede zur fachwissenschaftlichen Datenauswertung sind. Diese Reflexionen aus der Praxis wenden wir im Folgenden kurz prüfend auf die FAIR-Prinzipien an.

Auffindbar: Oftmals wird durch Citizen Science z. B. durch Crowdsourcing ein eigener Datensatz generiert, der im besten Fall öffentlich zugänglich sein sollte. Dies kann eine Herausforderung darstellen, wenn mit sensiblen Daten gearbeitet wird, wie es z. B. in Citizen Social Science durch die vorhandene Nähe zum Untersuchungsgegenstand und anderer sozialer Dimensionen, wie der Schutz von Persönlichkeitsrechten, häufiger gegeben ist als z. B. beim Umwelt-Monitoring in naturwissenschaftlichen Citizen-Science-Projekten.

Zugänglich: In Bezug auf den Zugriff auf Daten wurde im ECSA-Workshop die Anwendbarkeit niedrigschwelliger und inklusiver Techniken diskutiert, die eine Kernhürde für partizipative Datenanalyse darstellt. Zu den leicht zugänglichen Software-Empfehlungen für die Datenanalyse mit Laien gehören beispielsweise die Open-Source-Programme JAMOVI (2024), Orange (Demsar 2013) oder das interaktive Datenportal des Forschungsinstituts Gesellschaftlicher Zusammenhalt (FDZ-FGZ, 2024: Interaktive Indikatoren). Dagegen funktionieren die sozialwissenschaftlichen und digitalen Lern- und Analyseplattformen EPINetz, protestdata, sowie das interaktive FGZ-Cohesion-Panel bereits niedrigschwelliger für eine explorative Datenanalyse. Offene Programmierumgebungen, wie R, Shiny und Python, können zwar auch für partizipative Datenanalyse genutzt werden, erfordern aber didaktische Expertise und intensive Anleitung und Begleitung in der Bedienung. In jedem Fall müssen niedrigschwellige Plattformen zur Datenanalyse offen zugänglich sein und benötigen die Begleitung von Expert:innen aus statistischer Fachwissenschaft und Pädagogik sowie technische Pflege und Wartung.

Interoperabel: Für die partizipative Datenanalyse in Citizen Science wurde die Interoperabilität von den Workshopteilnehmenden auf der ECSA-2024 als wichtiges Prinzip anerkannt. Allerdings zeigt sich, dass für Citizen Science eine aufwändige Vorbereitung für möglichst verständliche und niedrigschwellige Arbeit an Datensätzen notwendig ist. Hierfür etwa müssen Metadaten erklärt werden, und auch, wie Daten und Tabellen überhaupt aufgebaut sind, wie diese gelesen und dann interpretiert werden. Denn es kann nicht von einem gemeinsamen Vokabular und Vorwissen über Datenverarbeitung und ihre Analyse ausgegangen werden. Dies bedingt eine umfangreiche Vorbereitung des Datenkorpus sowie eine radikale Reduktion der Komplexität der Arbeitsschritte.

Wiederverwendbar: Die Wiederverwendbarkeit von Daten stellt einen zentralen Aspekt dar, wie aus der Projekterfahrung von GINGER berichtet werden kann. Dieser wird nicht nur aus der Wissenschaft, sondern zusätzlich auch aus wissenschaftsexternen Bereichen, wie z. B. dem Journalismus, nachgefragt. Es zeigt sich, dass wissenschaftliche Infrastrukturen zur Datenspeicherung und -bereitstellung häufig noch nicht ausreichend über die Bedeutung von Citizen Science und ihrer Forschungstätigkeit aufgeklärt sind, und dadurch vor allem qualitative Citizen-Science-Daten nicht berücksichtigt werden können. Auch für die Citizen Scientists stellt die Wiederverwendbarkeit von Datensätzen ein Qualitätsmerkmal partizipativer Forschungsstrukturen dar. Dies sowohl, um sie für ihre Forschungsinteressen nutzen zu können und empirische Antworten zu finden, als auch, um existierende Forschungsaussagen selbst nachvollziehen zu können.

Resümierend lässt sich feststellen, dass die FAIR-Prinzipien auch für partizipative Forschung wichtig sind, jedoch hinsichtlich ihrer Relevanz für erfolgreiche Ko-Interpretation von Daten jeweils anders gewichtet werden müssen als für die Logiken der Fachforschung. Es zeigt sich, dass neben der fachlichen Expertise aus dem Feld des Forschungsgegenstands auch ein inklusiver, technischer und didaktischer Zugang zu den Daten entscheidende Erfolgsfaktoren für die Ko-Interpretation von Daten sind. Wir sehen das Potential partizipativer Datenanalyse auch darin, wesentlich zur Förderung kritischer und reflexiver Datenlesefähigkeit und somit zu Aspekten der Wissenschaftsmündigkeit beizutragen. Erst nachgeordnet zu möglichst niedrigschwelligen Datenzugängen für Citizen Scientists werden in der Logik partizipativer Dateninterpretation die Wiederverwendbarkeit, Auffindbarkeit und Interoperabilität relevant und tragen dann aber ebenso wichtig zur fachlichen Akzeptanz von partizipativer Dateninterpretation und Datensätzen bei. Diese Beobachtungen aus der Praxis des GINGER Projekts illustrieren, dass bei den FAIR Prinzipien ein wichtiger Aspekt von Open Science fehlt, der eigentlich auch für Open Research Data aber insbesondere für Citizen Science relevant ist: Daten müssen möglichst niedrigschwellig interpretierbar sein. An Public Data Sprints wird das offensichtlich.

Erstellt am 24. September 2024

Referenzen:

GINGER (Gemeinsam Gesellschaft erforschen), Citizen Social Sciences Project. Dr. Julia Gantenberg und Sophia Segler (Universität Bremen), Funded by the German Ministry of Research and Education, 2021 - 2024. https://www.uni-bremen.de/ginger/

EPINetz (Exploration politischer Informationsnetzwerke), Digitale Lern- und Rechercheplattform zur Exploration politischer Informationsnetzwerke. Michael Gertz (Universität Heidelberg) und Wolf Schünemann (Universität Hildesheim). Funded by Klaus Tschira Stiftung, gemeinnützige GmbH, 2021 - 2024. https://epinetz.de/

Forschungsdatenzentrum des Forschungsinstitut Gesellschaftlicher Zusammenhalt (2024): Interaktive Indikatoren. https://fgz-risc-data.de/interaktive-indikatoren/

The jamovi project (2024). jamovi (Version 2.5) [Computer Software]. Retrieved from https://www.jamovi.orgb

Demsar J, Curk T, Erjavec A, Gorup C, Hocevar T, Milutinovic M, Mozina M, Polajnar M, Toplak M, Staric A, Stajdohar M, Umek L, Zagar L, Zbontar J, Zitnik M, Zupan B (2013) Orange: Data Mining Toolbox in Python, Journal of Machine Learning Research 14(Aug): 2349−2353.

Segler, S., & Gantenberg, J. (2023). Innovation Data Sprint in Citizen Social Sciences. In F. Heigl, O. Höhener, & D. Dörler (Hrsg.), Proceedings of the Austrian Citizen Science Conference 2023. Proceedings of Science, Sissa Medialab srl, Triest, Italien.

Royal Danish Library, About Data Sprint. (no date). https://datasprint.kb.dk/en/about-data-sprint


Logoreihe oben ausgerichtet