Im Spannungsfeld zwischen Digital Humanities und Informationswissenschaft- Beiträge der Universität Regensburg auf der ISI 2021

Wan-Hua Her und Aenne Knierim

Abstract

Das 16. Internationale Symposium für Informationswissenschaft brachte dieses Jahr Fachvertreter*innen aus Deutschland, Österreich und der Schweiz zusammen, um über aktuelle Forschungsvorhaben der Informationswissenschaft und benachbarter Fächer wie den Digital Humanities zu diskutieren. Die Tagung fand virtuell in englischer und deutscher Sprache unter dem Motto „Information zwischen Daten und Wissen. Die Informationswissenschaft und ihre Nachbarn von Data Science bis Digital Humanities“ statt. Das sich zuletzt sehr dynamisch entwickelnde Arbeits- und Forschungsgebiet der Digital Humanities bot im Spannungsverhältnis mit dem Fach Data Science einen fruchtbaren Boden für den informationswissenschaftlichen Diskurs.

Passend dazu beschäftigt sich ein Beitrag von Manuel Burghardt und Jan Luhmann mit der Beziehung zwischen der Informationswissenschaft und Digital Humanities. Michael Achmann und Florian Schwappach stellten ihr Paper „Grundlagenermittlung für die digitale Werkbank qualitativ-hermeneutisch arbeitender Geisteswissenschaftlerinnen“ vor, in dem die Nutzung digitaler Tools durch Geisteswissenschaftler*innen untersucht wird. Interessante Einblicke in das Forschungsfeld der Sentiment Analyse brachte ein Paper von Thomas Schmidt, Johanna Dangel und Christian Wolff, welches das Tool SentText beleuchtet. In einer neuen Studie aus der Informationswissenschaft zum Thema Fake News von Thomas Schmidt, Christian Wolff und anderen wurde das Informationsverhalten der Befragten im Umgang mit Fake News in den sozialen Medien thematisiert.

Photo Credit: Poline Zimmermann, Source: pexels.com/de-de/foto/foto-der-person-mit-laptop-3747403/

Zu Beginn gab Peter Bell von der Universität Erlangen-Nürnberg in einer Keynote einen spannenden Einblick in die digitale Kunstgeschichte- ein Novum in der traditionellen Wissenschaft. Das Forschungsfeld unterstreicht die Relevanz von Bilddatenbanken als Datenquelle und Bedeutungsträger. Bell wirft verschiedene Fragen auf: Welche Defizite und Potenziale bieten digitale Bilddatenbanken gegenüber vorangegangenen Dispositiven? Entwickelt sich die digitale Kunstgeschichte zu einer bildgetriebenen Wissenschaft? Abschließend formuliert Bell, dass „[…] alle Fragen nach dem Umgang mit dem Bild auch die Gegenfragen nach dem Text“ aufwerfen.

Michael Achmann und Florin Schwappach untersuchen in ihrem Paper „Grundlagenermittlung für die digitale Werkbank qualitativ-hermeneutisch arbeitender Geisteswissenschaftlerinnen“ das mentale Modell geisteswissenschaftlicher Forscher*innen beim wissenschaftlichen Arbeiten und fokussieren sich hierbei auf die Aktivitäten Notieren, Exzerptproduktion und Literaturverwaltung. Die digitale Erfassung analoger Notizen in Kombination mit vorhandenen digitalen Informationen könnte die geisteswissenschaftliche Forschungsarbeit unterstützen. Bisher besteht eine Lücke im Bereich der digitalen Werkzeuge, da es kaum etablierte Notizwerkzeuge für Geisteswissenschaftler*innen gibt. Als Forschungsgrundlage für Achmanns und Schwappachs Paper diente eine Interviewreihe mit zwölf Nachwuchsforschenden im Master- und Promotionsstudium, die typische Aktivitäten und Arbeiten während der Forschung eruiert. In Abgrenzung zu Methodologien anderer Fachbereiche verläuft der geisteswissenschaftliche Forschungsprozess nicht-linear und ist somit durch synchron und rekursiv ablaufende Aktivitäten geprägt. Die Autoren stellten zwei Typen der Literaturverwaltung fest: Bei der händischen Literaturverwaltung standen Exzerpte und Notizen im Mittelpunkt. Nutzer*innen von Literaturverwaltungsprogrammen organisieren Literatur mit Verschlagwortung und dem Hinzufügen von Metadaten. Im geisteswissenschaftlichen Forschungsprozess wird das Notieren von Achmann und Schwappach als Universalaktivität bewertet. In einem Kapitel ihres Papers geben sie Einblicke in verschiedene Techniken und Methoden der Exzerptproduktion und -ordnung im wissenschaftlichen Arbeitsprozess. Weiterhin gehen die Autoren auf die Modalität der Notizen ein und stellen fest, dass Forscher*innen insgesamt nur in Ausnahmefällen exklusiv digital oder analog notieren. Daraus ergibt sich ein Problem der Fragmentierung. Abschließend wird festgestellt, dass die Erstellung und Verwaltung von Exzerpten und ihren Inhalten im Mittelpunkt einer Software für die digitale Forschungsumgebung von Geisteswissenschaftler*innen stehen muss.

Schmidt, Dangel und Wolff präsentieren das webbasierte Tool SenText zur lexikonbasierten Sentimentanalyse. Sentimentanalyse ist ein beliebtes Forschungsgebiet in den Digital Humanities, vor allem in Bereichen, die hauptsächlich mit textbasierten Inhalten arbeiten, wie beispielsweise Computational Literary Studies. Für die Sentimentanalyse wurden bereits verschiedene Ansätze entwickelt, im DH- und NLP-Forschungskreis überwiegt aber die lexikonbasierte Methode, die den Forschern*innen ermöglicht, die Polarität von textbasierten Stimmungen schnell und nachvollziehbar zu untersuchen.

Das Konzept der Sentimentanalyse besteht darin, eine vermutete Haltung durch die Verarbeitung von Sentiment Bearing Words (SBEs) zu bestimmen – das sind Wörter eines Textes, die einen Stimmungswert tragen, welcher auf nominalen Klassen oder linearen Metriken basiert, wie z. B. positiv, negativ, neutral oder Werte zwischen -3 (negativ) und 3 (positiv). Die bisher entwickelten Programme erfordern jedoch Programmierkenntnisse, was den Zugang für manche Geisteswissenschaftler*innen erschwert. Das webbasierte Tool SentText wurde daher entwickelt, um die oft von Programmierkenntnissen abhängige Sentimentanalyse in der DH-Forschung zu erleichtern. Für die Sprachverarbeitung werden verschiedene Lexika wie beispielsweise NLTK eingesetzt. Die benutzerfreundliche Schnittstelle ist darauf ausgerichtet, lexikonbasierte Sentimentanalysen ohne Kodierung verständlich durchführen zu können. Die Entwicklung von SentText wurde mehrfach nach den Anmerkungen von Usability-Tests iteriert, die die vielfältigen Anwendungsfälle von Geisteswissenschaftlern*innen berühren.

Eine spannende Studie zum Thema Fake News auf Social Media wurde von Thomas Schmidt et al. vorgestellt. Die Umfragestudie „Information Behavior towards False Information and ‘Fake News’ on Facebook“ untersucht das Informationsverhalten der Befragten im Umgang mit Falschinformation auf Facebook. Facebook dient hier als Prototyp für ein Soziales Medium. Genauer gesagt erforscht die Studie die individuellen Faktoren Geschlecht, „user type“ (aktive- oder passive Nutzung) und Vertrauen in Social Media in Bezug auf Falschinformation. Für die Faktoren „User type“ und Vertrauen wurden wichtige Ergebnisse gefunden, allerdings nicht für den Faktor Geschlecht. Dieser hat sich nicht als relevanter beeinflussender Faktor erwiesen. Nutzer*innen glauben, dass sie regelmäßig mit Falschinformationen und Fake News konfrontiert sind und haben ein mediokres Vertrauen in Social Media. Allerdings interagieren sie fast nie mit Fake News. Je aktiver eine Person Facebook nutzt, desto eher interagiert sie oder reagiert sie auf Fake News. Die Gruppe derer, die auf Falschinformation reagiert, ist eher klein und setzt sich ausschließlich aus Personen zusammen, die Facebook sehr aktiv nutzen.

Same same, but different? – On the Relation of Information Science and the Digital Humanities

Mit der szientometrischen Untersuchung beschreiben Burghardt und Luhmann, wie die Verteilung der Themen in den Bereichen Bibliotheks- und Informationswissenschaft (IS) und den Digital Humanities (DH) aussieht. Die neuere kombinierte Methode aus LDA und hierarchischer Clusteranalyse wird hierfür verwendet. Das Korpus umfasst 6.498 Forschungsartikel, die zwischen 1990 und 2019 zum Thema IS und DH veröffentlicht wurden. Die Themen wurden durch Clusteranalyse aggregiert. Die Modellierung wurde von Metriken wie beispielsweise Perplexität und thematischer Stabilität evaluiert.

Die Ergebnisse zeigen, dass IS-Wissenschaftler*innen sich hauptsächlich mit den Bereichen Informationsverhalten und Information Retrieval auseinandersetzen, wobei die DH-Forscher*innen sich stark auf Textanalyse konzentrieren. Trotz ihrer Unterschiede gibt es jedoch gelegentlich gemeinsame Forschungsfelder, vor allem im Bereich Informationsmanagement. Dabei soll auch betont werden, dass IS und DH unterschiedliche Forschungsmethoden haben, was darauf hindeutet, dass die beiden Disziplinen trotz gemeinsamer Themenbereiche immer noch als individuelle Forschungsfelder florieren.

The Benefits of RDF and External Ontologies for Heterogeneous Data – A Case Study Using the Japanese Virtual Media Graph

In einem weiteren Beitrag stellen die Forscher Kiryakos und Pfeffer die Vorteile von externen Ontologien und Ressource Description Framework (RDF) für heterogene Daten vor, indem sie die Datenbankeinrichtung und Datentransformation des Japanese Visual Media Graph (JVMG) erklären. Das JVMG-Projekt arbeitet mit einer umfangreichen Kollektion von japanischen visuellen Medien (z.B. Anime, Manga, Videospiele), die für Forscher*innen wertvoll sein kann, die verschiedene Aspekte der japanischen visuellen Medien untersuchen. Die Daten sind deskriptiv, hoch granuliert, existieren in verschiedenen Formaten und Datenmodellen und werden von verschiedenen fanbasierten Nutzergemeinschaften erstellt.

Das JVMG-Projekt hat das Ziel, eine vernetzte Datenbank aufzubauen, die mit flexiblen Query- und Analysewerkzeugen kombiniert werden kann. Kiryakos und Pfeffer wandeln die Daten mithilfe von Python um, was zu einer Ausgabe einer Reihe von integrierbaren RDF-Dateien führt. Durch diesen schemafreien Ansatz können neue Daten leicht angepasst werden. Für jeden Datenanbieter (z. B. Fan-Gemeinschaften) wird so eine Ontologie erstellt, die es den Nutzern*innen ermöglicht, auf Daten einzelner oder mehrerer Anbieter zuzugreifen. Dieser flexible Ansatz, so argumentieren Kiryakos und Pfeffer, könnte auch für Projekte mit ähnlichen Zielen wie beispielsweise der Datenintegration nützlich und vorteilhaft sein.

Information Organization and Access in Digital Humanities – TaDiRAH Revised, Formalized and FAIR

Die Taxonomy of Digital Research Activities in the Humanities (TaDiRAH) unterstützt im DH-Forschungskreis die Klassifizierung von Begriffen und Themen. Borek et al. diskutieren in ihrem Paper die Transformation von TaDiRAH in eine maschinenlesbare und formalisierte Taxonomie. Da die Thematik im Bereich DH und ihre Inhalte immer umfangreicher werden, ist die Umgestaltung von TaDiRAH darauf ausgerichtet, dem Forschungskreis bei der Erstellung von DH-Tools, Projekten und Websites zu unterstützen.

Um das existierende Vokabular in der Domäne der DH zu optimieren, werden Konzepte und Begriffe anhand des Forschungsbedarfs erweitert und genauso das TaDiRAH-Modell angepasst. Durch die hierarchische Zuordnung der Konzepte lässt sich die Vernetzung der verschiedenen Termini und deren Einsatzgebiete feststellen. Das überarbeitete TaDiRAH setzt darauf, zukünftig mit Wikidata zusammen zu arbeiten, um die definierten Begriffe in die öffentliche Umgebung zu übertragen sowie kontinuierlich auf die Bedürfnisse der DH-Forschungskreis einzugehen.

Das 17. Internationale Symposium für Informationswissenschaft wird im kommenden Jahr an der Fachhochschule Graubünden stattfinden.

Um den Tagungsband mit allen Beiträgen zu lesen, klicken Sie bitte hier.

Video-Link zum Vortrag „SentText“

Video-Link zum Vortrag „Information Behavior towards False Information and ‚Fake News‘ on Facebook“

Literatur

Achmann, M. & Schwappach, F. (2021). Grundlagenermittlung für die digitale Werkbank qualitativ-hermeneutisch arbeitender Geisteswissenschaftlerinnen: Exploration geisteswissenschaftlicher Forschung mit Fokus auf Exzerpten und Literaturverwaltung. In T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 200–216). https://doi.org/10.5283/epub.44945

Bell, P. (2021). Digitale Kunstgeschichte und Bilddatenbanken als Synthese von Foto-, Dia- und Bibliothek. In T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 22). https://doi.org/10.5283/epub.44934

Borek, L., Hastik, C., Khramova, V., Illmayer, K. & Geiger, J.D. (2021). Information Organization and Access in Digital Humanities: TaDiRAH Revised, Formalized and FAIR. In: T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 321–332). https://doi.org/10.5283/epub.44951

Burghardt, M. & Luhmann, J. (2021). Same same, but different? On the Relation of Information Science and the Digital Humanities: A Scientometric Comparison of Academic Journals Using LDA and Hierarchical Clustering. In: T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 173–199). https://doi.org/10.5283/epub.44944

Kiryakos, S. & Pfeffer, M. (2021). The Benefits of RDF and External Ontologies for Heterogeneous Data: A Case Study Using the Japanese Visual Media Graph. In: T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 308–320). https://doi.org/10.5283/epub.44950

Schmidt, T., Salomon, E., Elsweiler, D. & Wolff, C. (2021). Information Behavior towards False Information and “Fake News” on Facebook: The Influence of Gender, User Type and Trust in Social Media. In: T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 125–154). https://doi.org/10.5283/epub.44942

Schmidt, T., Dangel, J. & Wolff, C. (2021). SentText: A Tool for Lexicon-based Sentiment Analysis in Digital Humanities. In: T. Schmidt, C. Wolff (Hg.): Information between Data and Knowledge: Information Science and its Neighbors from Data Science to Digital Humanities. Proceedings of the 16th International Symposium of Information Science (ISI 2021). Glückstadt: Verlag Werner Hülsbusch (S. 156–172). https://doi.org/10.5283/epub.44943

DH Regensburg