DH@MI-UR 2018-2020: Analyse moderner kultureller Artefakte (Teil 2) – Memes, Video Games, Webseiten

|

von Aenne Knierim und Thomas Schmidt

Abstract

Dieser Beitrag ist Teil einer Reihe von Beiträgen, die Forschungsprojekte aus den Jahren 2018-2020 im Bereich der Digital Humanities an der Universität Regensburg vorstellen. Diesmal werden ausgewählte Projekte zum Thema „Analyse moderner kultureller Artefakte“ präsentiert: Im Fokus stehen Memes, Videospiel-Magazine und Webseiten. Am Beispiel dreier Forschungsbeiträge des Lehrstuhls für Medieninformatik an unserer Universität wird die Vielfalt der Forschung im Bereich der Digital Humanities illustriert.

Die drei Forschungsbeiträge sind:

  1. Acquisition and Analysis of a Meme Corpus to Investigate Web Culture
  2. Towards an Analysis of Gender in Video Game Culture:ExploringGender-specificVocabularyin Video Game Magazines
  3. Utilizing HTML-analysis and computer vision on a corpusof websitescreenshots to investigate design developmentson the web

1. Memes: Acquisition and Analysis of a Meme Corpus to Investigate Web Culture

Als erstes wird ein Beitrag von Thomas Schmidt, vom Lehrstuhl für Medieninformatik, sowie
Thomas Fischer
Philipp HartlAndreas HilzenthalerDominik Ramsauer, Studierende der Medieninformatik an Universität Regensburg, sowie Christian Wolff (Lehrstuhlinhaber des Lehrstuhls für Medieninformatik) vorgestellt. Das dazugehörige Abstract wurde in Form eines Posters bei der DH 2020, der größten internationalen Digital Humanities-Konferenz, vorgestellt.

Memes sind ein beliebter Teil der heutigen Online-Kultur und sind insbesondere in den sozialen Medien weit verbreitet. Bauckhage (2011) definiert sie als „contents or concepts that spread rapidly among Internet Users“. Memes spiegeln aktuelle Entwicklungen in der Popkultur, der Politik, im Sport oder anderen Bereichen wider. Obwohl es riesige Mengen an Memes gibt, ist der Großteil der Forschung um sie qualitativ. Im Beitrag „Acquisition and Analysis of a Meme Corpus to Investigate Web Culture“ wurde ein quantitativer Ansatz vorgestellt. Ziel war die diachronische Identifizierung von inhaltlichen Entwicklungen und Sentiment.

Technologische Schritte und Einordnung in den Kontext

Es gibt verschiedene Arten von Memes und es erscheinen konstant neue Typen. Der im Projekt untersuchte Meme-Typ heißt imagemacro und beschreibt eine wiederverwendbare Bildvorlage mit Beschriftung (siehe Abbildung 1). Die wiederverwendbare Bildvorlage heißt memetemplate, Abkömmlinge des Memes heißen memederivates. Um die textuelle Komponente zu untersuchen, haben Schmidt et al. allgemeine Textanalyse, Topic Modeling und Sentimentanalyse verwendet. Die Memes stammen von der Plattform knowyourmeme. Für ihre Forschung fokussierten sich Schmidt et al. auf die 16 historisch bedeutsamsten populären Memevorlagen laut knowyourmeme. Die verschiedenen Abkömmlinge eines memetemplates wurden in einem einzelnen Eintrag gesammelt und mit Metadaten angereichert. Die Google Cloud OCR wurde verwendet, um den Text der Memes zu akquirieren.

Abbildung 1: Aufbau des
Meme Typus imagemacro

Ergebnisse

Mithilfe von Topic Modeling konnte eine sogenannte Word Cloud (siehe Abbildung 3) erstellt werden, die die häufigsten Wörter aus dem Korpus zeigt. Hier werden Spezifika der in Memes verwendeten Sprache, wie z.B. die Nutzung von Slang sichtbar.

Abbildung 2: Die WordCloud zeigt
die häufigsten Wörter aus dem Corpus.

Mit dem Latent Dirichlet Allocation Algorithmus wurde Topic Modeling durchgeführt und es konnten die fünf häufigsten Tokens (Wörter) pro Thema und ihre Häufigkeit gezeigt werden (siehe Abbildung 3). «Asexpected, most of the topics are expressions of a single memetemplate […] which shows thatsomememesconsist of homogenous and reoccuringword patterns » 

Abbildung 3 :
Abbildung der häufigsten Wörter

Abbildung 4 zeigt die Ergebnisse der Sentimentanalyse. Die Polarität wurde mit dem Sentimentlexikon „Bing“ (Liu, 2012 und Liu & Zhang, 2012) ermittelt, für die Ermittlung der Emotionen wurde das NRC Word-Emotion Association Lexicon verwendet.

Abbildung 4:
Ergebnisse der Sentimentanalyse

Insgesamt zeigt der Beitrag Möglichkeiten auf, wie mit Hilfe digitaler Methoden und unter Nutzung von Web-Plattformen ein modernes und fluktuierendes Medium wie Memes explorativ untersucht werden kann. Im nächsten Semester soll in einem Kurs diese Methoden angewandt werden um fokussiert politische Memes zu analysieren.

Materialien:

Zitationsinformation:

Schmidt, T., Hartl, P., Ramsauer, D., Fischer, T., Hilzenthaler, A. & Wolff, C. (2020). Acquisition and Analysis of a Meme Corpus to Investigate Web Culture. In Digital Humanities Conference 2020 (DH 2020). Virtual Conference.

2. Towards an Analysis of Gender in Video Game Culture: Exploring Gender-specific Vocabulary in Video Game Magazines

Zu modernen kulturellen Artefakten gehören auch Videospiele, da sie zu den wichtigsten und finanziell erfolgreichsten Medien der Welt gehören und einen signifikanten Einfluss auf die Popkultur haben. In den Geisteswissenschaften hat sich die Bezeichnung gamestudies etabliert. Im Paper „Towards an Analysis of Gender in Video Game Culture: Exploring Gender-specific Vocabulary in Video Game Magazines“ beschreiben die AutorInnen ihre quantitative Forschung zur Darstellung der Geschlechter mittels computergestützter Textanalyse Methoden. Der Beitrag ist ein Short Paper-Beitrag zur Konferenz DHNord 2020 von Thomas Schmidt, Mitarbeiter des Lehrstuhls für Medieninformatik der Universität Regensburg, sowie Isabella Engl, Juliane Herzog und Lisa Judisch, Studierende des Digital Humanities-Master der Universität Regensburg. Es handelt sich bei dem Beitrag um das erste international publizierte Forschungspaper in Zusammenarbeit mit DH-Studierenden. Der Vortrag auf der Tagung ist auch als Video erhältlich: https://youtu.be/5RrznDoAarc 

Moderne Forschung zum Thema Videospiele aus dem Bereich der Gender Studies zeigt, dass Frauen häufig als Sexobjekte dargestellt werden, oft nur sekundäre Rollen einnehmen und häufiger als männliche Figuren nackt gezeigt werden (Dill und Thill 2007, Downs und Smith 2010, Lynch et al. 2016). Charaktere in Videospielen sind hier hingegen häufiger männlich als weiblich und entsprechen männlichen Stereotypen (Dill und Thill 2007, Kirkpatrick 2017). Dill und Thill (2007) schließen aus ihrer Forschung, dass Videospiele eine wichtige Rolle in der Sexualisierung der Frau und insgesamt im Sexismus der Kultur spielen . Da aktuelle Forschung meist qualitativ ist, war das Ziel des Forschungsprojekts von Schmidt et al. computergestützte Textanalyse an einem großen Korpus von Videospiel-Magazinen durchzuführen.

Vorgehensweise

Der Korpus wurde auf der Plattform Internet Archive mit einem Python-Script gescraped. Die Webseite bietet OCR.Scans von Videospiel-Magazinen in verschiedenen Sprachen an. Für die Analyse wurden die Magazine Computer Gaming World (1981-2006), Computer and Video Games Magazines (1981-2004) und PC Zone Magazines (1993-2011) betrachtet. Um die OCR-Scans zu verbessern, wurde die Bibliothek symspellpy verwendet. Für allgemeine Textverarbeitungsschritte wurde das Natural Language Toolkit verwendet. Abbildung 5 zeigt allgemeine Daten zum Korpus.

Abbildung 5:
Allgemeine Texteigenschaftendes Videospiel-Magazin Korpusses

Um Aspekte der Geschlechterdarstellung im Korpus zu analysieren, haben sich Schmidt et al auf die Nutzung und Verteilung des gender-spezifischen Vokabulars in verschiedenen Zeitspannen konzentriert. Dafür wurde die in der Psychologieforschung etablierte linguistische Ressource Linguistic Inquiry and Word Count von 2015 verwendet. Schmidt et al haben manuell negativ konnotierte „weibliche“ Worte hinzugefügt, um misogyne Tendenzen im Korpus zu erforschen. In der allgemeinen quantitativen Untersuchung ist erkennbar, dass die am häufigsten verwendeten Wörter Pronomen sind. Wörter, die Gaming-Inhalte für Männer beschreiben sind „king“ und „manager“, für Frauen sind es Wörter, die familiäre Beziehung beschreiben, z.B. „sis“, „mother“ und das Wort „queen“.

Abbildung 6:
Häufigste männliche und weibliche
Wörter pro Zeitspanne

Für eine vertiefte Analyse der Wahrnehmung von Frauen in Videospiel-Magazinen im Laufe der Zeit wurden sechs Wörter mit starker negativer Konnotation ausgesucht und ihre Nutzungsfrequenz untersucht. Die Wörter sind: chick, bitch, slut, pussy, harlot, strumpet, hooker, wench, whore. Dabei wurde ein eindeutiges Wachstum in der Nutzung festgestellt.

Abbildung 7:
Anteil der negativen weiblichen Wörter unter allen Wörtern basierend auf der Zeitspanne

Die hier erkennbare Sexualisierung stimmt mit der qualitativen Forschung überein. Momentan sind die hier gezeigten Daten nur deskriptiv. Schmidt et al. wollen in zukünftigen Arbeiten herausfinden, ob der dargestellte Trend mit stärkerer statistischer Analyse persistent ist. Es ist auch nicht sicher, ob der Trend spezifisch für Videospiele gilt oder die Daten insgesamt Trends der Popkultur in dieser Zeit darstellen. Mehr Forschung mit vergleichbaren Artefakten der Popkultur sind für die Beantwortung dieser Frage notwendig.

Materialien:

Zitationsinformation:

Schmidt, T., Engl, I., Herzog. J. & Judisch, L. (2020). Towards an Analysis of Gender in Video Game Culture: Exploring Gender-specific Vocabulary in Video Game Magazines. In Proceedings of the Digital Humanities in the Nordic Countries 5th Conference (DHN 2020). Riga, Latvia.

3. Utilizing HTML-analysis and computer vision on a corpus of website screenshots to investigate design developments on the web

Das World Wide Web ist ein wichtiger Teil der modernen Medieninfrastruktur und -gesellschaft. Das Paper «Utilizing HTML-analysis and computer vision  on a corpus of website screenshots to investigate design developments on the web» präsentiert erste Ergebnisse eines Projekts, das die Designentwicklung populärer Webseiten zwischen 1996 und 2020 zeigt. Das Poster wurde auf dem 83rd Annual Meeting of the Association for Information Science and Technology (ASIS&T 2020) vorgestellt und ist in einem Kurs zu visuellen Methoden des Digital Humanities-Master entstanden. AutorInnen sind der Mitarbeiter des Lehrstuhls Thomas Schmidt, der Lehrstuhlinhaber Prof. Christian Wolff sowie die Studierenden des Digital Humanities Masters Anastasiia Mossiienko, Raffaela Faber und Juliane Herzog.

Mittels HTML Analyse und einfacher Computer Vision-Methoden  konnte eine quantitativen Analyse bezüglich HTML Elementen, Farbverteilungen und visueller Komplexität im Laufe der Jahre von Webseiten durchgeführt werden.

Abbildung 8:
Websites des Korpusses und Anzahl der Snapshots. Für den Korpus wurden die 50 im Dezember 2019 populärsten Webseiten laut der analytischen Plattform Alexa analysiert.

Metriken der Analyse

Schmidt et al. haben die quantitativen Metriken (a) HTML Metriken, (b) Screenshot-Größe, (c) Farbmetriken analysiert. Die Anzahl der Bilder wurde über das img-Tag, die Anzahl der Hyperlinks über das a-Tag und die Gesamtanzahl der Wörter in der HTML-Datei gezählt. Eine weitere Metrik ist die Größe der Screenshots, gemessen in Kilobyte nach PNG-Dateien. Dies ist eine etablierte Metrik zur Messung der visuellen Komplexität und korreliert nachweislich mit der menschlichen Wahrnehmung von Komplexität (Purchase et al., 2012); je größer, desto komplexer ein Bild. Zudem wurde der Farbanteil berechnet.

Abbildung 9:
Durschnittliche Anzahl der Bilder pro Jahr
Abbildung 10:
Durchschnittliche Anzahl der Wörter pro Jahr
Abbildung 11:
Durschnittliche Anzahl der Hyperlinks pro Jahr

Für die Anzahl der Bilder und Hyperlinks kann eine stetige Zunahme bis 2014 festgestellt werden, gefolgt von einer stetigen Abnahme. Eine ähnliche Entwicklung kann bis 2016 für Text festgestellt werden. Die Farbanalyse zeigt, dass Schwarz und Weiß die dominantesten Farben sind, da Weiß eine viel genutzte Hintergrundfarbe und Schwarz die dominante Schriftfarbe ist. Es kann nachgewiesen werden, dass 80% des Platzes auf Webseiten weiß ist.  Von den bunten Farben sind Rot und Blau am meisten genutzt.

Abbildung 12:
Durchschnittlicher Anteil von schwarz und weiß auf Webseiten.
Abbildung 13:
Durschnittlicher Anteil von rot, blau, grün und gelb pro Jahr

Bis 2014 wurde ein stetiger Anstieg der HTML-Tags, gefolgt von einem deutlichen Rückgang  festgestellt. Ein ähnlicher, aber weniger starker Trend wurde für die Anzahl der Wörter gefunden. Schmidt et al stellen die Hypothese auf, dass diese Ergebnisse einen Trend im Webdesign darstellen, bis 2014 mehr Inhalte einzubinden, was mit Sicherheit durch größere technische Möglichkeiten erklärbar ist. Schmidt et al. stellen ab 2014 eine Tendenz zu minimalistischerem Design fest, dem Gegenteil der stetigen Zunahme der visuellen Komplexität.

Materialien:

Zitationsinformation:

Schmidt, T., Mosiienko, A., Faber, R., Herzog, J., & Wolff, C. (2020). Utilizing HTML‐analysis and computer vision on a corpus of website screenshots to investigate design developments on the web. Proceedings of the Association for Information Science and Technology, 57(1), e392. DOI: 10.1002/pra2.392

Kontakt:

Thomas Schmidt

E-Mail: thomas.schmidt@ur.de

Twitter: https://twitter.com/thomasS_UniR

Literatur:

Bauckhage, C. (2011, July). Insights into internet memes. In Fifth International AAAI Conference on Weblogs and Social Media.

Dill, K. E., & Thill, K. P. (2007). Video game characters and the socialization of gender roles: Young people’s perceptions mirror sexist media depictions. Sex roles, 57(11), 851-864.

Downs, E., & Smith, S. L. (2010). Keeping abreast of hypersexuality: A video game character content analysis. Sex roles, 62(11), 721-733.

Kirkpatrick, G. (2017). How gaming became sexist: a study of UK gaming magazines 1981–1995. Media, Culture & Society39(4), 453-468.

Liu, B. (2012). Sentiment analysis and opinion mining. Synthesis lectures on human language technologies, 5(1), 1-167.

Liu, B., & Zhang, L. (2012). A survey of opinion mining and sentiment analysis. In Mining text data (pp. 415-463). Springer, Boston, MA.

Lynch, T., Tompkins, J. E., Van Driel, I. I., & Fritz, N. (2016). Sexy, strong, and secondary: A content analysis of female characters in video games across 31 years. Journal of Communication, 66(4), 564-584.

Purchase, H. C., Freeman, E., & Hamer, J. (2012, July). An exploration of visual complexity. In International Conference on Theory and Application of Diagrams (pp. 200-213). Springer, Berlin, Heidelberg.

Schmidt, T., Engl, I., Herzog. J. & Judisch, L. (2020). Towards an Analysis of Gender in Video Game Culture: Exploring Gender-specific Vocabulary in Video Game Magazines. In Proceedings of the Digital Humanities in the Nordic Countries 5th Conference (DHN 2020). Riga, Latvia.

Schmidt, T., Hartl, P., Ramsauer, D., Fischer, T., Hilzenthaler, A. & Wolff, C. (2020). Acquisition and Analysis of a Meme Corpus to Investigate Web Culture. In Digital Humanities Conference 2020 (DH 2020). Virtual Conference.

Schmidt, T., Mosiienko, A., Faber, R., Herzog, J., & Wolff, C. (2020). Utilizing HTML‐analysis and computer vision on a corpus of website screenshots to investigate design developments on the web. Proceedings of the Association for Information Science and Technology, 57(1), e392. https://doi.org/10.1002/pra2.392

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert