diff --git a/2022_003_schilz/schilz_crowdsourcing_2021_dc.xml b/2022_003_schilz/crowdsourcing_2022_v1_0_dc.xml similarity index 100% rename from 2022_003_schilz/schilz_crowdsourcing_2021_dc.xml rename to 2022_003_schilz/crowdsourcing_2022_v1_0_dc.xml diff --git a/2022_004_schumacher/2015_011_schumacher_timm_dc.xml b/2022_004_schumacher/timm_2022_v1_0_dc.xml similarity index 100% rename from 2022_004_schumacher/2015_011_schumacher_timm_dc.xml rename to 2022_004_schumacher/timm_2022_v1_0_dc.xml diff --git a/2022_005_goldberg/2022_001_Goldberg_Urbanonyme_dc.xml b/2022_005_goldberg/urbanonyme_v1_0_dc.xml similarity index 100% rename from 2022_005_goldberg/2022_001_Goldberg_Urbanonyme_dc.xml rename to 2022_005_goldberg/urbanonyme_v1_0_dc.xml diff --git a/2022_007_andresen_et_al/nachnutzung_andresen_et_al_2021_dc.xml b/2022_007_andresen_et_al/nachnutzung_2021_v1_0_dc.xml similarity index 100% rename from 2022_007_andresen_et_al/nachnutzung_andresen_et_al_2021_dc.xml rename to 2022_007_andresen_et_al/nachnutzung_2021_v1_0_dc.xml diff --git a/2022_008_muenkner_et_al/2021_004_muenkner_sturm_dc.xml b/2022_008_muenkner_et_al/sturm_2021_v1_0_dc.xml similarity index 100% rename from 2022_008_muenkner_et_al/2021_004_muenkner_sturm_dc.xml rename to 2022_008_muenkner_et_al/sturm_2021_v1_0_dc.xml diff --git a/2022_009_dimpel/dimpel_gattungssignal_2022_002_dc.xml b/2022_009_dimpel/gattungssignal_2022_v1_0_dc.xml similarity index 100% rename from 2022_009_dimpel/dimpel_gattungssignal_2022_002_dc.xml rename to 2022_009_dimpel/gattungssignal_2022_v1_0_dc.xml diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_001.png b/2022_011_doerpinghaus/wissensgraphen_2022_001.png new file mode 100644 index 0000000000000000000000000000000000000000..8817811c12fff2b41c79951bd031908775930a43 Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_001.png differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_002.png b/2022_011_doerpinghaus/wissensgraphen_2022_002.png new file mode 100644 index 0000000000000000000000000000000000000000..a660f3fc4a62490e0d060ac43dd54638069567fe Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_002.png differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_003.png b/2022_011_doerpinghaus/wissensgraphen_2022_003.png new file mode 100644 index 0000000000000000000000000000000000000000..ded4ea1fa2cbf026e28a79d0001d6bf222adf32f Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_003.png differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_004.png b/2022_011_doerpinghaus/wissensgraphen_2022_004.png new file mode 100644 index 0000000000000000000000000000000000000000..67744d0f90693f98135d4a6dd52c1adeb4e7da02 Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_004.png differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_005.png b/2022_011_doerpinghaus/wissensgraphen_2022_005.png new file mode 100644 index 0000000000000000000000000000000000000000..70f003e4287689c4061cb7af028c3e8425400f9c Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_005.png differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.pdf b/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.pdf new file mode 100644 index 0000000000000000000000000000000000000000..573a55d2dceda6fe6ff3c45d981fd71792c383dc Binary files /dev/null and b/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.pdf differ diff --git a/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.xml b/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.xml new file mode 100644 index 0000000000000000000000000000000000000000..322e10a713e2aed180ad80f81c8a5487b2a65df3 --- /dev/null +++ b/2022_011_doerpinghaus/wissensgraphen_2022_v1_0.xml @@ -0,0 +1,1761 @@ +<?xml version="1.0" encoding="utf-8"?><?xml-model + href="https://www.zfdg.de/sites/default/files/schema/tei_zfdg.rnc" type="application/relax-ng-compact-syntax" + ?> +<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html" + xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink" + xmlns:xhtml="http://www.w3.org/1999/xhtml"> + <teiHeader> + <fileDesc> + <titleStmt> + <title> + <biblStruct> + <analytic> + <title level="a">Wissensgraphen: Interdisziplinäre Perspektiven für Linked Data + in den Geistes- und Sozialwissenschaften</title> + <respStmt> + <resp> + <persName> + <name role="marc_aut"> + <forename>Jens</forename> + <surname>Dörpinghaus</surname> + </name> + <email>jens.doerpinghaus@bibb.de</email> + <idno type="gnd">1159997500</idno> + <idno type="orcid">0000-0003-0245-7752</idno> + </persName> + </resp> + <orgName>Bundesinstitut für Berufsbildung (BIBB)</orgName> + <orgName>Universität + Koblenz-Landa</orgName> + </respStmt> + <idno type="doi">10.17175/2022_011</idno> + <idno type="ppn">1819368734</idno> + <idno type="zfdg">2022.011</idno> + <idno type="url">https://www.zfdg.de/node/380</idno> + <date when="2022-12-12">12.12.2022</date> + </analytic> + <monogr> + <title level="j">Zeitschrift für digitale Geisteswissenschaften</title> + <respStmt> + <resp>Publiziert von</resp> + <orgName role="marc_pbl">Herzog August Bibliothek</orgName> + </respStmt> + <respStmt> + <resp>Transformation der Word Vorlage nach TEI</resp> + <persName/> + <name role="marc_trc"> + <surname>Baumgarten</surname> + <forename>Marcus</forename> + <idno type="gnd">1192832655</idno> + </name> + </respStmt> + <availability status="free"> + <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref> + </p> + </availability> + <biblScope unit="year">2022</biblScope> + <biblScope unit="artikel">11</biblScope> + </monogr> + </biblStruct> + </title> + </titleStmt> + <editionStmt> + <edition>Elektronische Ausgabe nach TEI P5</edition> + </editionStmt> + <publicationStmt> + <distributor> + <name> + <orgName>Herzog August Bibliothek Wolfenbüttel</orgName> + </name> + </distributor> + <idno type="doi">10.17175/zfdg.01</idno> + <idno type="ppn">0819494402</idno> + <authority> + <name>Herzog August Bibliothek</name> + <address> + <addrLine>Lessingplatz 1</addrLine> + <addrLine>38304 Wolfenbüttel</addrLine> + </address> + </authority> + <authority> + <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name> + <address> + <addrLine>Burgplatz 4</addrLine> + <addrLine>99423 Weimar </addrLine> + </address> + </authority> + <availability status="free"> + <p> Sofern nicht anders angegeben </p> + <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence> + </availability> + <availability status="free"> + <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund + MWW</ref> + </p> + </availability> + </publicationStmt> + <sourceDesc> + <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p> + </sourceDesc> + </fileDesc> + <encodingDesc> + <editorialDecl> + <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und + XSLT-Skripten</p> + <p>Medienrechte liegen bei den Autor*innen</p> + <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von + <persName>Caroline Jansky</persName>.</p> + <p>All links checked<date when="2022">25.11.2022</date> + </p> + </editorialDecl> + </encodingDesc> + <profileDesc> + <creation>Einreichung als Artikel der Zeitschrift für digitale + Geisteswissenschaften</creation> + <langUsage> + <language ident="de">Text in Deutsch</language> + <language ident="de">Abstract in Deutsch</language> + <language ident="en">Abstract in Englisch</language> + </langUsage> + <textClass> + <keywords scheme="gnd"> + <term>Wissensgraph<ref target="1241153396"/> + </term> + <term>Linked Data<ref target="7863462-3"/> + </term> + <term>Interdisziplinarität<ref target="4449808-1"/></term> + <term>Graphentheorie<ref target="4113782-6"/></term> + <term>Geisteswissenschaften<ref target="4019838-8"/></term> + </keywords> + </textClass> + </profileDesc> + <revisionDesc> + <change when="2022-12-13" who="Caroline Jansky" n="1.1" status="published"> + <p>Folgende Änderungen wurden vorgenommen: Redaktionelle Korrekturen in Bibliografie und Abbildungsverzeichnis.</p> + </change> + </revisionDesc> + </teiHeader> + <text> + <body> + <div> + <div type="abstract"> + <argument xml:lang="de"> + <p><term type="dh">Wissensgraphen</term> und <term type="dh" + >Netzwerkansätze</term> sind in ganz verschiedenen Disziplinen ein immer + lebhafteres Forschungsthema. Dieser Artikel würdigt ihre parallele Entwicklung + in Anwendung und Mathematik und die verschiedenen gegenwärtigen Ansätze + zwischen Informatik, Mathematik, Data Science und den Geistes- und + Sozialwissenschaften. Daraus ergeben sich zentrale interdisziplinäre + Perspektiven: Erstens müssen die Netzwerkansätze in den Geistes- und + Sozialwissenschaften breiter gefasst werden, da sich durch die Verwendung von + <term type="dh">Linked Data</term> bereits implizit Wissensnetzwerke + ergeben. Zweitens ergeben sich durch die methodische Breite von Wissensgraphen, + in der beispielsweise soziale Netzwerke als Wissensgraphen aufgefasst werden + können, neue Werkzeuge und neue Analysemethoden. Insofern versteht sich dieser + Beitrag als Plädoyer für den interdisziplinären Austausch und eine vertiefte + Diskussion über Methoden, Algorithmen und Linked Data Ansätze.</p> + </argument> + <argument xml:lang="en"> + <p><term type="dh">Knowledge graphs</term> and <term type="dh">network + approaches</term> are an increasingly vibrant research topic in quite + different disciplines. This article acknowledges their parallel development in + applied and mathematical fields, and the various current approaches between + computer science, mathematics, data science, and the humanities and social + sciences. This gives rise to key interdisciplinary perspectives: first, network + approaches in the humanities and social sciences need to be broader, as + knowledge networks are already implicit in the use of <term type="dh">Linked + Data</term>. Second, the methodological breadth of knowledge graphs, in + which, for example, social networks can be conceived as knowledge graphs, + results in new tools and new methods of analysis. In this respect, this paper + is intended as a plea for interdisciplinary exchange and in-depth discussion of + methods, algorithms, and Linked Data approaches.</p> + </argument> + </div> + <div type="chapter"> + <head>1. Einleitung</head> + + <p>Wissensgraphen spielen in der Informatik seit vielen Jahren eine immer größer + werdende Rolle für die Speicherung und Analyse großer Datenmengen. Dabei werden + sie aber auch in der interdisziplinären Forschung, z. B. in der Bio- und + Medizininformatik, immer häufiger verwendet. Das Gebiet der Graphentheorie + wiederum ist ein Teilgebiet der Mathematik. Und ebenso gibt es auch eine große + methodische Überschneidung mit den Netzwerkansätzen in den Geistes- und + Sozialwissenschaften. In dieser Arbeit soll zunächst untersucht werden, inwiefern + diese verschiedenen Perspektiven methodisch übereinstimmen. Für eine + interdisziplinäre Perspektive auf Wissensgraphen sollen auch Synergien, sowie Vor- + und Nachteile ihrer Verwendung für bestimmte Fragestellungen in den digitalen + Geistes- und Sozialwissenschaften diskutiert werden.</p> + <p>Aufgrund der verschiedenen Anwendungsfälle gibt es vielfältige – aber äquivalente + – Konzepte und damit auch Arten, Wissensgraphen zu verwenden: Im Bereich des + Semantic Web spricht man von Wissensgraphen bzw. Knowledge Graphen, im Bereich der + Datenverarbeitung und Datenbanken von Labeled Property Graphs und in der + Graphentheorie schlicht von Graphen. Dieser Artikel möchte nun nicht nur die + verschiedenen Begrifflichkeiten einführen und ihre Perspektiven und Schnittmengen + diskutieren, sondern auch einen Überblick über die Entwicklung der Methoden in den + Disziplinen der Graphentheorie (diskrete Mathematik), der Informatik (Algorithmik) + und der Data Sciences (Graphdatenbanken und Semantic Web) geben. Daraus ergibt + sich die Möglichkeit, Stärken und Schwächen von Wissensgraphen unter bestimmten + Vorbedingungen darzustellen und zu würdigen. Es folgt deshalb in <ref + type="intern" target="#hd6">Abschnitt 3</ref> ein Blick ›zurück‹ in Form eines + kurzen Forschungsüberblickes auf die Graphentheorie, der insbesondere die + interdisziplinäre Verwendung von Netzwerkansätzen thematisiert.</p> + <p>In <ref type="intern" target="#hd7">Abschnitt 4</ref> möchte der Artikel auf die + Besonderheiten der Verwendung von Wissensgraphen in den Geistes- und + Sozialwissenschaften eingehen: Die Stärke von Wissensgraphen liegt in der + einfacheren und übersichtlicheren Speicherung (vormals) unstrukturierter Daten. + Gerade durch diesen methodischen Schritt der Datenrepräsentation ergibt sich nicht + nur wissenschaftstheoretisch der interdisziplinäre Schritt von der Hauptdisziplin + (z. B. der Biologie oder Soziologie) in die Informatik und Mathematik, sondern + auch ein formales Datenschema für verknüpfte Datensätze, also <term type="dh" + >Linked Data</term>. Dies ist besonders wichtig mit Blick auf die + Interoperabilität von Daten und die Reproduzierbarkeit von wissenschaftlichen + Ergebnissen. Hierbei ergibt sich auch ein Ausblick auf <bibl> + <title type="desc">FAIR Data</title> + </bibl> + <note type="footnote"> Vgl. <ref type="bibliography" target="#wilkinson_fair_2016">Wilkinson et al. 2016</ref>.</note>. Damit werden in <ref + type="intern" target="#hd7">Abschnitt 4</ref> die Ergebnisse aus den vorherigen + Abschnitten zusammengefasst.</p> + <p>Abschließend soll – mit einem Blick ›nach vorne‹ – in <ref type="intern" + target="#hd8">Abschnitt 5</ref> die größtenteils unabhängige Entwicklung von + Netzwerkansätzen in den Geistes- und Sozialwissenschaften anhand ausgewählter + Beispiele wie der <term type="dh">sozialen Netzwerkanalyse</term> (SNA) oder der + <term type="dh">Computational Social Sciences</term> dargestellt werden. + Hierbei soll detailliert aufgeschlüsselt werden, welche Vorteile sich aus dem + Konzept von Linked Data ergeben. Somit ist dieses Kapitel als praktische Reflexion + des vorher diskutieren zu verstehen. Ein <ref type="intern" target="#hd9">Fazit und + Ausblick</ref> bildet den Abschluss dieses Textes.</p> + </div> + <div type="chapter"> + <head>2. Wissensgraphen aus verschiedenen Perspektiven</head> + <p>Interessanterweise werden für Wissensgraphen zwei philosophische Konzepte + sprachlich aufgegriffen: Man spricht von <term type="dh">Entitäten</term> + (englisch <term type="dh">Entities</term>) und verwendet ebenso – allerdings nicht + durchgängig – den Begriff der <term type="dh">Ontologie</term> (englisch <term + type="dh">Ontology</term>). Eine Entität ist ein konkretes, abgrenzbares, + abstraktes Objekt aus der realen Welt, dessen Informationen gespeichert und + verarbeitet werden können. Dies kann beispielsweise eine Person, ein Auto oder ein + Produkt sein. Eine Entität wird aus Sicht der Informatik als Datenpunkt durch ihre + Attribute und Eigenschaften definiert. In der Philosophie können – ohne im Detail + darauf einzugehen – verschiedene Abstraktionen einer Entität untersucht + werden<note type="footnote"> + <quote>Diese Abstraktion kann die singuläre bzw. sinnenhafte Materie, d.h. + diesen oder jenen Körper, betreffen: abstractio physica. Sie kann sich aber + auch sowohl auf die singuläre wie allgemeine Materie beziehen, die wie + erstere ebenfalls nur secundum rationem abstrahiert wird. Das ist die + abstractio mathematica und die abstractio ὀντολογική, das bedeutet: die in + der Philosophie vom Seienden bzw. den Transzendentien stattfindende + Abstraktion. Schließlich gibt es eine Abstraktion von der Materie secundum + rem und secundum rationem. Das ist die abstractio transnaturalis, die auf + Gott und die Intelligenzen zutrifft.</quote> <ref type="bibliography" target="#kremer_ontologie_2017">Kremer / Wolf 2017</ref>.</note>. + Dabei ist diese auch für andere Geisteswissenschaften elementar: So treten + besondere Probleme auf, <quote>wenn Forscher versuchen, große Datenmengen + computergestützt zu analysieren und dann in ihren synchronen und diachronen + Verhältnissen darzustellen, denn dies erfordert eine Abstraktion von den + tatsächlichen Forschungsgegenständen.</quote> + <note type="footnote"> <ref type="bibliography" target="#krischel_netzwerkanalyse_2009">Krischel et al. 2009</ref>, S. 589.</note> Diese Problemstellung + wird uns im interdisziplinären Gespräch begleiten.</p> + <p>Eine Ontologie umfasst nunmehr meist eine formal geordnete Darstellung und + Definition von Eigenschaften und Beziehungen zwischen den einzelnen Entitäten. + Daniel von Wachter fasst die philosophische Sicht so zusammen: <quote>Ziel in der + Ontologie ist es herauszufinden, was die grundlegenden Bestandteile der Welt + oder eines Bereiches der Welt sind und in was für Zusammenhängen diese + Bestandteile stehen. Ziel ist es, ontische Strukturen der Welt zu + entdecken.</quote> + <note type="footnote"> <ref type="bibliography" target="#wachter_dinge_2000">von Wachter 2000</ref>, S. 10.</note> Interessanterweise kommen + Ontologien vor allem in der Bioinformatik zum Einsatz<note type="footnote"> Vgl. + beispielsweise <ref type="bibliography" target="#dessimoz_gene_2017">Dessimoz / Å kunca (Hg.) 2017</ref>.</note>, ein Zusammenhang, der im <ref + type="intern" target="#hd3">nächsten Abschnitt</ref> näher untersucht werden + soll. Grundsätzlich bleibt aber in jeder Geisteswissenschaft das Problem der + Hermeneutik bzw. der hermeneutischen Reichweite auch für Daten bestehen. So + definiert Wettlaufer für die Geschichtswissenschaft: <quote>Was aber ist mit + hermeneutischer Reichweite genau gemeint? Ich verstehe darunter die + Möglichkeit, mit digitalen Methoden ein besseres Textverständnis zu erzielen, + als dies ohne diese Methoden möglich wäre.</quote> + <note type="footnote"> <ref type="bibliography" target="#wettlaufer_erkenntnisse_2016">Wettlaufer 2016</ref>.</note> Aber auch hier spannt sich der + Bogen zur Biologie: <quote>Ebenso wie das Quellenproblem tritt das + Interpretationsproblem in Biologie, Linguistik und Geschichte auf. Schon die + Vorauswahl der Daten, die zur Analyse herangezogen werden, ist ein + Interpretationsvorgang.</quote> + <note type="footnote"> <ref type="bibliography" target="#krischel_netzwerkanalyse_2009">Krischel et al. 2009</ref>, S. 587.</note> Insofern treten gerade + in diesem interdisziplinären Arbeiten die im Bereich Data Science typischen + Problemstellungen auf: Der sogenannte <term type="dh">Data Lifecycle</term> + beinhaltet die vier Schritte: </p> + <list type="ordered"> + <item>Daten sammeln bzw. wiederverwenden </item> + <item>Daten speichern </item> + <item>Daten verarbeiten und </item> + <item>Daten analysieren</item> + </list> + <p>Ein Netzwerkansatz muss diese vollständig umfassen und in jedem Schritt können + Verzerrungen entstehen.</p> + <p>Auf die konkreten Vorteile von Ontologien aus Sicht der Informatik soll in den + nächsten Teilabschnitten eingegangen werden. Allerdings müssen nicht alle + Wissensgraphen als Ontologie ausgeführt werden. </p> + <p>Für Anwendungen, die weniger komplexe Datenmodelle verarbeiten, werden teilweise + simplere Schemata definiert, welche verschiedene Bezeichnungen tragen. Teilweise + werden in der Fachliteratur nur Schlagworte verwendet, welche mehrere Modelle + umfassen. Über die Definitionen unterschiedlicher Modelle zur Organisation von + Wissen existieren mehrere Standards<note type="footnote"> Vgl. <ref type="bibliography" target="#zeng_knowledge_2007">Zeng et al. + 2007</ref>.</note>. Ein häufig verwendeter Überbegriff ist <term type="dh">Controlled + Vocabularies</term>. Diese umfassen Systeme mit allgemeinen Sammlungen von + Bezeichnungen. Ihre Komplexität reicht von einfachen Wortlisten, Synonymlisten, + Taxonomien bis hin zu komplexen Thesauri. Oft werden diese Konzepte synonym mit + Terminologien verwendet, die nicht etwa für die ›Lehre von Fachbegriffen‹ stehen, + sondern für ein Datenmodell. Dies beinhaltet eine konkrete Sammlung von Werten, + d. h. Entitäten, die einem gemeinsamen Fach- oder Anwendungsgebiet angehören. + Zusammen bilden sie das grundlegende Vokabular, mit welchem argumentiert wird. + Eine digital verarbeitete Definition solchen Wissens ist hilfreich, trotzdem gibt + es keinen technischen Standard für Terminologien. </p> + <p>Bevor wir uns mit den Grundlagen der weiteren formalen Definition von Netzwerken + zuwenden, soll zunächst auf einen für die Geistes- und Sozialwissenschaften im + Allgemeinen prägenden Aspekt eingegangen werden. Der Netzwerkgedanke ist hier + hochgradig mit der Visualisierung verknüpft: <quote>Häufig können über + Visualisierungen Sachverhalte verdeutlicht werden, die sonst nur schwer + sprachlich umschrieben werden können, und da Computer die idealen Werkzeuge + sind, um große Datenmengen zu visualisieren, bietet sich eine Verknüpfung + geradezu an.</quote> + <note type="footnote"> <ref type="bibliography" target="#wettlaufer_erkenntnisse_2016">Wettlaufer 2016</ref>.</note> In der Tat finden Netzwerkansätze + nicht selten ein ›natürliches Gegenüber‹ in verschiedenen Fragestellungen, etwa in + der <quote>biographischen Narrativbildung</quote>, wobei es der <quote>Theorie der + digitalen Methodik [weit eher] entsprechen [würde], diese Form der + biographischen Narrativbildung durch einen Netzwerkansatz zu ersetzen, d. h. + Biographien von vornherein in ihrer gegenseitigen Verzahnung zu denken.</quote> + <note type="footnote"> <ref type="bibliography" target="#baillot_vernetzung_2019">Baillot / Busch 2019</ref>, S. 26.</note> Allerdings hat die + Anwendung von Netzwerkansätzen in den Geistes- und Sozialwissenschaften auch eine + gewisse Beliebigkeit. So fasst Gramsch für die historische Forschung zusammen: + <quote>Rezipiert wird von ihnen meist nur der Begriff, nicht aber das + mathematisch-statistische Methodenrepertoire, das mit ihm in Verbindung steht. + Dies ist soweit legitim, wie der Gebrauch einer Metapher unmittelbar Einsichten + vermitteln kann.</quote> + <note type="footnote"> <ref type="bibliography" target="#gramsch_muster_2016">Gramsch 2016</ref>, S. 85.</note> Auch dieser Aspekt soll im + interdisziplinären Gespräch noch genauer analysiert werden.</p> + <p>Doch auch im Bereich der Informatik und Mathematik sind die Begriffsbilder nicht + eindeutig: Im Semantic Web spricht man von Knowledge Graphen, im Bereich der + Datenverarbeitung und Datenbanken von Labeled Property Graphs und in der + Graphentheorie schlicht von Graphen.</p> + <p>Es fehlen allerdings eine globale wissenschaftstheoretische Verortung und eine + interdisziplinäre Perspektive auf Netzwerke und Graphen: Zum einen ist die + Wahrnehmung der Anwendungen aus den Geistes- und Sozialwissenschaften und ihrer + theoretischen Anforderungen in den Naturwissenschaften bestenfalls eine + Randerscheinung. Gleichzeitig werden die theoretischen Erkenntnisse, Ansätze und + Methoden aus den Naturwissenschaften in den digitalen Geistes- und + Sozialwissenschaften noch recht spärlich aufgenommen<note type="footnote"> Gerade + der Bereich von Linked Data findet allerdings in letzter Zeit mehr + Aufmerksamkeit, vgl. <ref type="bibliography" target="#baas_dastani_2021">Baas et al. 2021</ref>; + <ref type="bibliography" target="#koho_person_2020">Koho et al. 2020</ref>; + <ref type="bibliography" target="#wettlaufer_schritt_2018">Wettlaufer + 2018</ref>.</note>. Dies liegt sicherlich zum einen in der Datenmenge (<term + type="dh">Big Data</term> findet sich bei oft händisch kuratiertem Wissen + kaum), aber auch im Fehlen sprachlicher und methodischer Anknüpfungspunkte + zwischen den Disziplinen begründet. Über diesen Graben der interdisziplinären + Arbeit möchte der Artikel – wenn schon keine Brücke – dann doch zumindest ein + weiteres Seil spannen und für eine enge Zusammenarbeit der verschiedenen + Disziplinen werben.</p> + <p>So soll nun zunächst das mathematische Konzept eines Netzwerks, das des Graphen, + diskutiert werden.</p> + <div type="subchapter"> + <head>2.1 Das mathematische Konzept eines Graphen</head> + + <p>Die Graphentheorie ist ein Teilgebiet der diskreten Mathematik. In der Physik, + der Mathematik, der Biologie, den Biowissenschaften und anderen Bereichen wird + das Konzept eines Graphen oft als Netzwerk bezeichnet. Im folgenden Abschnitt + verwenden wir den Begriff des Graphen und schließen dabei Netzwerke mit + ein.</p> + <p>Ein Graph <formula>G = (V, E)</formula> ist definiert durch die Menge + <formula>V</formula> der Knoten (englisch <term type="dh">vertices</term>) + und die Menge der Kanten <formula>E</formula>. Zwei Knoten + <formula>u, v ∈ V</formula> sind benachbart oder Nachbarn, wenn eine Kante + <formula>{u, v} ∈ E</formula> zwischen beiden existiert. Ein Graph + <formula>G</formula> wird gerichtet genannt, wenn die Kanten eine Richtung + haben. In diesem Fall ist <formula>(u, v) ≠ (v, u)</formula>. Ein Graph ist <hi + rend="italic">ungerichtet</hi>, wenn die Kanten keine Richtung haben. Dies + bedeutet, dass in einem ungerichteten Graphen + <formula>(u, v) ∈ E ⇔ (v, u) ∈ E</formula>.</p> + <p>Im Allgemeinen wird zwischen dem mathematischen Konzept eines Graphen und + seiner Darstellung, d. h. der Visualisierung unterschieden. Ein Graph kann + verschiedene Darstellungen haben, die für die visuelle Analyse jeweils andere + Informationen vermitteln (vgl. <ref type="graphic" target="#wissensgraphen_2022_001" + >Abbildung 1</ref>). Wenn wir einen gerichteten Graphen zeichnen, haben die + Kanten eine Richtung, die durch einen Pfeil angezeigt wird.</p> + <figure> + <graphic xml:id="wissensgraphen_2022_001" url=".../medien/wissensgraphen_2022_001.png"> + <desc> + <ref type="graphic" target="#abb1">Abb. 1</ref>: Verschiedene Darstellungen desselben Graphen. Jede + Darstellung vermittelt visuell andere Informationen, die + darunterliegenden mathematischen Strukturen bleiben allerdings + identisch. [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_001"/> + </desc> + </graphic> + </figure> + <p>Klassische Fragestellungen der (algorithmischen) Graphentheorie lassen sich + grob in lokale und globale Probleme unterteilen (vgl. <ref type="graphic" + target="#wissensgraphen_2022_002">Abbildung 2</ref>).<note type="footnote"> Zur + genauen Herleitung, vgl. <ref type="bibliography" target="#doerpinghaus_graph_2022">Dörpinghaus / Stefan 2020</ref>.</note> Lokale Probleme + betrachten in jedem Schritt stets nur einen Knoten und beispielsweise seine + Nachbarn. Dies betrifft etwa die Suche nach kürzesten Wegen (englisch <term + type="dh">shortest paths</term>) oder die Suche nach einfachen Mustern + (engl. <term type="dh">pattern matching</term>). Globale Probleme benutzen + neben den lokalen Strukturen auch weitere Informationen des Graphen, so z. B.. + die <term type="dh">Graphdurchmusterung</term> (Breitensuche, Tiefensuche), die + auch die Informationen über schon besuchte Knoten berücksichtigt. Weitere + Beispiele sind die <term type="dh">Wegesuche</term>, <term type="dh">Minimale + Spannbäume</term>, <term type="dh">Zentralitätsmaße</term>, <term type="dh" + >Subgraphisomorphismen</term> und <term type="dh" + >Community-Detection</term>. Einige Fragestellungen wie Zentralitätsmaße und + Community-Detection sind dabei aus der sozialen Netzwerkanalyse entstanden.</p> + <figure> + <graphic xml:id="wissensgraphen_2022_002" url=".../medien/wissensgraphen_2022_002.png"> + <desc> + <ref type="graphic" target="#abb2">Abb. 2</ref>: Ein Überblick über die Kategorien von Graph Queries bzw. + Graphenabfragen. Diese Kategorien geben einen ersten Überblick, auch + über deren (Zeit-)Komplexität: RPQ ist PSPACE-vollständig, CRPQ und + ECRPQ (in der Abbildung unter CQ zu finden) sind EXPSPACE-vollständig, vgl. + <ref type="bibliography" target="#bonifati_graph_2019">Bonifati / Dumbrava 2019</ref>. Zentralitätsmaße für Wissensgraphen + sind ebenfalls recht komplex. Für einige Probleme gibt es effiziente + Algorithmen, vgl. <ref type="bibliography" target="#grando_analysis_2016">Grando et al. 2016</ref>, aber einige spezifischere + Probleme sind bekanntermaßen NP-vollständig, z. B. Group Closeness + Maximization (GCM) oder Maximum Betweenness Centrality, vgl. <ref type="bibliography" target="#chen_closeness_2016">Chen et + al. 2016</ref>.) [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_002"/> + </desc> + </graphic> + </figure> + <p>Neben einer Kantenrichtung in gerichteten Graphen können auch beliebige weitere + Daten in Kanten und Knoten gespeichert werden. In einer Visualisierung könnten + z. B. weitere Beschriftungen von Eigenschaften dargestellt werden. Daraus + ergibt sich auch der englischsprachige Begriff des Labeled Property Graph + (LPG). Dieser ist wieder definiert als Graph <formula>G = (V, E)</formula> + bestehend aus einer Menge von Knoten <formula>V</formula> (auch Wissensobjekte + genannt) und Kanten <formula>E</formula> (auch Verknüpfungen genannt). Eine + Kante steht immer in Beziehung zu genau zwei Knoten mit einer festen Richtung + von einem Start- zu einem Endknoten, wodurch der LPG als gerichteter Graph + definiert wird. Sowohl Knoten als auch Kanten können eine Reihe von <term + type="dh">Schlüssel-Wert-Paaren</term> speichern, die als Eigenschaften bzw. + ihre Werte als Labeln bezeichnet werden.</p> + <p>Dies ist allerdings eine sehr stark von der Informatik geprägte Definition. + Noch allgemeiner kann ein Wissensgraph als Graph <formula>G = (E, R, + λ)</formula> definiert werden. Hierbei finden sich Entitäten + <formula>e ∈ E = E<hi rend="sub">1</hi> ∪ E<hi rend="sub" + >2</hi> ∪ … ∪ E<hi rend="sub">n</hi></formula>. Die Elemente + <formula>E<hi rend="sub">i</hi></formula> sind sogenannte Layer, die + z. B. aus formalen Strukturen wie Ontologien oder Taxonomien stammen. Weiter + gibt es Relationen <formula>R</formula> und eine beschreibende Funktion + <formula>λ : E ∪ R → ∑</formula>, die allen Knoten und Kanten bestimmte + Beschreibungen aus <formula>∑</formula> zuweisen kann. Knoten und Kanten können + also mit einigen zusätzlichen Metainformationen versehen sein, die im Hinblick + auf die Anwendung des Wissensgraphen definiert werden müssen.</p> + <p>Dabei bestehen die Relationen <formula>R = {R<hi rend="sub">1</hi>, …, R<hi + rend="sub">n</hi>}</formula> aus einer Liste von entweder + inter-ontologischen (zwischen Knoten aus demselben Layer) oder + intra-ontologischen Relationen (zwischen Knoten aus anderen <term type="dh" + >Layern</term>). Sowohl <formula>E</formula> als auch <formula>R</formula> + sind endliche diskrete Räume (vgl. <ref type="graphic" target="#wissensgraphen_2022_003" + >Abbildung 3</ref>).</p> + <figure> + <graphic xml:id="wissensgraphen_2022_003" url=".../medien/wissensgraphen_2022_003.png"> + <desc> + <ref type="graphic" target="#abb3">Abb. 3</ref>: Darstellung eines biomedizinischen Wissensgraphen mit + verschiedenen Layern (dargestellt durch verschiedene Farben), + Relationen (Benennung auf den Kanten) und Labeln (Beschriftungen auf + den Knoten). Es finden sich sowohl Kanten zwischen Knoten desselben + Layers, als auch Kanten zwischen Knoten verschiedener Layer. + [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_003"/> + </desc> + </graphic> + </figure> + </div> + <div type="subchapter"> + <head>2.2 Die Perspektive des Semantic Web</head> + + <p>Das Semantic Web geht auf Tim Berners-Lee zurück<note type="footnote"> + Vgl. <ref type="bibliography" target="#berners_web_2001">Berners-Lee et al. 2001</ref>.</note>. Er beschreibt das Ziel, Informationen im + World Wide Web automatisch computerbasiert interpretieren zu können. Objekte, + die im Web beschrieben werden, sollen eine eindeutige URI als Link erhalten, + über welche ihre Informationen abrufbar sind. Weiter sollen bei Objekten + semantische Metainformationen abgelegt sein, die Aufschluss über ihre + Bedeutung, ihren Kontext oder ihre Relationen zu anderen Inhalten + ermöglichen.</p> + <p>Damit eng verwandt ist das Konzept von <term type="dh">Linked Open Data</term>. + Es bezeichnet Daten, die durch ihre semantischen Metainformationen miteinander + verknüpft sind und in einer bestimmten Form, idealerweise frei zugänglich + veröffentlicht werden. Hinter dieser Idee verbirgt sich letztlich das Konzept + eines Wissensnetzwerks, das das online publizierte Wissen semantisch verknüpft. + Tim Berners-Lee führte auch die Linked Data Principles ein<note type="footnote" + > Vgl. <ref type="bibliography" target="#berners_data_2006">Berners-Lee 2006</ref>.</note>, in denen er für die Verwendung einiger + standardisierter Technologien und Praktiken plädiert. </p> + <p>Technisch baut das Semantic Web auf das <term type="dh">Resource Description + Framework</term> (RDF)<note type="footnote"> Vgl. <ref type="bibliography" target="#Lassila_framework_1999">Lassila et al. + 1999</ref>.</note> auf. Es wurde 2004 eingeführt, um Inhalte des Internets zu + beschreiben und für den Aufbau des Semantic Web maschinell interpretierbar zu + machen<note type="footnote"> Hierbei handelt es sich um das <ref + target="http://www.w3.org/TR/rdf-schema/">RDF Schema</ref> (RDF-S). Es + drückt Klassen- und Hierarchiestrukturen aus und enthält verschiedene + Literale sowie konkrete Klassen. Durch die bewusst allgemeinen Definitionen + ist RDF-S weiterhin sehr flexibel und kann zur Beschreibung + unterschiedlichster Modelle genutzt werden.</note>. RDF beschreibt die + Regeln zur Formulierung der dafür nötigen Metadaten. Dabei werden alle + RDF-Informationen in <term type="dh">Tripeln</term> (Subjekt-Prädikat-Objekt) + abgelegt. Die drei Bestandteile dieser Tripel können beliebige Ressourcen sein, + welche an anderer Stelle definiert oder beschrieben werden. Zur eindeutigen + Identifizierung der drei Elemente im größeren Kontext des Semantic Web werden + <term type="dh">Internationalized Resource Identifier</term> (IRI) + verwendet, um RDF-Beschreibungen wiederverwendbar und zugänglich gestalten zu + können.</p> + <p>Um durch RDF beschriebene Informationen abzufragen, wurde die <term type="dh" + >Query Language </term> + <ref target="http://www.w3.org/TR/rdf-sparql-query/">SPARQL</ref> + entwickelt<note type="footnote"> Sie wird seit 2006 von der RDF Data Access + Working Group (DAWG) des World Wide Web Consortiums entwickelt und + standardisiert. <ref type="bibliography" target="#w3c_sparql_2008">SPARQL</ref> ist der Nachfolger mehrerer Abfragesprachen, wie z. + B. der <ref type="bibliography" target="#w3c_rdf_2014">RDF Query Language</ref>.</note>. Sie stellt ein Datenzugriffsprotokoll für + das Semantic Web bereit. SPARQL findet die gewünschten Tripel, indem die Muster + in der Abfrage mit Tripeln in den Datensätzen abgefragt werden. </p> + <p>Damit entspricht das Konzept dem von LPGs. Mittels LPGs und Graphdatenbanken + (die z. B. mit <bibl> + <title type="desc">Cypher</title> + </bibl> abgefragt werden können) können allerdings zusätzlich auch <term + type="dh">Kanteneigenschaften</term> abgefragt und berücksichtigt werden. + Das ist mit SPARQL nicht möglich. RDF ist somit ein sehr einfaches Datenmodell, + das im Kern nur binäre Beziehungen zwischen Subjekt und Objekt unterstützt. + Cypher ist wiederum ein Beispiel für eine deklarative Abfragesprache zur + Erzeugung, Änderung und zum Abfragen von LPGs. Cypher unterstützt auch <term + type="dh">Projektion</term>, <term type="dh">Aggregation</term> und die + Angabe variabel langer <term type="dh">Pfade</term>.<note type="footnote"> Vgl. + <ref type="bibliography" target="#saake_datenbanken_2018">Saake et al. 2018</ref>.</note> + </p> + <p>Auf RDF und RDF-S basiert die <bibl> + <title type="desc">Web Ontology Language</title> + </bibl> (OWL)<note type="footnote"> Vgl. <ref type="bibliography" target="#hitzler_web_2012">Hitzler et al. 2012</ref>.</note>, welche + die Beschreibung von Ontologien durch Tripel ermöglicht. OWL definiert dabei + keine Strukturen neu und kann als Format für Ontologiestrukturen angesehen + werden. Dabei entsprechen diese Ontologien einer digitalen Version des oben + schon diskutierten klassischen Ontologiekonzeptes. Über Ontologien ist es z. B. + auch möglich, logische Schlussfolgerungen zu bilden. Um logische Beschränkungen + über die Klassenstrukturen zu stellen, werden <term type="dh">Axiome</term> + definiert. Dies sind Beschränkungen, die für alle Instanzen der Klassen gelten, + die in einem gemeinsamen Modell auftreten. Das Modell der Ontologie kann damit + sehr komplexe Sachverhalte abbilden, was zum Beispiel für viele Anwendungen der + biomedizinischen Forschung auch tatsächlich ausgeschöpft wird. Allerdings geht + das Hand in Hand mit einer hohen Komplexität des Datenmodells, die für andere + Anwendungszwecke unerwünscht ist. So ist es nicht verwunderlich, dass in der + Praxis oft weniger komplexe Datenstrukturen verwendet werden<note + type="footnote"> Auf Terminologien basierende Anwendungen definieren + beispielsweise häufig keine inhaltlichen Relationen und benötigen keine + ausführliche Annotation ihrer Objekte mit diversen Metadaten. Sie bilden + keine Modelle aus Instanzen und wenden auch keine logischen Argumentationen + auf ein Modell an.</note>.</p> + <p>Nach diesen beiden Ansätzen, die den praktischen und theoretischen Horizont aus + Sicht der Graphentheorie und der Informatik aufgespannt haben, soll nun der + Fokus auf Netzwerkansätze in den Geistes- und Sozialwissenschaften gelegt + werden.</p> + </div> + <div type="subchapter"> + <head>2.3 Netzwerkansätze in den Geistes- und Sozialwissenschaften</head> + <p>Netzwerkansätze haben schon seit mehreren Jahrzehnten sowohl in der Theorie als + auch in der Anwendung Einzug in die Geistes- und Sozialwissenschaften, etwa in + die Geschichtswissenschaften und Archäologie (historische Netzwerkforschung), + Ethnografie<note type="footnote"> Vgl. <ref type="bibliography" target="#verne_ethnographie_2013">Verne 2013</ref>.</note> oder + Sprachwissenschaften, gehalten. Zunächst soll die soziale Netzwerkanalyse + (englisch <term type="dh">Social Network Analysis</term>, SNA) dargestellt + werden, die versucht, menschliche Interaktionen in einen analytischen und + auswertbaren Zusammenhang zu bringen. In den Sozialwissenschaften war zuvor + eine rein enumerative Forschung üblich. Dabei ergaben sich vom methodischen + Schritt von der Theoriebildung zur empirischen Forschung Probleme:</p> + <quote type="grosszitat">Auf der empirisch-praktischen Ebene hat dieser Gegensatz + jedoch zunächst keine Entsprechung mehr: Allenfalls die Forschungsfrage – aus + der (Gesamt-) Netzwerk- bzw. (Einzel-) Akteurperspektive herausgestellt – + reflektiert noch mögliche Unterschiede, die insofern auf die Beziehung zwischen + abhängiger und unabhängiger Variable reduziert werden.<note type="footnote"> <ref type="bibliography" target="#schubert_netzwerke_1994">Schubert 1994</ref>, S. 9.</note></quote> + + <p>Eine umfassende historische Analyse der Netzwerkforschung im Bereich der + Sozialwissenschaften findet sich bei Stegbauer<note type="footnote"> Vgl. + <ref type="bibliography" target="#stegbauer_handbuch_2010">Stegbauer / Häußling (Hg.) 2010</ref>.</note> oder bei Rollinger, der insbesondere den + paradigmatischen Wechsel durch den Netzwerkbegriff betont<note type="footnote"> + Vgl. <ref type="bibliography" target="#rolliinger_amicitia_2014">Rollinger 2014</ref>. Wichtiger Vordenker war vor dem Ersten Weltkrieg Georg + Simmel, der die Wechselwirkung zwischen Gruppen und ihrem Einfluss auf das + Individuum studierte. Ihm folgte Leopold von Wiese, der ebenfalls primär auf + Beziehungen und ihre Auswirkungen einging. Bis zur Systematisierung der + Netzwerkanalyse in den 1940er Jahren kamen die Impulse vor allem von + Soziologen, aber auch von Ethnologen. Insbesondere Alfred Radcliffe-Brown + definierte den Gegenstand der Ethnologie nicht als Kultur, sondern als + soziale Strukturen. </note>. Die Entwicklung begann im Wesentlichen in den + 1940er Jahren als <term type="dh">Soziometrie</term> und hatte in den 1970er + Jahren ihren Durchbruch in den USA.</p> + <p>Noch einfacher definieren Biegel et al. ein Netzwerk als Verbindungen einer + Einzelperson zu <hi rend="italic">signifikant Anderen</hi> + <hi rend="italic"> – </hi>also weiteren Personen wie Familie, Freunden + etc.<note type="footnote"> Vgl. <ref type="bibliography" target="#biegel_networks_2019">Biegel et al. 1985</ref>.</note> Dabei ist + deutlich, dass die Interpretation der Verbindung und der signifikant Anderen + offen ist. Damit folgt, dass soziale Beziehungen und Gruppen sowie deren + Verbindung und somit Strukturen sichtbar gemacht werden können.<note + type="footnote"> Vgl. <ref type="bibliography" target="#henning_individuen_2006">Hennig 2006</ref>.</note> + <hi rend="italic">Starke</hi> und <hi rend="italic">schwache Bindungen</hi> + wurden terminologisch in der Arbeit von Granovetter eingeführt<note + type="footnote"> Vgl. <ref type="bibliography" target="#granovetter_strength_1973">Granovetter 1973</ref>.</note>. Nach Granovetter gilt für + drei Personen A, B und C, dass <quote>je stärker die Freundschaftsbeziehung + zwischen den Personen A und B und den Personen A und C ist, umso + wahrscheinlicher ist, dass sich B und C kennen oder kennenlernen + werden.</quote> + <note type="footnote"> <ref type="bibliography" target="#stegbauer_handbuch_2010">Stegbauer / Häußling (Hg.) 2010</ref>. In seiner Arbeit findet sich + eine Definition und auch eine Auflistung von Unterscheidungsmerkmalen von + starken und schwachen Bindungen. Diese können am besten bei der Erforschung + der Integration von Einzelpersonen in ein Gesamtnetzwerk genutzt werden. + </note> Ob gerade schwache oder starke Beziehungen für die Verbreitung neuer + Ideen wichtig sind, wird in der Literatur kontrovers diskutiert<note + type="footnote"> Vgl. z. B. <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref> gegen + <ref type="bibliography" target="#schweizer_muster_1996">Schweizer 1996</ref>.</note>.</p> + <p>Netzwerkanalysen können zum einen auf verschiedenen Ebenen, z. B. mit einer + sehr globalen Perspektive, ausgeführt werden. Dabei sind geografische + Komponenten (Städte, Länder, Provinzen, Fundorte, ...) Gegenstand der Analyse. + Auf der anderen Seite können sie klassisch auf persönlicher Ebene ausgeführt + werden. Dabei sind Personen Gegenstand der Analyse. Hier wird schon deutlich, + dass in diesem Netzwerkansatz nicht nur eine einzige Entität bzw. ein einziger + Datentyp verarbeitet wird. Die Konstruktion und Analyse dieser Netzwerke setzt + mehrere Layer mit verschiedenen Daten, etwa Personen oder Orte, voraus.</p> + <p>Netzwerkanalysen setzen im Allgemeinen zwei Mindestanforderungen voraus: Zum + einen eine endliche Menge von Personen bzw. Akteur*innen und zum anderen + mindestens eine soziale Beziehung, die für die Personen untereinander + nachgewiesen werden kann. Als Beispiele können der Handel mit ökonomischen + Ressourcen wie Arbeit, Kapital oder Waren genannt werden, aber auch + Machtausübung, Übermittlung von Informationen, Heirat, Freundschaft oder + soziale Unterstützung. Dabei kann nicht vorausgesetzt werden, dass ein + bestimmtes Netzwerk mit wiederkehrenden Mustern von Verbindungen und + Nicht-Verbindungen entsteht. Denn: <quote>Das Fehlen von Beziehungen ist + diagnostisch mindestens so bedeutsam wie das Vorhandensein von + Beziehungen.</quote> + <note type="footnote"> <ref type="bibliography" target="#schweizer_muster_1996">Schweizer 1996</ref>, S. 159.</note> Zur Analyse der Netzwerke + kann nicht nur auf die Methoden der Graphentheorie, sondern auch der Statistik + zurückgegriffen werden. So lassen Zentralitätsmaße einen Rückschluss über die + Position einer Person in einem sozialen Netzwerk zu<note type="footnote"> + Weiterführende Informationen zu den Zentralitätsmaßen finden sich bei + <ref type="bibliography" target="#freeman_networks_1978">Freeman 1978</ref>, oder auch + <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref>.</note>. Das Zentralitätsmaß eines/einer + Akteurs/Akteurin kann z. B. die Einflussnahme auf das gesamte Netzwerk + definieren. Aber je nachdem wie man das Zentralitätsmaß operationalisiert, + führt dieser Vorgang zu unterschiedlichen Ergebnissen. Exemplarisch können + dafür die <term type="dh">Betweenness Centrality</term> (<term type="dh" + >Betweenness-Zentralitätswert</term>) und die <term type="dh">Eigen + Centrality</term> (auch: <term type="dh">Eigenvector Centrality</term>, + <term type="dh">Eigen-Zentralität</term>) angeführt werden. Letztere zeigt + eher indirekte Einflussmöglichkeiten.</p> + <p>Es ist eine neuere Entwicklung, dass die SNA auch in den + Geschichtswissenschaften verwendet werden. Reitmayer und Marx bieten eine + aufschlussreiche Zusammenstellung der Verwendung von Netzwerkansätzen in der + Geschichtswissenschaft<note type="footnote"> Vgl. <ref type="bibliography" target="#reitmayer_netzwerkansaetze_2010">Reitmayer / Marx + 2010</ref>.</note>. Sie bemerken eine ungleiche Verwendung von Methoden sowie + deren Verbreitung. <quote>Besonders früh scheinen anglo-amerikanische + Historiker Konzepte der Netzwerkanalyse aufgegriffen zu haben, während + dieser Trend in Deutschland deutlich später eingesetzt hat</quote> + <note type="footnote"> <ref type="bibliography" target="#reitmayer_netzwerkansaetze_2010">Reitmayer / Marx 2010</ref>, S. 869.</note>. In den + Geschichtswissenschaften würden lediglich ausgewählte Einzelverfahren der + Netzwerkanalyse verwendet und bekannte Argumentationsfiguren und Grundannahmen + übernommen. Eine Netzwerkanalyse im strengen sozialwissenschaftlichen Sinne + würde nicht ausgeführt.</p> + <p>Auch in der Archäologie werden Netzwerkansätze genutzt, um soziale Strukturen + zu evaluieren. Dabei liegt der Fokus beispielsweise auf Siedlungsstrukturen, + sozialen Hierarchien oder der Analyse von Schriftstücken. Collar hat + beispielsweise schon 2013 als Archäologin mit den Methoden der SNA einen + Schritt in Richtung Religionswissenschaften getan<note type="footnote"> Vgl. + <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref>.</note>. In ihrer Arbeit Religious Networks in the Roman Empire + untersucht sie, warum sich einige Kulte und Religionen innerhalb des römischen + Reiches bei gleicher Popularität entweder durchsetzten oder bedeutungslos + wurden. </p> + <p>Knappett beschreibt die weitere Anwendung von Netzwerkansätzen in der + Archäologie<note type="footnote"> Vgl. <ref type="bibliography" target="#knappett_analysis_2013">Knappett 2013</ref>.</note>. + Handelsnetzwerke, Austauschnetzwerke und Straßennetzwerke tragen als ganz + allgemeine Netzwerke zum Verständnis der Geschichte bei.</p> + <p>Für eine interdisziplinäre Perspektive ist besonders die Beobachtung Schuberts + zu berücksichtigen: Es <quote>scheinen [...] Netzwerkforscher eines gemeinsam + zu haben: Die Abkehr von der großen, monolithischen Theorie im Singular und + die pragmatische Orientierung an den realen Gegebenheiten im Plural.</quote> + <note type="footnote"> <ref type="bibliography" target="#schubert_netzwerke_1994">Schubert 1994</ref>, S. 9.</note> Er begründet dies mit dem + Interesse an globalen Strukturen, bei einer gleichbleibenden (lokalen) + Datengrundlage. Doch wie passt dies zusammen? Um das genauer zu diskutieren, + sollen zunächst verschiedene methodische Arten, Netzwerkansätze zu definieren, + dargestellt werden, wobei jeder Schritt den vorherigen methodisch beinhaltet. + Zunächst orientieren wir uns an Schnegg, der für die SNA folgende Unterteilung + vornimmt:</p> + <p> + <quote type="grosszitat">(1) die Analyse der sozialen Beziehungen zwischen + Akteuren als wichtiger Bestandteil gesellschaftlicher Ordnung, (2) die + systematische Erhebung und Auswertung empirischer Daten, (3) die graphische + Präsentation dieser Daten und (4) mathematische und computergestützte + formale Modelle, um zu Abstraktionen dieser Daten zu gelangen + <note type="footnote"> <ref type="bibliography" target="#schnegg_wurzeln_2010">Schnegg 2010</ref>.</note></quote> + </p> + <p>Diese vierfache Charakterisierung bezieht sich auf die Verwendung von Methoden + aus der Informatik und deren Rückkopplung oder Dialog mit dem ursprünglichen + Forschungsbereich. Sie begegnet uns in allen Netzwerkansätzen<note + type="footnote"> Vgl. <ref type="bibliography" target="#doerpinghaus_netzwerkanalyse_2021">Dörpinghaus 2021</ref>; + <ref type="bibliography" target="#doerpinghaus_theology_2022">Dörpinghaus 2022</ref>.</note>. Man kann + den Ansatz von Schnegg wie folgt verallgemeinern:</p> + <list type="ordered"> + <item>Die Verwendung von Modellen, die von Methoden der Digital Humanities (DH) + abgeleitet sind, um Hypothesen zu bewerten oder neue Hypothesen in einer + Geistes- oder Sozialwissenschaft zu generieren oder bei einer digitalen + Modellierung die theoretischen Modelle und Hypothesen der jeweiligen + Fachrichtung zu berücksichtigen.</item> + <item>Die Verwendung von Modellen und Methoden aus den DH zur Arbeit mit + empirischen Daten im Bereich einer Geistes- oder Sozialwissenschaft.</item> + <item>Die Anwendung von Methoden aus dem <hi rend="italic">Visual + Computing</hi> (z. B. Visualisierung und interaktive Tools) zur + Erklärung, Darstellung und Diskussion der bei der Anwendung von in (2) + generierten Ergebnisse.</item> + <item>Erstellung eines mathematischen und/oder computergestützten Modells, das + die Daten aus (2) abstrahiert, um neue Modelle oder Methoden innerhalb des + Fachgebiets oder der DH zu entwickeln. </item> + </list> + <p>Alle Kategorien dieses Schemas schließen die vorangegangenen Kategorien ein. + Das bedeutet zum Beispiel, dass die Anwendung von Modellen und Methoden auf + empirische Daten (2) die Anwendung und theoretische Reflexion bestehender + Modelle und Methoden (1) einschließt. Diese Kategorien umfassen Methoden und + Ansätze der DH auf einer anderen Ebene. Zur Veranschaulichung des Schemas werde + ich einige kurze Beispiele aus dem Bereich der sozialen Netzwerkanalyse (SNA) + in verschiedenen Geistes- und Sozialwissenschaften diskutieren. + <list type="ordered"> + <item>In dieser Kategorie werden die sozialen Beziehungen zwischen Akteur*innen + untersucht, d. h. zwischen Individuen oder Institutionen und anderen Entitäten. + Hier wurden noch keine empirischen Daten erhoben. Dazu gehören vor allem + Arbeiten, die Methoden und Ideen der SNA und anderer Netzwerkansätze nutzen, um + Theorien oder Modelle zu entwickeln und diese in eine argumentative + Auseinandersetzung mit anderen Fragestellungen zu bringen. + <p>In diese Kategorie fällt zum Beispiel die frühe Arbeit des Theologen Michael B. + Thompson aus dem Jahr 1998<note type="footnote"> Vgl. <ref type="bibliography" target="#thompson_internet_1998">Thompson 1998</ref>.</note>. Er + analysiert den Informationsfluss der Nachfolger Jesu im 1. Jahrhundert nach + Christus, was er als <quote>Holy Internet</quote> bezeichnet. Dabei arbeitet er + lediglich implizit mit Methoden der SNA. Sein Verdienst liegt vor allem in + einer ausführlichen Zusammenstellung der Aspekte, die zum + Kommunikationsnetzwerk führen. Ähnlich ist die Arbeit des Theologen Rikard + Roitto, der den Informationsfluss, der durch die drei Johannesbriefe in ein + Netzwerk von johanneischen Gemeinden ausgeht, analysiert<note type="footnote"> + Vgl. <ref type="bibliography" target="#roitto_information_2019">Roitto 2019</ref>.</note>. Dabei stellt der Autor bewusst nur verschiedene + Modelle zu einem möglichen Verständnis zusammen und stellt deutlich klar, dass + es ihm nicht um eine historische Rekonstruktion geht. Hier leuchtet das oben + schon angesprochene Quellenproblem auf.</p></item> + <item>Diese Kategorie kann kaum gefüllt werden, da in der Regel bei empirischen und + computerbasierten Daten auch Methoden der Visualisierung verwendet werden<note + type="footnote"> Diese Kategorie ist quasi ein Erbe der ursprünglichen + Kategorisierung von <ref type="bibliography" target="#stegbauer_handbuch_2010">Stegbauer / Häußling (Hg.) 2010</ref>. Trotzdem ist es sinnvoll, + diese Kategorie als methodischen Zwischenschritt nicht zu ignorieren. Für + eine Methodenkritik siehe auch die Arbeit von <ref type="bibliography" target="#drucker_approaches_2015">Drucker 2015</ref>.</note>.</item> + <item>Einige Geisteswissenschaften wie die Geschichtswissenschaften, Philologie, + Germanistik oder die Theologie, sind in der Regel keine empirischen + Wissenschaften, aber empirische Daten können z. B. exegetisch oder mit Methoden + von <term type="dh">Text Mining</term> und <term type="dh">Data Mining</term> + anhand von Texten oder anderen Gegenständen generiert werden. Wir sehen hier + zwei Hauptmerkmale: das Sammeln empirischer Daten und ihre Visualisierung. + <p>Als Beispiel für diese Kategorie kann ein Visualisierungstool angeführt werden, + das einen Einblick in den Tagebuchkorpus der Gedenkstätte Bergen-Belsen bietet, + welche Dutzende von Tagebüchern von KZ-Häftlingen beinhaltet und diese somit + als interoperable Daten mit sozialen Netzwerken verbindet<note type="footnote"> + Vgl. <ref type="bibliography" target="#khulusi_life_2022">Khulusi et al. 2022</ref>.</note>. Andere Ansätze visualisieren und + analysieren historische Karten als interoperable Daten<note type="footnote"> + Vgl. <ref type="bibliography" target="#reckziegel_exploration_2021">Reckziegel et al. 2021</ref>.</note>, die Kommunikation und Netzwerkstruktur + des <term type="dh">Jesus Movement</term> + <note type="footnote"> Vgl. <ref type="bibliography" target="#duling_network_2013">Duling 2013</ref>; + <ref type="bibliography" target="#duling_movement_2000">Duling 2000</ref>; <ref type="bibliography" target="#duling_movement_1999">Duling 1999</ref>.</note>, oder + mittelalterliche Textkorpora<note type="footnote"> <ref type="bibliography" target="#meinecke_alignment_2020">Meinecke et al. + 2020</ref>.</note>, um eine explorative Arbeit mit den Texten zu ermöglichen. Hier + verschwimmen auf der einen Seite implizite Netzwerkansätze, die interoperable + Daten beinhalten, und explizite Netzwerkansätze wie die SNA. Auf der anderen + Seite nähern wir uns bereits der methodischen Grenze zur nächsten + Kategorie.</p></item> + <item>In dieser Kategorie gehen wir einen Schritt weiter, zu heuristischen Modellen, + die formal computergestützte Modelle sind. Es handelt sich somit auch um + mathematische Modelle im Sinne der Graphentheorie. Eine Datengrundlage finden + diese Ansätze in den vielfältigen Digitalisierungsprojekten, die das kulturelle + Erbe nachhaltig verfügbar machen. + <p>Dabei können auch Beziehungen zwischen verschiedenen Quellen in die Modelle als + Layer aufgenommen werden, z. B. um Musikinstrumente mit historischen + Aufführungen von Musikstücken in Beziehung zu setzen<note type="footnote"> Vgl. + <ref type="bibliography" target="#kusnick_timeline_2020">Kusnick et al. 2020</ref>.</note>. Auch hier ist die Grenze zwischen der + expliziten Nutzung von Wissensgraphen und interoperablem Wissen, das nur + implizit ein Netzwerk bildet, fließend. Interessant sind in diesem Zusammenhang + auch Visualisierungsansätze, die z. B. zeit- und ereignisbasierte + Wissensgraphen auf gebogenen Zeitachsen darstellen und daraus neue Modelle + generieren<note type="footnote"> Vgl. <ref type="bibliography" target="#filipova_circle_2021">Filipov et al. 2021</ref>.</note>. Auch in + der Archäologie findet die Frage nach Modellen immer mehr Beachtung,<note + type="footnote"> Vgl. den Review von <ref type="bibliography" target="#peeples_place_2019">Peeples 2019</ref>.</note> gleiches + gilt für die historische Netzwerkanalyse<note type="footnote"> So z. B. + <ref type="bibliography" target="#doerpinghaus_netzwerke_2020">Dörpinghaus 2020</ref>; + <ref type="bibliography" target="#massey_network_2016">Massey 2016</ref>; + <ref type="bibliography" target="#mcclure_introducing_2016">McClure 2016</ref>.</note>.</p></item></list></p> + <p>Je nach Perspektive, je nachdem, wie breit wir das Feld der Netzwerkansätze und + der interoperablen Daten sehen, finden wir mehr oder weniger Literatur und + Wissenschaftler*innen, die Netzwerkansätze verwenden. Dies erklärt, warum die + Verbreitung der Verwendung von Netzwerkansätzen unterschiedlich wahrgenommen + werden kann.</p> + <p>Nach dieser Bestandsaufnahme in allen Disziplinen soll zunächst ein Blick + ›zurück‹ geworfen werden. In einem Forschungsüberblick über die Graphentheorie + soll insbesondere die interdisziplinäre Verwendung von Netzwerkansätzen + thematisiert werden, denn hier gibt es interessante Wechselwirkungen die für + die <ref type="intern" target="#hd7">Abschnitte 4</ref> und <ref type="intern" + target="#hd8">5</ref> relevant sind. Im Anschluss soll dort der Blick anhand + von ausgewählten Beispielen aus den (digitalen) Geistes- und + Sozialwissenschaften ›nach vorne‹ gerichtet werden. Durch diese thematische + Einklammerung ergeben sich nicht nur fortlaufende Themen, sondern auch neue + thematische Impulse.</p> + </div> + </div> + <div type="chapter"> + <head>3. Forschungsüberblick zur Graphentheorie</head> + + <p>Die Graphentheorie ist ein relativ junges Feld in der Mathematik und die Impulse + zu ihrer Entwicklung gingen anfangs primär von praktischen Problemstellungen + aus<note type="footnote"> Vgl. <ref type="bibliography" target="#diestel_graphentheorie_2012">Diestel 2012</ref>; + <ref type="bibliography" target="#wussing_mathematik_2009">Wußing 2009</ref>.</note>. Das Fach + liegt an der Schnittstelle zur Informatik, die sich allerdings erst nach dem + Zweiten Weltkrieg neben der Mathematik als eigenständiges Fachgebiet etabliert + hat. Dabei ist die Analyse von Strukturen die eher mathematische Perspektive, + während die algorithmische und verarbeitende Analyse die eher informatische + Perspektive ist. Es ist nicht verwunderlich, dass das anschauliche Konzept von + Graphen bzw. Netzwerken sehr zügig auch in anderen Disziplinen aufgegriffen wurde. + Zu nennen sind hier neben verschiedenen Naturwissenschaften gerade die + Sozialwissenschaften<note type="footnote"> Vgl. <ref type="bibliography" target="#biegel_networks_2019">Biegel et al. 1985</ref>; + <ref type="bibliography" target="#granovetter_strength_1973">Granovetter + 1973</ref>; + <ref type="bibliography" target="#stegbauer_handbuch_2010">Stegbauer / Häußling (Hg.) 2010</ref>.</note>, die Ethnografie<note type="footnote"> + Vgl. beispielsweise <ref type="bibliography" target="#kaplan_significance_1976">Kaplan 1976</ref>; + <ref type="bibliography" target="#schweizer_muster_1996">Schweizer 1996</ref>.</note>, später auch die + Archäologie, Geschichts- und Literaturwissenschaften<note type="footnote"> Zu + nennen sind hier unter anderem <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref>; + <ref type="bibliography" target="#knappett_analysis_2013">Knappett 2013</ref>; + <ref type="bibliography" target="#reitmayer_netzwerkansaetze_2010">Reitmayer / Marx + 2010</ref>; <ref type="bibliography" target="#rolliinger_amicitia_2014">Rollinger 2014</ref>.</note>. Weitere Überschneidungen ergeben sich, wenn + Methoden aus der Informatik bzw. den Data Sciences in den Geisteswissenschaften + verwendet werden<note type="footnote"> Vgl. beispielsweise <ref type="bibliography" target="#ciula_signs_2017">Ciula / Eide 2017</ref>; + <ref type="bibliography" target="#murray_theory_2011">Murray / Tillett 2011</ref>; <ref type="bibliography" target="#thaller_information_2021">Thaller 2021</ref>.</note>.</p> + <p>Doch wo liegen nun die Ursprünge des Netzwerkgedankens und der Graphentheorie? + Robin Wilson fasst zusammen:</p> + <p> + <quote type="grosszitat">The origins of graph theory are humble, even frivolous. + Whereas many branches of mathematics were motivated by fundamental problems of + calculation, motion, and measurement, the problems which led to the development + of graph theory were often little more than puzzles, designed to test the + ingenuity rather than to stimulate the imagination. But despite the apparent + triviality of such puzzles, they captured the interest of mathematicians, with + the result that graph theory has become a subject rich in theoretical results + of a surprising variety and depth.<note type="footnote"> <ref type="bibliography" target="#wilson_graph_1999">Wilson 1999</ref>, S. 503.</note></quote> + + </p> + <p>Die Graphentheorie ist dem Teilbereich der diskreten Mathematik zuzuordnen, die + sich mit abzählbaren (bzw. abzählbar unendlichen) Mengen beschäftigt. Es ergibt + sich eine große Schnittmenge zu den Disziplinen der Kombinatorik und Optimierung. + Letztere wurde vor allem in der Neuzeit durch die Entstehung technischer und + elektronischer Hilfsmittel immer bedeutender. Dabei bietet die Kombinatorik + sicherlich das umfangreichste Material für eine ausführliche historische + Darstellung. Kombinatorische Strukturen finden sich unter anderem im antiken + China, Indien und Griechenland<note type="footnote"> Vgl. <ref type="bibliography" target="#wilson_combinatorics_2013">Wilson / Watkins + 2013</ref>.</note>. Es finden sich eine erstaunliche Vielfalt der Anwendungsfelder + über klassische Beispiele wie das Pascalsche Dreieck hinaus, etwa in der Poesie + (Auswahl, Anordnung und Kombination von Silben im Sanskrit, chinesischen + Hexagrammen, lateinischer und griechischen Prosodie) oder in der Musik + (Notenfolgen in Liedern).</p> + <p>Doch auch wenn die Überschneidungen zwischen Kombinatorik und Graphentheorie groß + sind, so ist doch die Frage zu stellen, welchen Werdegang diese Disziplin hat. + Mulder fasst die Problematik zusammen: <quote>Wir müssen hier bemerken, daß das + Studium der Geschichte der Graphentheorie, im Gegensatz zu dem der anderen + mathematischen Disziplinen, nur seit kurzem auf ernsthafte Weise betrieben + wird.</quote> + <note type="footnote"> <ref type="bibliography" target="#mulder_entstehung_1992">Mulder 1992</ref>, S. 296.</note> Dabei ist zum einen zu + unterscheiden zwischen dem Aufkommen des Begriffs des Graphens, der nicht vor 1878 + auftrat, und der Entstehung des Netzwerkgedankens bzw. der formalen mathematischen + Methoden, die mit Leonhard Euler und dem Jahr 1736 verbunden sind<note + type="footnote"> Vgl. <ref type="bibliography" target="#gross_handbook_2003">Gross / Yellen 2003</ref>, S. 31.</note>. </p> + <p> + <quote type="grosszitat">Indeed, Euler’s solution for the problem of Königsberg + bridges has long been recognized as a prehistory of graph theory and, more + generally, analysis situs. However, in that case, historians and mathematicians + needed to have graph theory and analysis situs to be able retrospectively to + situate Euler’s solution in its ›appropriate context‹. + <note type="footnote"> <ref type="bibliography" target="#chemla_explorations_2014">Chemla 2014</ref>, S. 369.</note></quote> + </p> + <p>Wir werden zunächst den aktuellen Forschungsstand darstellen und anschließend der + Frage nachgehen, inwiefern die Idee des Graphens bzw. Netzwerks auch ohne die + mathematische Perspektive präsent war.</p> + <p>Gießmann setzt seine Beobachtungen erst im 19. Jahrhundert an: <quote>Der Aufstieg + der Netzwerke als Praxis und Denkstil begann zwar schon in früher Neuzeit und + Aufklärung, war dort aber vor allem mit der Epistemologie des Lebendigen + verbunden.</quote> + <note type="footnote"> <ref type="bibliography" target="#gießmann_graphen_2008">Gießmann 2008</ref>, S. 269.</note> Und auch Wußing setzt zwar + richtig den Anfang der modernen Graphentheorie mit Leonhard Euler und dem + Königsberger Brückenproblem (1736) gleich<note type="footnote"> Vgl. <ref type="bibliography" target="#wussing_mathematik_2009">Wußing + 2009</ref>.</note>, aber es bleiben offene Fragen: </p> + <p> + <quote type="grosszitat">Formell wäre Graphentheorie als Netzwerktheorie schon + wesentlich früher breit auf Phänomene in Natur, Technik und Gesellschaft + anwendbar gewesen. Dass dies erst im 20. Jahrhundert geschieht und dann, + sozusagen in aller Kontingenz verspätet, Zeichenpraktiken und Lebenswelt massiv + kurzgeschlossen werden, provoziert weitere Fragen. + <note type="footnote"> <ref type="bibliography" target="#gießmann_graphen_2008">Gießmann 2008</ref>, S. 270.</note></quote> Liegt das Aufkommen der + Netzwerkanalysen und der Graphentheorie allein darin begründet, dass sich die + Wissenschaft verändert und <quote>la théorie des graphes répond à un besoin assez + général de la pensée logique</quote><note type="footnote"> <ref type="bibliography" target="#mayer_developements_1976">Mayer 1976</ref>, S. 55.</note>? Dies wird kaum der Fall gewesen + sein, wie vielfältige Beispiele zeigen: Im frühen 19. Jahrhundert wurde der Ungar + Emil Torday im Kongo mit einem Kinderspiel bekannt: Ziel war das Zeichnen von + Netzwerkstrukturen im Sand ohne den Finger heben zu müssen oder existierende + Linien zu kreuzen<note type="footnote"> Vgl. <ref type="bibliography" target="#zaslavsky_africa_1999">Zaslavsky 1999</ref>, S. 105–109.</note>. + Dies entspricht einem graphentheoretischen Problem: Jeder Graph mit genau zwei + ungeraden Knoten kann durch einen einzigen Pfad durchschritten werden: <quote>Most + drawings of this type belong to a long tradition [...]. They refer to proverbs, + fables, games, riddles, animals, etc., and play an important role in the + transmission of knowledge and wisdom from one generation to the next.</quote> + <note type="footnote"> <ref type="bibliography" target="#gerdes_history_1994">Gerdes 1994</ref>, S. 355.</note> Doch auch abseits von Spielen + repräsentieren viele graphentheoretische Probleme Alltagsprobleme, etwa kürzeste + Wege. Alexander Schrijver beobachtet dazu: </p> + <p> + <quote type="grosszitat">It is difficult to trace back the history of the shortest + path problem. One can imagine that even in very primitive (even animal) + societies, finding short paths (for instance, to food) is essential. Compared + with other combinatorial optimization problems, like shortest spanning tree, + assignment and transportation, the mathematical research in the shortest path + problem started relatively late. + <note type="footnote"> <ref type="bibliography" target="#schrijver_history_2012">Schrijver 2012</ref>, S. 155.</note></quote> + </p> + <p>Auch Aristoteles beschrieb in seiner <bibl> + <title type="desc">Historia animalium</title> + </bibl> (ΠεÏá½¶ τὰ ζῷα ἱστοÏίαι, 4. Jahrhundert vor Christus) schon die + Notwendigkeit, die Tierwelt in ein Ordnungsschema einzuordnen: Vögel, Fische, Wale + als Bluttiere; Schaltiere, Krebstiere; Cephalapoden und Sepien; Insekten<note + type="footnote"> ΓÎνη δὲ μÎγιστα τῶν ζῴων, εἰς ἃ διῄÏηται τἆλλα ζῷα… <ref type="bibliography" target="#aristoteles_historia_1837">Aristotle + 1837</ref>.</note>. Nach ihren Körperflüssigkeiten – rotes Blut und Serum – + unterteilt er <quote>die beiden Gruppen, die gemessen an der heutigen Zoologie + taxonomischen Charakter besitzen, weiter in sogenannte Größte Gattungen [...] + ein. Auch sie stellen absolute Ordnungs- und Klassifikationsgrößen dar.</quote> + <note type="footnote"> <ref type="bibliography" target="#aristoteles_historia_2013">Aristoteles 2013</ref>, S. 236–237.</note> Im praktischen Sinne + ergeben sich für Aristoteles – der Leben also als hierarchisch wahrnahm – aber + Probleme, die er nur mit partiellen Definitionen lösen konnte<note type="footnote"> + <quote> Dies bedeutet, daß Aristoteles auf eine Taxonomie der Tierarten + verzichten muß. Zwar ist sein Ziel in der HA ohnehin die Vorbereitung der + Apodeixis und nicht der Definition, aber zu einer vollständigen Apodeixis + für die Merkmale aller Tierarten wäre eine auf umfassenden Definitionen + beruhende Taxonomie sehr hilfreich, wenn sie durchführbar wäre.</quote> <ref type="bibliography" target="#kullmann_biologie_1997">Kullmann / Föllinger (Hg.) 1997</ref>, S. 45.</note>. Auch einer seiner Schüler, + Theophrast, arbeitete in seinen Schriften <bibl> + <title type="desc">Histona plantarum</title> + </bibl> und <bibl> + <title type="desc">Causae plantarum</title> + </bibl> mit Taxonomien in der Botanik und unterteilt zwischen Bäumen, Sträuchern, + Halbsträuchern und Kräutern<note type="footnote"> Vgl. ausführlich <ref type="bibliography" target="#woehrle_methode_1985">Wöhrle 1985</ref>; + <ref type="bibliography" target="#senn_entwicklung_1933">Senn 1933</ref>, S. 94.</note>. Interessanterweise ist die weitere Forschung in diesem + Bereich spärlich<note type="footnote"> + <quote>Eine Disziplin ›Biologie‹ gab es vor 1800 nicht, so dass + Pflanzenbeschreibungen oft in Gesamtwerken und in dem Briefwechsel von + Naturforschern, in kameralistischen Schriften oder in Publikationsorganen + fachlich unterschiedlicher Ausrichtung versteckt sind. Beschreibungen von + Theophrast, Albertus Magnus oder die der Kräuterbücher ab 1530 sind heute + relativ leicht zugänglich, während Berichte arabischer Botaniker schwieriger + zu beschaffen waren.</quote> <ref type="bibliography" target="#senn_entwicklung_1933">Senn 1933</ref>, S. 15.</note> und erst durch das + Wirken Carl von Linnés – basierend auf den Arbeiten von Andrea Cesalpino und + Gaspard Bauhin – wurde eine bis heute gültige Systematik von Pflanzen + erarbeitet<note type="footnote"> Vgl. <ref type="bibliography" target="#koerner_nature_2022">Koerner 2022</ref>; + <ref type="bibliography" target="#stearn_background_1959">Stearn 1959</ref>.</note>. Dabei + befinden wir uns derzeit im nächsten Transformationsschritt: Nicht nur das Denken + und Modellieren in Netzwerken ist möglich, sondern auch das computerbasierte + Auswerten dieser Daten:</p> + <p> + <quote type="grosszitat">the recent increase in the amount and availability of + biological data has placed a new focus on the complex networks embedded in + biological systems. The increased availability of computational tools to store + and retrieve biological data has facilitated wide access to these data, not + just by biologists but also by specialists from the social sciences, computer + science, physics and mathematics. This fusion of interests has led to a burst + of research on the properties and consequences of network structure in + biological systems. + <note type="footnote"> <ref type="bibliography" target="#proulx_promislow_2005">Proulx et al. 2005</ref>, S. 345.</note></quote></p><p>Auch wenn damit nun die + Dinge benannt sind, die dem Thema der Netzwerkanalyse bzw. Graphentheorie + Aufschwung verleihen, ist doch der Anfang dieser Disziplin weiter unklar. Denn + auch z. B. Coward irrt hier mit seiner Kritik am Netzwerkdenken, wenn er Netzwerke + als Konstrukt des 19. Jahrhunderts ansieht<note type="footnote"> Vgl. <ref type="bibliography" target="#coward_network_2018">Coward 2018</ref>, + S. 446.</note>. Grundsätzlich schweigen die Quellen aber zu Taxonomien bzw. + baumartigen Strukturen: <quote>the historical record of that topic before the + advent of computers is virtually a blank page, with the exception of a few + 19th-century papers</quote> + <note type="footnote"> <ref type="bibliography" target="#wilson_combinatorics_2013">Robin Wilson / Watkins 2013</ref>, S. 32.</note>. So ist es wenig + überraschend, dass viele graphentheoretische Konzepte – ihrer Zeit voraus – schon + in anderen Fachgebieten Einzug hielten: So verwendete Gustav Robert Kirchhoff im + 19. Jahrhundert schon die Idee von aufspannenden Bäumen für elektrische + Netzwerke<note type="footnote"> Vgl. <ref type="bibliography" target="#walther_anwendungen_2013">Walther 2013</ref>.</note>, oder im 21. + Jahrhundert die oben angesprochene implizite Nutzung von Netzwerkansätzen für das + Prinzip von Linked Data in den Geisteswissenschaften.</p> + <p>Letztlich führten die stetig wachsende Verwendung von digitalen Methoden und die + Netzwerkanalyse zu verschiedenen Paradigmenwechseln. So ist der erste + Paradigmenwechsel (a) nicht nur in der Nutzung, sondern auch in der methodischen + Reflexion der Netzwerke in den Geistes- und Sozialwissenschaften zu finden<note + type="footnote"> Vgl. beispielsweise <ref type="bibliography" target="#rollinger_prolegomena_2020">Rollinger 2020</ref>.</note>. Weiter ist zu + beobachten, dass auch in den DH immer größere Datenmengen verarbeitet werden, was + (b) dazu führt, dass auch der Gedanke der Datenverknüpfung bzw. Linked Data als + Impuls aus dem Bereich Data Science immer wichtiger wird<note type="footnote"> + Vgl. beispielsweise <ref type="bibliography" target="#hyvoenen_web_2019">Hyvönen et al. 2019</ref>; + <ref type="bibliography" target="#peeples_place_2019">Peeples 2019</ref>.</note>. Als letzter + Punkt (c) ist das interdisziplinäre Gespräch mit der Graphentheorie zur kritischen + methodischen Reflexion der Netzwerkansätze anzufügen<note type="footnote"> Vgl. + beispielsweise <ref type="bibliography" target="#doerpinghaus_theology_2022">Dörpinghaus et al. 2022</ref>; + <ref type="bibliography" target="#valeriola_trust_2021">de Valeriola 2021</ref>.</note>. Ich konnte + in diesem Abschnitt zeigen, dass es die Graphentheorie als eigenständige + mathematische Disziplin ohne die Impulse aus anderen Fachbereichen kaum gegeben + hätte, dieses interdisziplinäre Gespräch auf der anderen Seite bisher jedoch kaum + gesucht wird. Die beiden letztgenannten Punkte sollen im nächsten Abschnitt + kritisch gewürdigt werden, um in <ref type="intern" target="#hd8">Abschnitt 5</ref> + ausgewählte Beispiele zu diskutieren. </p> + </div> + <div type="chapter"> + <head>4. Interdisziplinäre Perspektiven für die Geistes- und Sozialwissenschaften</head> + + <p>Für die Verwendung von Wissensgraphen in den Geistes- und Sozialwissenschaften, + Disziplinen, die gerade durch die DH einem steten Wandel unterliegen<note + type="footnote"> Vgl. beispielsweise die Studie von <ref type="bibliography" target="#ma_humanities_2022">Ma / Li 2022</ref>.</note>, gibt + es einige Besonderheiten zu beachten, wie in <ref type="intern" target="#hd2" + >Abschnitt 2</ref> schon ausführlich diskutiert wurde. Trotzdem liegt die + Stärke von Wissensgraphen in der einfacheren und übersichtlicheren Speicherung + (vormals) unstrukturierter Daten gegenüber relationalen Datenbanken. Gerade durch + diesen methodischen Schritt der Datenrepräsentation ergibt sich auch ein formales + Datenschema für verknüpfte Datensätze, also Linked Data. Dies ist besonders + wichtig mit Blick auf die Interoperabilität von Daten und die Reproduzierbarkeit + von wissenschaftlichen Ergebnissen und hilft bei der Adressierung zentraler + ethischer Maßstäbe: Reproduzierbarkeit, Transparenz, fairer und wenn möglich + offener Umgang mit Daten. Hierbei ergibt sich auch ein Ausblick auf <bibl> + <title type="desc">FAIR Data</title> + </bibl> + <note type="footnote"> Vgl. <ref type="bibliography" target="#wilkinson_fair_2016">Wilkinson et al. 2016</ref>.</note>: Daten oder Metadaten + sollen (1) <term type="dh">Findable</term>, (2) <term type="dh">Accessible</term>, + (3) <term type="dh">Interoperable</term>, (4) <term type="dh">Re-usable</term> + sein. Die Bedeutung dieser Grundsätze für die DH wurde in der Vergangenheit + mehrfach betont und muss an dieser Stelle nicht wiederholt werden<note + type="footnote"> Vgl. beispielsweise <ref type="bibliography" target="#doerpinghaus_workflow_2018">Dörpinghaus / Stenschke 2018</ref>; + <ref type="bibliography" target="#langmead_network_2016">Langmead et + al. 2016</ref>; <ref type="bibliography" target="#aydogan_framework_2021">Aydogan et al.2021</ref>.</note>.</p> + <p>Wenn im Bereich DH immer größere Datenmengen verarbeitet werden, welche + Implikationen für das Netzwerkparadigma ergeben sich dann durch den aus dem + Bereich Data Science stammenden Impuls der Datenverknüpfung bzw. Linked Data? Eine + Besonderheit in den Geistes- und Sozialwissenschaften ergibt sich aus der + Heterogenität der Disziplinen: <quote>One characteristic of this area is the great + heterogeneity of scientific disciplines and user communities involved. This + leads to heterogeneity of data formats and data sources that represents a + technical challenge from the point of view of interoperability.</quote> + <note type="footnote"> <ref type="bibliography" target="#cimiano_data_2020">Cimiano et al. 2020</ref>, S. 229.</note> Damit lassen sich die + zentralen technischen Herausforderungen im Bereich der Datenintegration und des + Datenmappings lokalisieren<note type="footnote"> Vgl. <ref type="bibliography" target="#kahn_problem_2020">Kahn / Simon 2020</ref>.</note>. + Allerdings wurde die Generierung interoperabler und wiederverwendbarer Daten + schnell als zentrale Herausforderung erkannt<note type="footnote"> Vgl. z. B. + <ref type="bibliography" target="#barbera_data_2013">Barbera 2013</ref>, S. 91; + <ref type="bibliography" target="#doerpinghaus_workflow_2018">Dörpinghaus / Stenschke 2018</ref>.</note> und bleibt es bis + heute<note type="footnote"> Vgl. <ref type="bibliography" target="#aydogan_framework_2021">Aydogan et. al. 2021</ref>.</note>. Gerade in den + skandinavischen Ländern finden sich verschiedene Lösungsvorschläge, etwa mit der <bibl> + <title type="desc">Linked Open Data Infrastructure for Digital Humanities in + Finland</title> + </bibl> (LODI4DH)<note type="footnote"> Vgl. <ref type="bibliography" target="#hyvoenen_data_2020">Hyvönen 2020a</ref>.</note>, oder + verschiedenen Ansätzen im Bereich Cultural Heritage basierend auf Methoden des + Semantic Webs<note type="footnote"> Vgl. <ref type="bibliography" target="#hyvoenen_model_2020">Hyvönen 2020b</ref>.</note> (vgl. auch weitere + Lösungen aus Portugal<note type="footnote"> Vgl. <ref type="bibliography" target="#silva_infrastructure_2022">Silva et al. 2022</ref>.</note> oder + Schweden<note type="footnote"> Vgl. <ref type="bibliography" target="#nygren_status_2014">Nygren et al. 2014</ref>.</note>).</p> + <p>Zwar ergibt sich aus dem Prinzip von Linked Data schon ein (Wissens-)Netzwerk, + wenn die einzelnen Datenpunkte durch Knoten in einem Netzwerk repräsentiert werden + und die Links Verbindungen bzw. Kanten zwischen ihnen repräsentieren<note + type="footnote"> Vgl. den Sammelband <ref type="bibliography" target="#golub_information_2022">Golub / Liu 2022</ref>.</note>. Was an dieser + Stelle jedoch fehlt, ist eine Abfragemöglichkeit, da die Daten nur relational + abgelegt wurden, und eine Visualisierung<note type="footnote"> Vgl. <ref type="bibliography" target="#menin_views_2022">Menin et al. + 2022</ref>.</note>. Dies ist insofern eine wichtige Beobachtung, da mit dieser auch + der Bereich von Linked Data den Netzwerkansätzen zugeordnet werden kann und diese + damit methodisch in den Geistes- und Sozialwissenschaften weiter verbreitet sind + als erwartet. Im <ref type="intern" target="#hd8">nächsten Abschnitt</ref> soll + anhand von ausgewählten Beispielen dargestellt werden, welcher weitere methodische + Horizont sich dadurch ergibt.</p> + <p>Doch die interdisziplinäre Perspektive auf Netzwerkansätze in den Geistes- und + Sozialwissenschaften wäre mit diesem Impuls aus dem Bereich Data Science nicht + vollständig. Es ist zu beobachten, dass gerade das interdisziplinäre Gespräch mit + der Graphentheorie zur kritischen methodischen Reflexion der Netzwerkansätze + führt. Um sich diesem Bereich zu nähern, ist zunächst festzuhalten, dass + Netzwerkansätze neue Perspektiven eröffnen, da sie Bekanntes in einen neuen + visuellen oder analytischen Kontext einbetten oder statistisch valide Aussagen + über ihre Darstellung ermöglichen.</p> + <p>Dabei lassen sich zwei Problemfelder herausarbeiten: Zum einen ist die Frage, wie + valide Aussagen aus in den Geistes- und Sozialwissenschaften oft kleinen + Stichproben sind. Die andere Fragestellung ergibt sich aus der Distanz zur + Datengrundlage, konkret, ob hermeneutische Vorgaben berücksichtigt oder + zurückgenommen werden und ob (Text-)Aussagen aktualisiert bzw. für die + gegenwartsnah operierenden Sozialwissenschaften aufbereitet werden. Die Chance + liegt hierbei darin, verschiedene Möglichkeiten und Szenarien zu Situationen, bei + denen deutlich zu wenig Daten vorliegen, zu evaluieren. Methodisch handelt es sich + dabei nicht um eine quantitative Netzwerkanalyse im eigentlichen Sinne.</p> + <p>Hier ergibt sich nun die erste Anfrage aus der Mathematik: Können aufgrund + unvollständiger oder fehlender Datenquellen Ergebnisse wissenschaftlich nicht + reproduziert und damit auch nicht bestätigt oder falsifiziert werden? Die zweite + Anfrage ergibt sich in der Bedeutung der mathematischen Netzwerkanalysen in der + Anwendungsdomäne, z. B. die Frage was bestimmte Zentralitätsmaße im gegebenen + Forschungsfeld, etwa in der historischen Netzwerkanalyse, bedeuten. Umgekehrt ist + aber auch zu fragen, welche in den Geistes- und Sozialwissenschaften populären + Methoden in der Graphentheorie nicht oder kaum rezipiert und damit erforscht + werden. Dies betrifft zum Beispiel das vielfältige Gebiet der Community-Detection, + da eine – oder mehrere – mathematische Definition von ›Community‹ nicht + existieren<note type="footnote"> Vgl. <ref type="bibliography" target="#wasserman_network_1994">Wasserman / Faust 1994</ref>.</note>. Obwohl es + ein Bewusstsein für diese methodischen Fragen gibt<note type="footnote"> Vgl. + beispielsweise <ref type="bibliography" target="#rollinger_prolegomena_2020">Rollinger 2020</ref>.</note>, sind doch nur sehr wenige + Veröffentlichungen in diesem Bereich zu finden, die sich primär mit der + mathematischen Validierung von Zentralitäsmaßen in geisteswissenschaftlichen + Fragestellungen beschäftigen<note type="footnote"> Vgl. <ref type="bibliography" target="#doerpinghaus_measures_2022">Dörpinghaus et al. 2022</ref>; + <ref type="bibliography" target="#valeriola_trust_2021">de Valeriola 2021</ref>.</note>. Die zusammenhängende wissenschaftliche und + systematische Evaluierung der digitalen Methoden in dieser Schnittmenge der + Disziplinen steht damit noch aus<note type="footnote"> Vgl. dazu ausführlich + <ref type="bibliography" target="#doerpinghaus_netzwerkanalyse_2021">Dörpinghaus 2021</ref>.</note>. Doch gerade aus dieser interdisziplinären Perspektive + heraus würden sich weitere Impulse für die Netzwerkansätze ergeben, wie im + nächsten Abschnitt anhand ausgewählter Beispiele diskutiert wird.</p> + </div> + <div type="chapter"> + <head>5. Ausgewählte Beispiele</head> + + <p>Abschließend soll noch die – größtenteils unabhängige – Entwicklung von + Netzwerkansätzen in den Geistes- und Sozialwissenschaften anhand ausgewählter + Beispiele dargestellt werden. Hierbei soll detailliert aufgeschlüsselt werden, + welche Vorteile sich aus dem Konzept von Linked Data und dem Netzwerkparadigma + ergeben. Zunächst wollen wir uns dem Bereich der (historischen) Netzwerkanalyse + zuwenden.</p> + <p>Knappett beschreibt beispielsweise Anwendungen von Netzwerkansätzen in der + Archäologie<note type="footnote"> Vgl. <ref type="bibliography" target="#knappett_analysis_2013">Knappett 2013</ref>.</note>. Handelsnetzwerke, + Austauschnetzwerke und Straßennetzwerke tragen als ganz allgemeine Netzwerke zum + Verständnis der Geschichte bei. Gerade auch in der Archäologie werden die in den + vorherigen Abschnitten schon diskutierten Einschränkungen deutlich: <quote>Network + science is not a single, monolithic entity, but denotes a diverse set of + methods, models, and approaches concerning the study of the management, + representation, and analysis of network data which represent our hypotheses + about how and why relationships matter</quote> + <note type="footnote"> <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref>.</note>. Nicht die eigentliche Fragestellung + oder Methode wird mithilfe der Netzwerke entworfen, sondern es wird einfach eine + neue Form der Darstellung und der Analyse genutzt. Somit sind die sozialen + Netzwerke gleichsam eine Art Werkzeugkasten.</p> + <p>Das offensichtlichste Problem ist dabei das Quellenproblem. Reitmayer und Marx + fassen zusammen:</p> + <p><quote type="grosszitat">Selbst die gegenwartsnah operierende Zeitgeschichte sieht sich oft außerstande, + die für quantifizierende Untersuchungen erforderlichen Daten mit vertretbarem + Aufwand und unter Beachtung der Archivsperrfristen bzw. der Zugänglichkeit von + (privaten) Archiven überhaupt zusammenzutragen<note type="footnote"> <ref type="bibliography" target="#reitmayer_netzwerkansaetze_2010">Reitmayer / + Marx 2010</ref>, S. 869.</note>.</quote></p> + <p>Sie fordern deswegen, statt von einer historischen Netzwerkforschung von einer + <quote>Verwendung von Netzwerkansätzen</quote> zu sprechen. Dies ist + gerechtfertigt. Denn zusammenfassend findet sich beispielsweise bei Collar die + bewusst vereinfachte Definition des <quote>network thinking as a new methodology + for understanding the processes of change and the spread of innovation in the + past.</quote> + <note type="footnote"> <ref type="bibliography" target="#collar_networks_2013">Collar 2013</ref>.</note> Auch Rollinger beschäftigt sich + ausgiebig mit der Methodenkritik<note type="footnote"> Vgl. <ref type="bibliography" target="#rollinger_prolegomena_2020">Rollinger 2014</ref>.</note> + hinsichtlich der variablen Reichweite der Ergebnisse und <quote>weist auf die + prekäre Quellengrundlage als Ursache für die lediglich relative Aussagekraft + der Netzwerkanalyse hin</quote> + <note type="footnote"> <ref type="bibliography" target="#ganter_rezension_2015">Ganter 2015</ref>, S. 183.</note>. Dabei müssten die Quellen auch + interpretiert werden, weil sie keine formalen Aussagen über die Qualität der + Beziehung oder deren zeitliche Dauer zulassen. Es bleibt, dass die Netzwerkanalyse + zusätzliche Aspekte zeigen kann, <quote>aber allein klassische Quellenkritik + vermag den qualitativen Gehalt der Beziehungen zu ergründen.</quote> + <note type="footnote"> <ref type="bibliography" target="#ganter_rezension_2015">Ganter 2015</ref>, S. 183.</note> + </p> + <p>An diesem Punkt bieten sich verschiedene neue Perspektiven. Zunächst ist die Frage + an den Bereich der Informatik und Mathematik zu stellen, wie Ambiguität und + Unsicherheit sowie eine zeitliche Komponente in einem Netzwerk dargestellt und + analysiert werden können. Hier gibt es bereits Projekte im Bereich der DH die + diese Ansätze verfolgen<note type="footnote"> Vgl. <ref type="bibliography" target="#wagner_ambiguitaet_2019">Wagner 2019</ref>.</note>. + Weiterhin ergeben sich durch den Aspekt von Linked Data weitere Möglichkeiten, das + Netzwerk zu ergänzen und weitergehende Fragen zu beantworten (vgl. <ref + type="graphic" target="#wissensgraphen_2022_004">Abbildung 4</ref>). So können + verschiedene externe Datenquellen zur Komplementierung der Daten genutzt werden, + etwa Daten aus Literaturdatenbanken um Aussagen zu disambiguieren, während + Geoinformationssysteme beispielsweise zur räumlichen Ergänzung beitragen. Neben + der potenziellen Ergänzung fehlender Informationen kann aber auch eine + Qualitätskontrolle durch mathematische Methoden – z. B. die Validierung von + Zentralitäsmaßen<note type="footnote"> Vgl. <ref type="bibliography" target="#doerpinghaus_measures_2022">Dörpinghaus et al. 2022</ref>; + <ref type="bibliography" target="#valeriola_trust_2021">de + Valeriola 2021</ref>.</note> – bzw. Graphanalysen zur Generierung neuer Relationen + und Entitäten – z. B. durch <term type="dh">Link Prediction</term> – angewendet + werden. </p> + <figure> + <graphic xml:id="wissensgraphen_2022_004" url=".../medien/wissensgraphen_2022_004.png"> + <desc> + <ref type="graphic" target="#abb4">Abb. 4</ref>: Illustration eines Datenworkflows, der mittels Linked Data das + Netzwerk erweitert und plausibilisiert. Graphanalysen vervollständigen + die Werkzeuge, die zur Verfügung stehen, etwa mit Methoden zur + Qualitätskontrolle. [Dörpinghaus, 2022]<ref type="graphic" target="#wissensgraphen_2022_004"/> + </desc> + </graphic> + </figure> + <p>Ein weiteres Beispiel ergibt sich im Kontext der Computational Social Sciences + beim Monitoring des Arbeitsmarktes und insbesondere der Aus- und Weiterbildungen. + Hier stehen klassisch sehr viele Daten zur Verfügung, etwa Aus- und + Weiterbildungsordnungen, Stellenausschreibungen und Datenbanken zu Berufen und + Wirtschaftsbranchen. Es ergibt sich methodisch eine ähnliche Situation wie in + anderen Fachgebieten. So werden viele Informationen händisch abgefragt (z. B. + durch Befragungen oder aus statistischen Auswertungen) und erst nach händischer + Kuration zur Analyse freigegeben. Ähnlich müssen z. B. Historiker*innen Quellen + untersuchen und daraus die wichtigen Datenpunkte extrahieren. Gleichzeitig + erleichtert interoperables Wissen mittels Linked Data das Arbeiten mit + umfangreicheren Datensätzen. So müssen Texte mit Methoden des <term type="dh">Text + Minings</term> weiterverarbeitet, oder Daten von Webseiten, z. B. + Weiterbildungsangebote oder Social Media Daten, mittels <term type="dh">Web + Mining</term> aggregiert werden. So ergibt sich nicht nur implizit ein + Wissensnetzwerk, sondern es kann auch mit ›klassischen‹ Netzwerkansätzen + kombiniert werden: Um eine aktuelle Übersicht über Kompetenzen und Hilfsmittel + oder Weiterbildungsangebote, über die Rezeption von Berufen, Arbeitsinhalte, etc. + zu erlangen, können beispielsweise Twitter-Daten mit der SNA analysiert werden + (vgl. <ref type="graphic" target="#wissensgraphen_2022_005">Abbildung 5</ref>). </p> + <p>Hierbei sind nicht nur die oben genannten Methoden und Technologien relevant, + sondern es zeigt sich insbesondere die Wichtigkeit von Linked Data. Denn + klassische Ansätze würden die benötigten Daten z. B. aus Stellenausschreibungen + extrahieren oder Umfragedaten auswerten. Diese Daten sind aber in ihrer normalen + Form nicht interoperabel mit den Daten aus Social-Media-Analysen. Was sind + Arbeitsinhalte, etwa Arbeitsmittel? Welche Kompetenzen werden genannt oder in + Ausbildungsordnungen vorausgesetzt? Nicht nur das geschriebene Wort muss mit dem + ›offiziellen‹ Sprachgebrauch verknüpft werden, sondern die verschiedenen Daten + müssen auch vollständig interoperabel gestaltet werden um eine vollständig + automatisierte Auswertung und einen Vergleich der verschiedenen Daten zu + erreichen.</p> + <figure> + <graphic xml:id="wissensgraphen_2022_005" url=".../medien/wissensgraphen_2022_005.png"> + <desc> + <ref type="graphic" target="#abb5">Abb. 5</ref>: Illustration eines Twitter-Netzwerks zum Hashtag + #Fachinformatiker für das erste Quartal 2020. Rote Knoten entsprechen + Tweets, blaue Hashtags und grüne Organisationen. [Dörpinghaus, 2022]<ref type="graphic" target="#wissensgraphen_2022_005"/> + </desc> + </graphic> + </figure> + <p>Dieses Beispiel zeigt nicht nur die Notwendigkeit interdisziplinären Arbeitens, + sondern insbesondere auch die Notwendigkeit der Zusammenarbeit innerhalb einer + Disziplin, wenn verschiedene methodische Ansätze verwendet werden. Aus diesen + ergeben sich verschiedene Daten, die aber sinnvollerweise von Anfang an + interoperabel gestaltet werden. </p> + </div> + <div type="chapter"> + <head>6. Ausblick: Herausforderungen und Perspektiven</head> + + <p>Dieser Artikel hat zwei Herausforderungen und Perspektiven für die Verwendung von + Netzwerkansätzen in den Geistes- und Sozialwissenschaften erarbeitet:</p> + <p>Zum einen die Bedeutung interdisziplinären Arbeitens. Nicht nur das Konzept von + Linked Data, sondern auch der vielfältige methodische und algorithmische + Werkzeugkasten der Informatik und Mathematik kann für neue Perspektiven auf + geistes- und sozialwissenschaftliche Probleme sorgen und zu ihrer Problemlösung + beitragen.</p> + <p>Gleichzeitig ergibt sich aus einer eher technischen, d. h. einer von den Geistes- + und Sozialwissenschaften eher distanzierten, Sicht, dass das Netzwerkparadigma + eigentlich viel weiter gefasst werden muss. Schon der Einsatz von Linked Data + führt implizit zu Wissensnetzwerken und damit zur potenziellen weiteren Anwendung + von Netzwerkanalysen.</p> + <p>Zum zweiten ergibt sich durch das Konzept von Linked Data auch eine neue + intradisziplinäre Perspektive innerhalb der Geistes- und Sozialwissenschaften: + Wenn beispielsweise aus einem sozialen Netzwerk ein Wissensgraph wird, so stehen + neue Methoden zur Verfügung. Ebenso ergeben sich neue Perspektiven, wenn eine + sozialwissenschaftliche Umfrage als Wissensgraph mit weiteren Daten verknüpft wird + und damit Rückschlüsse auf das – bisher nicht systematisch untersuchte – soziale + Netzwerk der Teilnehmenden möglich sind. </p> + <p>Noch allgemeiner: Diese kontextuellen Informationen sind ein entscheidender Faktor + für datenbasierte Auswertungen, nicht nur in der interdisziplinären Forschung und + in sozialen Netzwerken. Sie bilden einen verknüpften Datensatz, der mehrere Daten + aus verschiedenen Quellen umfasst. Die wichtigste Schlussfolgerung an dieser + Stelle ist, dass interdisziplinäre Ansätze sowohl bei der Modellierung großer + Wissensnetzwerke mit zusätzlichen Informationen, d. h. Linked Data, als auch bei + der Bewältigung der Herausforderungen bei deren Analyse helfen.</p> + <p>Bislang wird diese ganzheitliche Perspektive in der Forschung selten + berücksichtigt. Fehlende verknüpfte Daten und fehlende Methoden für groß angelegte + Wissensnetzwerke stellen daher eine ernsthafte Einschränkung dar. In diesem + Beitrag wurde diskutiert, wie diese Lücke durch interdisziplinäre Forschung + geschlossen werden kann. Wie an mehreren Stellen gezeigt werden konnten, kann eine + Zusammenarbeit zwischen Graphentheorie, Data Science und Netzwerkansätzen in den + Geistes- und Sozialwissenschaften das Feld weiten.</p> + <p>Zukünftig sollten die potenziellen Auswirkungen von Wissensgraphen genauer + untersucht werden, um zum Beispiel ihre Auswirkungen auf Analysen und Algorithmen + zu verstehen. Dabei sollte auch eine geistes- und sozialwissenschaftliche + Perspektive einbezogen werden: Werfen diese Effekte ein neues Licht auf die Daten + oder produzieren sie lediglich Artefakte? Eine enge Zusammenarbeit zwischen + Graphentheorie und Geisteswissenschaften würde also dazu beitragen, das + Verständnis von Netzwerkstrukturen und deren Wechselwirkung mit anderen Daten und + dem Informationsfluss zu verbessern. Es scheint notwendig, dass die künftige + Forschung neben der Analyse von Netzwerkstrukturen auch nach einem tieferen + Verständnis verschiedener – sowohl quantitativer als auch qualitativer – Daten und + deren Einfluss auf Relationen bzw. Beziehungen und Interaktionen innerhalb der + Geisteswissenschaften sucht.</p> + <p>Insofern versteht sich dieser Artikel als ein Plädoyer für eine Zusammenarbeit + über Fach- und Disziplingrenzen hinaus und zeigt in diesem Spannungsfeld auch + technische und inhaltliche Herausforderungen auf.</p> + </div> + <div type="bibliography"> + <head>Bibliografische Angaben</head> + <listBibl> + <bibl xml:id="aristoteles_historia_2013">Aristoteles: Historia animalium: Buch 1 und 2. Hg. von Stephan Zierlein. + Berlin 2013. (= Aristoteles Werke in deutscher Übersetzung, Bd. 16: Zoologische + Schriften, 1) DOI: <ref target="https://doi.org/10.1524/9783050051635" + >10.1524/9783050051635</ref> <ptr type="gbv" cRef="1454746467"/></bibl> + <bibl xml:id="aristoteles_historia_1837">Aristoteles: Historia animalium, e Typographeo academico 1837. + <ptr type="gbv" cRef="827356773"/></bibl> + <bibl xml:id="kullmann_biologie_1997">Aristotelische Biologie: Intentionen, Methoden, Ergebnisse. Hg. von Wolfgang + Kullmann / Sabine Föllinger. (Aristoteles‘ Biologie, Bad Homburg, + 24.–28.07.1995) Stuttgart 1997. (= Philosophie der Antike, 6) <ptr type="gbv" cRef="231067887"/></bibl> + <bibl xml:id="baas_dastani_2021">Juriaan Baas / Mehdi M. Dastani / Ad J. Feelders: Entity Matching in Digital + Humanities Knowledge Graphs. In: Proceedings of the Conference on Computational + Humanities Research 2021. Hg. von Maud Ehrmann / Folgert Karsdorp / Melvin + Wevers / Tara Lee Andrews / Manuel Burghardt / Mike Kestemont / Enrique + Manjavacas / Michael Piotrowski / Joris van Zundert. (CHR: 2, Amsterdam, + 17.–19.11.2021) Aachen 2021, S. 1–15, (= CEUR workshop proceedings, 2989) PDF. + [<ref target="http://ceur-ws.org/Vol-2989/long_paper5.pdf">online</ref>] </bibl> + <bibl xml:id="baillot_vernetzung_2019">Anne Baillot / Anna Busch: Vernetzung–Erzählung–Kollation. Digitale Methoden + in der Biographieforschung. In: BIOS–Zeitschrift für Biographieforschung, Oral + History und Lebensverlaufsanalysen 30 (2019), H. 1–2, S. 7–8. DOI: <ref + target="https://doi.org/10.3224/bios.v30i1-2.03" + >10.3224/bios.v30i1-2.03</ref> <ptr type="gbv" cRef="130437301"/></bibl> + <bibl xml:id="barbera_data_2013">Michele Barbera: Linked (Open) Data at Web Scale: Research, Social and + Engineering Challenges in the Digital Humanities. In: Global Interoperability + and Linked Data in Libraries. Hg. von Mauro Guerrini. In: JLIS.it 4 (2013), H. + 1, S. 91–104. DOI: <ref target="https://doi.org/10.4403/jlis.it-6333" + >10.4403/jlis.it-6333</ref> + </bibl> + <bibl xml:id="berners_data_2006">Tim Berners-Lee: Linked Data. In: w3.org. Design Issues. Beitrag vom + 27.07.2006. HTML. [<ref + target="https://www.w3.org/DesignIssues/LinkedData.html" + >online</ref>]</bibl> + <bibl xml:id="berners_web_2001">Tim Berners-Lee / James Hendler / Ora Lassila: The Semantic Web. In: + Scientific American 284 (2001), H. 5, S. 34–43. <ptr type="gbv" cRef="129059927"/></bibl> + <bibl xml:id="biegel_networks_2019">David E. Biegel / Ellen Steele McCardle / Susan Mendelson: Social Networks + and Mental Health: An Annotated Bibliography. Beverly Hills, CA 1985. <ptr type="gbv" cRef="272967599"/></bibl> + <bibl xml:id="bonifati_graph_2019">Angela Bonifati / Stefania Dumbrava: Graph Queries: From Theory to Practice. + In: ACM SIGMOD Record 47 (2019), H. 4, S. 5–16. <ref + target="https://doi.org/10.1145/3335409.3335411" + >10.1145/3335409.3335411</ref> <ptr type="gbv" cRef="129615544"/></bibl> + <bibl xml:id="chemla_explorations_2014">Karine Chemla: Explorations in the History of Mathematical Recreations: An + Introduction. In: Historia Mathematica 4 (2014),  41, S. 367–376. DOI: <ref + target="https://doi.org/10.1016/j.hm.2014.07.002" + >10.1016/j.hm.2014.07.002</ref> <ptr type="gbv" cRef="129409960"/></bibl> + <bibl xml:id="chen_closeness_2016">Chen Chen / Wei Wang / Xiaoyang Wang: Efficient Maximum Closeness Centrality + Group Identification. In: Databases Theory and Applications. Australasian + Database Conference.Hg. von Muhammad Aamir Cheema / Wenjie Zhang / Lijun Chang. + (ADC:27, Sydney, 28.–29.09.2016). Cham 2016, S. 43–55. (= Lecture Notes in + Computer Science, 9877) DOI: <ref + target="https://doi.org/10.1007/978-3-319-46922-5" + >10.1007/978-3-319-46922-5</ref> <ptr type="gbv" cRef="872231135"/></bibl> + <bibl xml:id="cimiano_data_2020">Philipp Cimiano / Christian Chiarcos / John P. McCrae / Jorge Gracia: + Linguistic Linked Data in Digital Humanities. In: Linguistic Linked Data: + Representation, Generation and Applications. Hg. von Philipp Cimiano / + Christian Chiarcos / John P. McCrae / Jorge Gracia. Cham 2020, S. 229–262. DOI: <ref + target="https://doi.org/10.1007/978-3-030-30225-2_13" + >10.1007/978-3-030-30225-2_13</ref> <ptr type="gbv" cRef="1681694271"/></bibl> + <bibl xml:id="ciula_signs_2017">Arianna Ciula / Øyvind Eide: Modelling in Digital Humanities: Signs in + Context. In: Digital Scholarship in the Humanities 32 (2017), Suppl. 1, S. + i33–i46. DOI: <ref target="https://doi.org/10.1093/llc/fqw045" + >10.1093/llc/fqw045</ref> + </bibl> + <bibl xml:id="collar_networks_2013">Anna Collar: Religious Networks in the Roman Empire: The Spread of New + Ideas. New York u. a. 2013. <ptr type="gbv" cRef="749422416"/></bibl> + <bibl xml:id="coward_network_2018">Martin Coward: Against Network Thinking: A Critique of Pathological + Sovereignty. In: European Journal of International Relations 24 (2018), H. 2, + S. 440–463. DOI: <ref target="https://doi.org/10.1177/1354066117705704" + >10.1177/1354066117705704</ref> <ptr type="gbv" cRef="186446217"/></bibl> + <bibl xml:id="diestel_graphentheorie_2012">Reinhard Diestel: Graphentheorie. 4. Auflage, erster korrigierter Nachdruck. + Heidelberg 2012. <ptr type="gbv" cRef="76781701X"/></bibl> + <bibl xml:id="doerpinghaus_theology_2022">Jens Dörpinghaus: Digital Theology: New Perspectives on Interdisciplinary + Research Between the Humanities and Theology‬. In: Interdisciplinary Journal of + Research on Religion 18 (2022). [<ref + target="https://www.religjournal.com/articles/article_view.php?id=164" + >online</ref>] ‬‬‬‬‬‬‬‬‬</bibl> + <bibl xml:id="doerpinghaus_netzwerkanalyse_2021">Jens Dörpinghaus: Die soziale Netzwerkanalyse: Neue Perspektiven für die + Auslegung biblischer Texte? In: Biblisch erneuerte Theologie 5 (2021). S. + 75-96. <ptr type="gbv" cRef="1013988434"/></bibl> + <bibl xml:id="doerpinghaus_netzwerke_2020">Jens Dörpinghaus: Soziale Netzwerke im frühen Christentum nach der + Darstellung in Apg 1-12. Pretoria 2020. Handle: <ref + target="http://hdl.handle.net/10500/26609">handle.net/10500/26609</ref> + </bibl> + <bibl xml:id="doerpinghaus_graph_2022">Jens Dörpinghaus / Andreas Stefan: Semantic Graph Queries on Linked Data in + Knowledge Graphs. In: Recent Advances in Computational Optimization. Results of + the Workshop on Computational Optimization WCO 2020. Hg. von Stefka Fidanova. + (WCO: 13, Sofia, 06.–09.09.2020. Studies in Computational Intelligence, vol + 986. Cham 2022, S.81–102. DOI: <ref + target="https://doi.org/10.1007/978-3-030-82397-9_4" + >10.1007/978-3-030-82397-9_4</ref> <ptr type="gbv" cRef="1793389101"/></bibl> + <bibl xml:id="doerpinghaus_workflow_2018">Jens Dörpinghaus / Christoph Stenschke: Ein kollaborativer Workflow zur + historischen Netzwerkanalyse mit Open Source Software. In: Science Track + FrOSCon. Hg. von Sayeed Klewitz-Hommelsen / Martin Lang / Bernd Schönbach. + Sankt Augustin 2018. DOI: <ref + target="https://doi.org/10.18418/978-3-96043-093-3" + >10.18418/978-3-96043-093-3</ref> + </bibl> + <bibl xml:id="doerpinghaus_measures_2022">Jens Dörpinghaus / Vera Weil / Carsten Düing / Martin W. Sommer: Centrality + Measures in Multi-Layer Knowledge Graphs. In: Communication Papers of the 17th + Conference on Computer Science and Intelligence Systems. Hg. von Maria Ganzha / + Leszek Maciaszek / Marcin Paprzycki / Dominik ÅšlÄ™zak. (Conference: 17, Sofia, + 04. –07.09.2022) 2022, S. 163–170. (= Annals of Computer Science and + Information Systems, 32) DOI: <ref target="http://dx.doi.org/10.15439/2022F43" + >10.15439/2022F43</ref> + </bibl> + <bibl xml:id="drucker_approaches_2015">Johanna Drucker: Graphical Approaches to the Digital Humanities. In: A New + Companion to Digital Humanities. Hg. von Susan Schreibman / Ray Siemens / John + Unsworth . Chichester 2015, S. 238–250. <ptr type="gbv" cRef="838374875"/></bibl> + <bibl xml:id="duling_movement_1999">Dennis C. Duling: The Jesus Movement and Social Network Analysis (Part I: + The Spatial Network). In: Biblical Theology Bulletin 29 (1999), 4, S. 156–175. + DOI: <ref target="https://doi.org/10.1177/014610799902900404" + >10.1177/014610799902900404</ref> <ptr type="gbv" cRef="166182729"/></bibl> + <bibl xml:id="duling_movement_2000">Dennis C. Duling: The Jesus Movement and Social Network Analysis (Part II. + The Social Network). In: Biblical Theology Bulletin: A Journal of Bible and + Theology 30 (2000), H. 1, S. 3–14. DOI: <ref + target="https://doi.org/10.1177/014610790003000102" + >10.1177/014610790003000102</ref> <ptr type="gbv" cRef="166182729"/></bibl> + <bibl xml:id="duling_network_2013">Dennis C. Duling: Paul’s Aegean Network: The Strength of Strong Ties. In: + Biblical Theology Bulletin 43 (2013), H. 3, S. 135–154. DOI: <ref + target="https://doi.org/10.1177/0146107913493564" + >10.1177/0146107913493564</ref> <ptr type="gbv" cRef="166182729"/></bibl> + <bibl xml:id="filipova_circle_2021">Velitchko Filipova / Victor Schetinger / Kathrin Raminger / Nathalie Soursos + / Susana Zapke / Silvia Miksch: Gone Full Circle: A Radial Approach to + Visualize Event-Based Networks in Digital Humanities. In: Visual Informatics 5 + (2021), H. 1, S. 45–60. DOI: <ref + target="https://doi.org/10.1016/j.visinf.2021.01.001" + >10.1016/j.visinf.2021.01.001</ref> + </bibl> + <bibl xml:id="freeman_networks_1978">Linton C. Freeman: Centrality in Social Networks Conceptual Clarification. + In: Social Networks 1 (1978), H. 3, S. 215–239. DOI:<ref + target="https://doi.org/10.1016/0378-8733(78)90021-7" + >10.1016/0378-8733(78)90021-7</ref> <ptr type="gbv" cRef="130054909"/></bibl> + <bibl xml:id="ganter_rezension_2015">Angela Ganter: Rezension: Amicitia sanctissima colenda. Freundschaft und + soziale Netzwerke in der späten Republik. (= Studien zur Alten Geschichte, + 19.). In: Historische Zeitschrift 301 (2015), H. 1, S. 182–184. DOI: <ref + target="https://doi.org/10.1515/hzhz-2015-0304">10.1515/hzhz-2015-0304</ref> + <ptr type="gbv" cRef="331411849"/></bibl> + <bibl xml:id="dessimoz_gene_2017">The Gene Ontology Handbook. Hg. von Christophe Dessimoz / Nives Å kunca. New + York 2017. <ptr type="gbv" cRef="873622561"/></bibl> + <bibl xml:id="gerdes_history_1994">Paulus Gerdes: On Mathematics in the History of Sub-Saharan Africa. In: + Historia mathematica 21 (1994), H. 3, S. 345–376. DOI: <ref + target="https://doi.org/10.1006/hmat.1994.1029">10.1006/hmat.1994.1029</ref> + <ptr type="gbv" cRef="129409960"/></bibl> + <bibl xml:id="gießmann_graphen_2008">Sebastian Gießmann: Graphen können alles: Visuelle Modellierung und + Netzwerktheorie vor 1900. In: Visuelle Modelle. Hg. von Steffen Siegel / + Ingeborg Reichle / Achim Spelten. Paderborn u. a. 2008, S. 269–284. DOI: <ref + target="https://doi.org/10.30965/9783846746325_019" + >10.30965/9783846746325_019</ref> <ptr type="gbv" cRef="555651029"/></bibl> + <bibl xml:id="golub_information_2022">Koraljka Golub / Ying-Hsang Liu: Information and Knowledge Organisation in + Digital Humanities: Global Perspectives. London 2022. DOI: <ref + target="https://doi.org/10.4324/9781003131816">10.4324/9781003131816</ref> + <ptr type="gbv" cRef="1783580755"/></bibl> + <bibl xml:id="gramsch_muster_2016">Robert Gramsch: Zerstörte oder verblasste Muster? Anwendungsfelder + mediävistischer Netzwerkforschung und das Quellenproblem. In: Handbuch + Historische Netzwerkforschung: Grundlagen und Anwendungen. Hg. von Martin + Düring / Ulrich Eumann / Martin Stark / Linda von Keyserlingk. Münster 2016. + <ptr type="gbv" cRef="812646444"/></bibl> + <bibl xml:id="grando_analysis_2016">Felipe Grando / Diego Noble / Luis C. Lamb: An Analysis of Centrality + Measures for Complex and Social Networks. In: 2016 IEEE Global Communications + Conference. (GLOBECOM, Washington, DC, 04. –08.12.2016) 2016. DOI: <ref + target="https://doi.org/10.1109/GLOCOM.2016.7841580" + >10.1109/GLOCOM.2016.7841580</ref> + </bibl> + <bibl xml:id="granovetter_strength_1973">Mark S. Granovetter: The Strength of Weak Ties. In: American Journal of + Sociology 78 (1973), H. 6, S. 1360–1380. DOI: <ref + target="https://doi.org/10.1086/225469">10.1086/225469</ref> <ptr type="gbv" cRef="129077739"/></bibl> + <bibl xml:id="gross_handbook_2003">Jonathan L. Gross / Jay Yellen: Handbook of Graph Theory. Boca Raton 2003. + DOI: <ref target="https://doi.org/10.1201/9780203490204">10.1201/9780203490204 + </ref> + </bibl> + <bibl xml:id="stegbauer_handbuch_2010">Handbuch Netzwerkforschung. Hg. von Christian Stegbauer / Roger Häußling. + Wiesbaden 2010. DOI: <ref target="https://doi.org/10.1007/978-3-531-92575-2" + >10.1007/978-3-531-92575-2</ref> <ptr type="gbv" cRef="1613287224"/></bibl> + <bibl xml:id="henning_individuen_2006">Marina Hennig: Individuen und ihre sozialen Beziehungen. Wiesbaden 2006. + <ptr type="gbv" cRef="49732475X"/></bibl> + <bibl xml:id="hitzler_web_2012">Pascal Hitzler / Markus Krötzsch / Bijan Parsia / Peter F. Patel-Schneider / + Sebastian Rudolph: OWL 2 Web Ontology Language Primer (Second Edition). In: + w3.org. Recommondations. Beitrag vom 11.12.2012. [<ref + target="https://www.w3.org/TR/owl2-primer/">online</ref>] </bibl> + <bibl xml:id="hyvoenen_data_2020">Eero Hyvönen (2020a): Linked Open Data Infrastructure for Digital Humanities + in Finland. In: DHN 2020 Digital Humanities in the Nordic Countries. + Proceedings of the Digital Humanities in the Nordic Countries 5th Conference + 2020. Hg. von Sanita Reinsone / Inguna Skadiņa / Anda BaklÄne / JÄnis + Daugavietis. (DHN: 5, Riga, 20.–23.20.2020) Aachen 2020, S. 254–259. (= CEUR + workshop proceedings, 2612) URN: <ref + target="http://nbn-resolving.de/urn:nbn:de:0074-2612-3" + >urn:nbn:de:0074-2612-3</ref> + </bibl> + <bibl xml:id="hyvoenen_model_2020">Eero Hyvönen (2020b): »Sampo« Model and Semantic Portals for Digital Humanities on + the Semantic Web. In: DHN 2020 Digital Humanities in the Nordic Countries. + Proceedings of the Digital Humanities in the Nordic Countries 5th Conference. + (2020).Hg. von Sanita Reinsone / Inguna Skadiņa / Anda BaklÄne / JÄnis + Daugavietis. (DHN: 5, Riga, 20.–23.20.2020) Aachen 2020, S. 373–378. (= CEUR + workshop proceedings, 2612) URN: <ref + target="http://nbn-resolving.de/urn:nbn:de:0074-2612-3" + >urn:nbn:de:0074-2612-3</ref> + </bibl> + <bibl xml:id="hyvoenen_web_2019">Eero Hyvönen / Petri Leskinen / Minna Tamper / Heikki Rantala / Esko Ikkala + / Jouni Tuominen / Kirsi Keravuori: BiographySampo – Publishing and Enriching + Biographies on the Semantic Web for Digital Humanities Research. In: The + Semantic Web. Hg. von Pascal Hitzler / Miriam Fernández / Krzysztof Janowicz / + Amrapali Zaveri / Alasdair J. G. Gray / Vanessa Lopez / Armin Haller / Karl + Hammar. (ESWC: 16, Portorož, 02.–06.06.2019) Cham 2019, S. 574–580. DOI: <ref + target="https://doi.org/10.1007/978-3-030-21348-0_37" + >10.1007/978-3-030-21348-0_37</ref> <ptr type="gbv" cRef="1668442728"/></bibl> + <bibl xml:id="kahn_problem_2020">Rebecca Kahn / Rainer Simon: Feast and Famine: The Problem of Sources for + Linked Data Creation. In: Graph Technologies in the Humanities. Proceedings + 2020. Hg. von Tara Andrews / Franziska Diehr / Thomas Efer / Andreas Kuczera / + Joris van Zundert. (Konferenz, Wien, 21.–22.02.2020) Aachen 2020, S. 86–100.(= + CEUR workshop proceedings, 3110) URN: <ref + target="http://nbn-resolving.de/urn:nbn:de:0074-3110-2" + >urn:nbn:de:0074-3110-2</ref> + </bibl> + <bibl xml:id="kaplan_significance_1976">Susan Kaplan: Ethnological and Biogeographical Significance of Pottery + Sherds from Nissan Island, Papua New Guinea. In: Fieldiana. Anthropology 66 + (1976), H. 3, S. 35–89. <ptr type="gbv" cRef="129326070"/></bibl> + <bibl xml:id="khulusi_life_2022">Richard Khulusi / Stephanie Billib / Stefan Jänicke: Exploring Life in + Concentration Camps through a Visual Analysis of Prisoners’ Diaries. In: + Information 13 (2022), H. 2, S. 54. DOI: <ref + target="https://doi.org/10.3390/info13020054">10.3390/info13020054</ref> + </bibl> + <bibl xml:id="knappett_analysis_2013">Carl Knappett: Network Analysis in Archaeology: New Approaches to Regional + Interaction. 2013. <ptr type="gbv" cRef="733685692"/></bibl> + <bibl xml:id="koerner_nature_2022">Lisbet Koerner: Linnaeus. Nature and Nation. Ebook. Cambridge, MA 2022 + (2001). DOI: <ref target="https://doi.org/10.4159/9780674039698" + >10.4159/9780674039698</ref> <ptr type="gbv" cRef="498997324"/></bibl> + <bibl xml:id="koho_person_2020">Mikko Koho / Petri Leskinen / Eero Hyvönen: Integrating Historical Person + Registers as Linked Open Data in the WarSampo Knowledge Graph. In: Semantic + Systems. In the Era of Knowledge Graphs. Hg. von Eva Blomqvist / Paul Groth / + Victor de Boer / Tassilo Pellegrini / Mehwish Alam / Tobias Käfer / Peter + Kieseberg / Sabrina Kirrane / Albert Meroño-Peñuela / Harshvardhan J. Pandit. + (SEMANTiCS: 16, Amsterdam, 07.–10.09.2020) Cham 2020, S. 118–126. (= Lecture + Notes in Computer Science, 12378) DOI: <ref + target="https://doi.org/10.1007/978-3-030-59833-4_8" + >10.1007/978-3-030-59833-4_8</ref> <ptr type="gbv" cRef="1745156070"/></bibl> + <bibl xml:id="kremer_ontologie_2017">Klaus Kremer / Ursula Wolf: Ontologie. Historisches Wörterbuch der + Philosophie online. Hg. von Joachim Ritter / Karlfried Gründer / Gottfried + Gabriel. Basel 2017. DOI: <ref target="https://doi.org/10.24894/HWPh.5585" + >10.24894/HWPh.5585</ref> + </bibl> + <bibl xml:id="krischel_netzwerkanalyse_2009">Matthis Krischel / Frank Kressing / Heiner Fangerau: Computergestützte + Netzwerkanalyse in Biologie, Sprach und Geschichtswissenschaft. In: Informatik + 2009. Im Focus das Leben. Hg. von Stefan Fischer. Bonn 2009, S. 64–64. + <ptr type="gbv" cRef="609788272"/></bibl> + <bibl xml:id="kusnick_timeline_2020">Jakob Kusnick / Richard Khulusi / Josef Focht / Stefan Jänicke: A Timeline + Metaphor for Analyzing the Relationships between Musical Instruments and + Musical Pieces. In: VISIGRAPP 2020. Proceedings of the 15th International Joint + Conference on Computer Vision, Imaging and Computer Graphics Theory and + Applications (VISIGRAPP: 15, Valetta, 27.–29.02.2020) Sétubal 2020, Bd. 3, S. + 240–251. DOI: <ref target="https://doi.org/10.5220/0008990502400251" + >10.5220/0008990502400251</ref> <ptr type="gbv" cRef="1725708515"/></bibl> + <bibl xml:id="langmead_network_2016">Alison Langmead / Jessica M. Otis / Christopher N. Warren / Scott B. + Weingart / Lisa D. Zilinksi: Towards Interoperable Network Ontologies for the + Digital Humanities. In: International Journal of Humanities and Arts Computing + 10 (2016), H. 1, S. 22–35. DOI: <ref + target="https://doi.org/10.3366/ijhac.2016.0157" + >10.3366/ijhac.2016.0157</ref> <ptr type="gbv" cRef="569610923"/></bibl> + <bibl xml:id="Lassila_framework_1999">Ora Lassila / Ralph R Swick: Resource Description Framework (RDF) Model and + Syntax Specification. In: w3.org Recommendations. Beitrag vom 22.02.1999. + HTML. [<ref target="https://www.w3.org/TR/1999/REC-rdf-syntax-19990222/" + >online</ref>] </bibl> + <bibl xml:id="ma_humanities_2022">Rongqian Ma / Kai Li: Digital Humanities as a Cross-Disciplinary + Battleground: An Examination of Inscriptions in Journal Publications. In: + Journal of the Association for Information Science and Technology 73 (2022), + H. 2, S. 172–187. DOI: <ref target="https://doi.org/10.1002/asi.24534" + >10.1002/asi.24534</ref> <ptr type="gbv" cRef="778372243"/></bibl> + <bibl xml:id="massey_network_2016">Steven E. Massey: Social Network Analysis of the Biblical Moses. In: Applied + Network Science 1 (2016), Artikel 13. DOI: <ref + target="https://doi.org/10.1007/s41109-016-0012-1" + >10.1007/s41109-016-0012-1</ref> + </bibl> + <bibl xml:id="mayer_developements_1976">Jean Mayer: Développements récents de la théorie des graphies. In: Historia + Mathematica 3 (1976), H. 1, S. 55–62. DOI: <ref + target="https://doi.org/10.1016/0315-0860(76)90007-0" + >10.1016/0315-0860(76)90007-0</ref> <ptr type="gbv" cRef="129409960"/></bibl> + <bibl xml:id="mcclure_introducing_2016">Jennifer M. McClure: Introducing Jesus’s Social Network: Support, Conflict, + and Compassion. In: Interdisciplinary Journal of Research on Religion 12 + (2016), Artikel 12. [<ref + target="https://www.religjournal.com/articles/article_view.php?id=110" + >online</ref>] </bibl> + <bibl xml:id="meinecke_alignment_2020">Christofer Meinecke / David Joseph Wrisley / Stefan Jänicke: Automated + Alignment of Medieval Text Versions Based on Word Embeddings. (2020). DOI: <ref + target="http://dx.doi.org/10.31219/osf.io/tah3y">10.31219/osf.io/tah3y</ref> + </bibl> + <bibl xml:id="menin_views_2022">Aline Menin Minh Nhat Do / Carla Dal Sasso Freitas / Olivier Corby / + Catherine Faron / Alain Giboin / Marco Winckler: Using Chained Views and + Follow-up Queries to Assist the Visual Exploration of the Web of Big Linked + Data. In: International Journal of Human-Computer Interaction (2022). DOI: <ref + target="https://doi.org/10.1080/10447318.2022.2112529" + >10.1080/10447318.2022.2112529</ref> <ptr type="gbv" cRef="13081931X"/></bibl> + <bibl xml:id="mulder_entstehung_1992">Henry Martyn Mulder: Die Entstehung der Graphentheorie. In: Klaus Wagner / + Rainer Bodendiek, Graphentheorie. 3 Bde., Mannheim 1989–1993. Bd. 3 (1992): + Zahlen, Gruppen, Einbettungen von Graphen und Geschichte der Graphentheorie, S. + 296–313. <ptr type="gbv" cRef="126677859"/></bibl> + <bibl xml:id="murray_theory_2011">Ronald J. Murray / Barbara B. Tillett: Cataloging Theory in Search of Graph + Theory and Other Ivory Towers. In: Information Technology and Libraries 30 + (2011), H. 4, S. 170–184. DOI: <ref + target="https://doi.org/10.6017/ital.v30i4.1868" + >10.6017/ital.v30i4.1868</ref> <ptr type="gbv" cRef="129919101"/></bibl> + <bibl xml:id="nygren_status_2014">Thomas Nygren / Anna Foka / Philip Buckland: The Status Quo of Digital + Humanities in Sweden: Past, Present and Future of Digital History. In: + H-Soz-Kult. Beitrag vom 23.10.2014. [<ref + target="http://www.hsozkult.de/debate/id/diskussionen-2402">online</ref>] </bibl> + <bibl xml:id="peeples_place_2019">Matthew A. Peeples: Finding a Place for Networks in Archaeology. In: Journal + of Archaeological Research 27 (2019), H. 4, S. 451–499. DOI: <ref + target="https://doi.org/10.1007/s10814-019-09127-8" + >10.1007/s10814-019-09127-8</ref> <ptr type="gbv" cRef="171197364"/></bibl> + <bibl xml:id="proulx_promislow_2005">Stephen R. Proulx / Daniel E. L. Promislow / Patrick C. Phillips: Network + thinking in ecology and evolution. In: Trends in Ecology & Evolution 20 + (2005), H. 6, S. 345–353. DOI: <ref + target="https://doi.org/10.1016/j.tree.2005.04.004" + >10.1016/j.tree.2005.04.004</ref> <ptr type="gbv" cRef="129863580"/></bibl> + <bibl xml:id="w3c_rdf_2014">RDF Schema 1.1. In: w3.org. Recommondations. Beitrag vom 25. Februar 2014. + HTML. [<ref target="https://www.w3.org/TR/rdf-schema/" + >online</ref>]</bibl> + <bibl xml:id="reckziegel_exploration_2021">Martin Reckziegel / David Joseph Wrisley / Taylor Wright Hixson / Stefan + Jänicke: Visual exploration of historical maps. In: Digital Scholarship in the + Humanities 36 (2021), Supplement 2, S. ii251–ii272. DOI: <ref + target="https://doi.org/10.1093/llc/fqaa059">10.1093/llc/fqaa059</ref> + </bibl> + <bibl xml:id="reitmayer_netzwerkansaetze_2010">Morten Reitmayer / Christian Marx: Netzwerkansätze in der + Geschichtswissenschaft. In: Handbuch Netzwerkforschung. Hg. von Christian + Stegbauer / Roger Häußling. Wiesbaden 2010, S. 869–880. DOI: <ref + target="https://doi.org/10.1007/978-3-531-92575-2_76" + >10.1007/978-3-531-92575-2_76</ref> <ptr type="gbv" cRef="1613287224"/></bibl> + <bibl xml:id="roitto_information_2019">Rikard Roitto: The Johannine Information War: A Social Network Analysis of + the Information Flow between Johannine Assemblies as Witnessed by 1-3 John. In: + Drawing and transcending boundaries in the New Testament and early + Christianity.Hg. von Jacobus Kok / Martin Webber / Jermo van Nes. Wien u. a. + 2019, S. 69–84. (= Beiträge zum Verstehen der Bibel, 38) <ptr type="gbv" cRef="1687336466"/></bibl> + <bibl xml:id="rolliinger_amicitia_2014">Christian Rollinger: Amicitia sanctissime colenda. In: Freundschaft und + soziale Netzwerke in der Späten Republik. Heidelberg 2014. (= Studien zur alten + Geschichte, 19) <ptr type="gbv" cRef="771983220"/></bibl> + <bibl xml:id="rollinger_prolegomena_2020">Christian Rollinger: Prolegomena. Problems and Perspectives of Historical + Network Research and Ancient History. In: Journal of Historical Network + Research 4 (2020), S. 1–35. DOI: <ref + target="https://doi.org/10.25517/jhnr.v4i0.72">10.25517/jhnr.v4i0.72</ref> + </bibl> + <bibl xml:id="saake_datenbanken_2018">Gunter Saake / Kai-Uwe Sattler / Andreas Heuer: Datenbanken - Konzepte und + Sprachen. 4. Auflage. Heidelberg u. a. 2018. <ptr type="gbv" cRef="634504142"/></bibl> + <bibl xml:id="schrijver_history_2012">Alexander Schrijver: On the history of the shortest path problem. In: + Optimization stories. 21st International Symposium on Mathematical Programming. + Hg. von Martin Grötschel. (ISMP: 21, Berlin, 19.–24.08.2012) Bielefeld 2012, S. + 155–167. (= Documenta Mathematica, 2012,Extra Vol) PDF. [<ref + target="https://www.math.uni-bielefeld.de/documenta/vol-ismp/32_schrijver-alexander-sp.pdf" + >online</ref>] <ptr type="gbv" cRef="1447639103"/></bibl> + <bibl xml:id="schubert_netzwerke_1994">Klaus Schubert: Netzwerke und Netzwerkansätze: Leistungen und Grenzen eines + sozialwissenschaftlichen Konzeptes. In: Netzwerkansätze im + Business-to-Business-Marketing: Beschaffung, Absatz und Implementierung Neuer + Technologien. Hg. von Michael Kleinaltenkamp / Klaus Schubert. Wiesbaden 1994, + S. 8–49. DOI: <ref target="https://doi.org/10.1007/978-3-322-82550-6_2" + >10.1007/978-3-322-82550-6_2</ref> <ptr type="gbv" cRef="148081983"/></bibl> + <bibl xml:id="schnegg_wurzeln_2010">Michael Schnegg: Die Wurzeln der Netzwerkforschung. In: Handbuch + Netzwerkforschung. Hg. von Christian Stegbauer / Roger Häußling. Wiesbaden + 2010, S. 21–28. DOI: <ref target="https://doi.org/10.1007/978-3-531-92575-2_3" + >10.1007/978-3-531-92575-2_3</ref> <ptr type="gbv" cRef="1613287224"/></bibl> + <bibl xml:id="schweizer_muster_1996">Thomas Schweizer: Muster sozialer Ordnung: Netzwerkanalyse als Fundament der + Sozialethnologie. Berlin 1996. <ptr type="gbv" cRef="279179928"/></bibl> + <bibl xml:id="senn_entwicklung_1933">Gustav Senn: Die Entwicklung der biologischen Forschungsmethode in der + Antike und ihre grundsätzliche Förderung durch Theophrast von Eresos. Aarau u. + a. 1933. (= Veröffentlichungen der Schweizerischen Gesellschaft für Geschichte + der Medizin und der Naturwissenschaften, 8) <ptr type="gbv" cRef="065563336"/></bibl> + <bibl xml:id="silva_infrastructure_2022">Gonçalo Melo da Silva / Ana Celeste Glória / Ângela Sofia Salgueiro / Bruno + Almeida / Daniel Monteiro / Marco Roque de Freitas / Nuno Freire: ROSSIO + Infrastructure: A Digital Humanities Platform to Explore the Portuguese + Cultural Heritage. In: Information 13 (2022), H. 2, S. 50. DOI: <ref + target="https://doi.org/10.3390/info13020050">10.3390/info13020050</ref> + </bibl> + <bibl xml:id="w3c_sparql_2008">SPARQL Query Language for RDF. In: w3.org. Recommondations. Beitrag vom 15. + Januar 2008. HTML. [<ref target="https://www.w3.org/TR/rdf-sparql-query/" + >online</ref>]</bibl> + <bibl xml:id="stearn_background_1959">William Thomas Stearn: The Background of Linnaeus’s Contributions to the + Nomenclature and Methods of Systematic Biology. In: Systematic Zoology 8 + (1959), H. 1, S. 4–22. DOI: <ref target="https://doi.org/10.2307/sysbio/8.1.4" + >10.2307/sysbio/8.1.4 </ref> + <ptr type="gbv" cRef="129466220"/></bibl> + <bibl xml:id="thaller_information_2021">Manfred Thaller: Can Historical Information Be Represented Outside of a + Graph / Hypergraph / Network? In: Graph Technologies in the Humanities 2021. + Hg. von Tara Andrews /, Franziska Diehr / Thomas Efer / Andreas Kuczera / Joris + van Zundert. (Virtual Symposium, 09.02.2021) 2021. PDF: [<ref + target="https://graphentechnologien.hypotheses.org/files/2021/02/Thaller-Mainz2021-2.pdf" + >online</ref>] </bibl> + <bibl xml:id="thompson_internet_1998">Michael B. Thompson: The Holy Internet: Communication Between Churches in + the First Christian Generation. In: Gospels for All Christians. Hg. von Richard + Bauckham. London 1998, S. 49–70. <ptr type="gbv" cRef="241823269"/></bibl> + <bibl xml:id="aydogan_framework_2021">Selda Ulutas Aydogan / Sander Münster / Dino Girardi /Monica Palmirani / + Fabio Vitali: A Framework to Support Digital Humanities and Cultural Heritage + Studies Research. In: Research and Education in Urban History in the Age of + Digital Libraries. Hg. von Florian Niebling / Sander Münster / Heike Messemer. + (UHDL: 2, Dresden, 10.–11.10.2019) Cham 2021, S. 237–267. (= Communications in + computer and information science, 1501). <ptr type="gbv" cRef="1789739438"/></bibl> + <bibl xml:id="valeriola_trust_2021">Sébastien de Valeriola: Can Historians Trust Centrality? Historical Network + Analysis and Centrality Metrics Robustness. In: Journal of Historical Network + Research 6 (2021), H. 1. DOI: <ref + target="https://doi.org/10.25517/jhnr.v6i1.105">10.25517/jhnr.v6i1.105</ref> + </bibl> + <bibl xml:id="verne_ethnographie_2013">Julia Verne: Ethnographie und ihre Folgen für die Kulturgeographie: eine + Kritik des Netzwerkkonzepts in Studien zu translokaler Mobilität. In: + Geographica Helvetica 67 (2013), H. 4, S. 185–194. DOI: <ref + target="https://doi.org/10.5194/gh-67-185-2012">10.5194/gh-67-185-2012</ref> + <ptr type="gbv" cRef="130122149"/></bibl> + <bibl xml:id="wachter_dinge_2000">Daniel von Wachter: Dinge und Eigenschaften. Versuch zur Ontologie. + Dettelbach 2000. (= Neue ontologische Forschung, 1) In: Open Access LMU. DOI: + <ref target="https://doi.org/10.5282/ubm/epub.1968" + >10.5282/ubm/epub.1968</ref> <ptr type="gbv" cRef="312104235"/></bibl> + <bibl xml:id="wagner_ambiguitaet_2019">Andreas Wagner: Ambiguität und Unsicherheit: Drei Ebenen eines Datenmodells. + In: Die Modellierung des Zweifels – Schlüsselideen und -konzepte zur + graphbasierten Modellierung von Unsicherheiten. Hg. von Andreas Kuczera / + Thorsten Wübbena / Thomas Kollatz. Wolfenbüttel 2019. (= Zeitschrift für + digitale Geisteswissenschaften / Sonderbände, 4) DOI: <ref + target="http://dx.doi.org/10.17175/sb004_007">10.17175/sb004_007</ref> + </bibl> + <bibl xml:id="walther_anwendungen_2013">Hansjoachim Walther: Anwendungen der Graphentheorie. Braunschweig 2013. + <ptr type="gbv" cRef="024934461"/></bibl> + <bibl xml:id="wasserman_network_1994">Stanley Wasserman / Katherine Faust: Social Network Analysis: Methods and + Applications. Camebridge u. a. 1994.(= Structural analysis in the social + sciences, 8) <ptr type="gbv" cRef="153711078"/></bibl> + <bibl xml:id="wettlaufer_schritt_2018">Jörg Wettlaufer: Der nächste Schritt? Semantic Web und digitale Editionen. + In: Digitale Metamorphose: Digital Humanities und Editionswissenschaft. Hg. von + Roland S. Kamzelak / Timo Steyer. Wolfenbüttel 2018 (= Zeitschrift für digitale + Geisteswissenschaften / Sonderbände, 2) DOI: <ref + target="http://dx.doi.org/10.17175/sb002_007">10.17175/sb002_007</ref> + </bibl> + <bibl xml:id="wettlaufer_erkenntnisse_2016">Jörg Wettlaufer: Neue Erkenntnisse durch digitalisierte + Geschichtswissenschaft(en)? Zur hermeneutischen Reichweite aktueller digitaler + Methoden in informationszentrierten Fächern. In: Zeitschrift für digitale + Geisteswissenschaften 1 (2016), Artikel 8. DOI:<ref + target="http://dx.doi.org/10.17175/2016_011"> </ref> + <ref target="http://dx.doi.org/10.17175/2016_011">10.17175/2016_011</ref> + </bibl> + <bibl xml:id="wilkinson_fair_2016">Mark D. Wilkinson et al.: The FAIR Guiding Principles for Scientific Data + Management and Stewardship. In: Scientific Data 3 (2016), Artikel 160018. DOI: + <ref target="https://doi.org/10.1038/sdata.2016.18" + >10.1038/sdata.2016.18</ref> + </bibl> + <bibl xml:id="wilson_graph_1999">Robin James Wilson: Graph Theory. In: History of Topology. Hg. von Ioan + MacKenzie James. Amsterdam u. a. 1999, S. 503–529. + [<ref target="https://doi.org/10.1016/B978-044482375-5/50018-3" + >online</ref>] <ptr type="gbv" cRef="267630212"/></bibl> + <bibl xml:id="wilson_combinatorics_2013">Robin James Wilson / John John Watkins: Combinatorics: Ancient & Modern. + Oxford 2013. <ptr type="gbv" cRef="755368592"/></bibl> + <bibl xml:id="woehrle_methode_1985">Georg Wöhrle: Theophrasts Methode in seinen botanischen Schriften. Amsterdam + 1985. (= Studien zur antiken Philosophie<hi rend="bold">, </hi>13) + <ptr type="gbv" cRef="026453800"/></bibl> + <bibl xml:id="wussing_mathematik_2009">Hans Wußing: 6000 Jahre Mathematik: Eine kulturgeschichtliche Zeitreise. + Bde. Berlin 2008–. Bd. 2(2009): Von Euler bis zur Gegenwart. <ptr type="gbv" cRef="556529715"/></bibl> + <bibl xml:id="zaslavsky_africa_1999">Claudia Zaslavsky: Africa Counts: Number and Pattern in African Cultures. 3. + Auflage. Chicago, IL 1999. <ptr type="gbv" cRef="251848027"/></bibl> + <bibl xml:id="zeng_knowledge_2007">Marcia Zeng / Margie Hlava / Jian Qin / Gail Hodge / Denise Bedford: + Knowledge Organization Systems (KOS) Standards. In: Proceedings of the + Association for Information Science and Technology 44 (2007), H. 1, S. 1–3. + DOI: <ref target="https://doi.org/10.1002/meet.145044019" + >10.1002/meet.145044019</ref> <ptr type="gbv" cRef="347039634"/></bibl> + </listBibl> + </div> + <div type="abbildungsnachweis"> + <head>Abbildungsverzeichnis</head> + <desc type="graphic" xml:id="abb1">Verschiedene Darstellungen desselben Graphen. Jede + Darstellung vermittelt visuell andere Informationen, die darunterliegenden + mathematischen Strukturen bleiben allerdings identisch. [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_001"/></desc> + <desc type="graphic" xml:id="abb2">Ein Überblick über die Kategorien von Graph Queries bzw. + Graphenabfragen. Diese Kategorien geben einen ersten Überblick, auch + über deren (Zeit-)Komplexität: RPQ ist PSPACE-vollständig, CRPQ und + ECRPQ (in der Abbildung unter CQ zu finden) sind EXPSPACE-vollständig, vgl. + <ref type="bibliography" target="#bonifati_graph_2019">Bonifati / Dumbrava 2019</ref>. Zentralitätsmaße für Wissensgraphen + sind ebenfalls recht komplex. Für einige Probleme gibt es effiziente + Algorithmen, vgl. <ref type="bibliography" target="#grando_analysis_2016">Grando et al. 2016</ref>, aber einige spezifischere + Probleme sind bekanntermaßen NP-vollständig, z. B. Group Closeness + Maximization (GCM) oder Maximum Betweenness Centrality, vgl. <ref type="bibliography" target="#chen_closeness_2016">Chen et + al. 2016</ref>.) [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_002"/></desc> + <desc type="graphic" xml:id="abb3">Darstellung eines biomedizinischen Wissensgraphen mit + verschiedenen Layern (dargestellt durch verschiedene Farben), Relationen + (Benennung auf den Kanten) und Labeln (Beschriftungen auf den Knoten). Es finden + sich sowohl Kanten zwischen Knoten desselben Layers, als auch Kanten zwischen + Knoten verschiedener Layer. [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_003"/></desc> + <desc type="graphic" xml:id="abb4">Illustration eines Datenworkflows, der mittels Linked + Data das Netzwerk erweitert und plausibilisiert. Graphanalysen vervollständigen + die Werkzeuge, die zur Verfügung stehen, etwa mit Methoden zur Qualitätskontrolle. + [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_004"/></desc> + <desc type="graphic" xml:id="abb5">Illustration eines Twitter-Netzwerks zum Hashtag + #Fachinformatiker für das erste Quartal 2020. Rote Knoten entsprechen Tweets, + blaue Hashtags und grüne Organisationen. [Dörpinghaus 2022]<ref type="graphic" target="#wissensgraphen_2022_005"/></desc> + </div> + </div> + </body> + </text> +</TEI> diff --git a/2022_012_lehmann_et_al/klassifikation_2021_v1_0.pdf b/2022_012_lehmann_et_al/klassifikation_2021_v1_0.pdf new file mode 100644 index 0000000000000000000000000000000000000000..4ecb2825285cd266da5b5cfbaf6cc9064b0d86ac Binary files /dev/null and b/2022_012_lehmann_et_al/klassifikation_2021_v1_0.pdf differ diff --git a/2022_012_lehmann_et_al/klassifikation_2021_v1_0.xml b/2022_012_lehmann_et_al/klassifikation_2021_v1_0.xml new file mode 100644 index 0000000000000000000000000000000000000000..d55945c979a3a2acfcefd9be2d79cd0575cb7b26 --- /dev/null +++ b/2022_012_lehmann_et_al/klassifikation_2021_v1_0.xml @@ -0,0 +1,2447 @@ +<?xml version="1.0" encoding="utf-8"?> +<?xml-model href="https://www.zfdg.de/sites/default/files/schema/tei_zfdg.rnc" type="application/relax-ng-compact-syntax" + ?> +<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html" + xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink" + xmlns:xhtml="http://www.w3.org/1999/xhtml"> + <teiHeader> + <fileDesc> + <titleStmt> + <title> + <biblStruct> + <analytic> + <title level="a">Classification of Tragedies and Comedies in Calderón de la + Barca’s Comedias Nuevas</title> + <respStmt> + <resp> + <persName> + <name role="marc_aut"> + <forename>Jörg</forename> + <surname>Lehmann</surname> + </name> + <email>joerg.lehmann@uni-tuebingen.de</email> + <idno type="gnd">1054732310</idno> + <idno type="orcid">0000-0003-1334-9693</idno> + </persName> + </resp> + <orgName>Eberhard Karls Universität Tübingen</orgName> + </respStmt> + <respStmt> + <resp> + <persName> + <name role="marc_aut"> + <forename>Sebastian</forename> + <surname>Padó</surname> + </name> + <email>pado@ims.uni-stuttgart.de</email> + <idno type="gnd">1033924393</idno> + <idno type="orcid">0000-0002-7529-6825</idno> + </persName> + </resp> + <orgName>Universität Stuttgart, Institut für Maschinelle + Sprachverarbeitung</orgName> + </respStmt> + <idno type="doi">10.17175/2022_012</idno> + <idno type="ppn">181820763X</idno> + <idno type="zfdg">2022.012</idno> + <idno type="url">https://www.zfdg.de/node/363</idno> + <date when="2022-12-29">29.12.2022</date> + </analytic> + <monogr> + <title level="j">Zeitschrift für digitale Geisteswissenschaften</title> + <respStmt> + <resp>Publiziert von</resp> + <orgName role="marc_pbl">Herzog August Bibliothek</orgName> + </respStmt> + <respStmt> + <resp>Transformation der Word Vorlage nach TEI</resp> + <persName/> + <name role="marc_trc"> + <surname>Baumgarten</surname> + <forename>Marcus</forename> + <idno type="gnd">1192832655</idno> + </name> + </respStmt> + <availability status="free"> + <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref> + </p> + </availability> + <biblScope unit="year">2022</biblScope> + <biblScope unit="artikel">12</biblScope> + </monogr> + </biblStruct> + </title> + </titleStmt> + <editionStmt> + <edition>Elektronische Ausgabe nach TEI P5</edition> + </editionStmt> + <publicationStmt> + <distributor> + <name> + <orgName>Herzog August Bibliothek Wolfenbüttel</orgName> + </name> + </distributor> + <idno type="doi">10.17175/zfdg.01</idno> + <idno type="ppn">0819494402</idno> + <authority> + <name>Herzog August Bibliothek</name> + <address> + <addrLine>Lessingplatz 1</addrLine> + <addrLine>38304 Wolfenbüttel</addrLine> + </address> + </authority> + <authority> + <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name> + <address> + <addrLine>Burgplatz 4</addrLine> + <addrLine>99423 Weimar </addrLine> + </address> + </authority> + <availability status="free"> + <p> Sofern nicht anders angegeben </p> + <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence> + </availability> + <availability status="free"> + <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund + MWW</ref> + </p> + </availability> + </publicationStmt> + <sourceDesc> + <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p> + </sourceDesc> + </fileDesc> + <encodingDesc> + <editorialDecl> + <p>Medienrechte liegen bei den Autor*innen</p> + <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und + XSLT-Skripten</p> + <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von <persName>Martin de la Iglesia</persName>.</p> + <p>All links checked<date when="2022-11-24">24.11.2022</date></p> + </editorialDecl> + </encodingDesc> + <profileDesc> + <creation>Einreichung als Artikel der Zeitschrift für digitale + Geisteswissenschaften</creation> + <langUsage> + <language ident="en">Text in Englisch</language> + <language ident="de">Abstract in Deutsch</language> + <language ident="en">Abstract in Englisch</language> + </langUsage> + <textClass> + <keywords scheme="gnd"> + <term>Drama<ref target="4012899-4"/></term> + <term>Klassifikation<ref target="4030958-7"/></term> + <term>Cluster-Analyse<ref target="4070044-6"/></term> + <term>Siglo de oro<ref target="4181251-7"/></term> + <term>Calderón de la Barca, Pedro *1600-1681*<ref target="118518399"/></term> + <term>Hispanistik<ref target="4159974-3"/></term> + + </keywords> + </textClass> + </profileDesc> + <revisionDesc> + <change/> + </revisionDesc> + </teiHeader> + <text> + <body> + <div> + <div type="abstract"> + <argument xml:lang="en"> + <p>In this study, we aim at distinguishing comedies and tragedies among 112 dramas + written by Calderón de la Barca, using procedures established by distributional + semantics. 15 each of these <term type="dh">comedias nuevas</term> have already + been classified by qualitative researchers as either tragedies or comedies, + respectively; for another 82 dramas the classification was unknown. Four + independent <term type="dh">document embedding</term> methods are explored, which differ from each + other in matrix creation and reduction, and in the calculation of similarity or + distance matrices. The best results – measured against the pre-established + classification of these dramas – are obtained through the classification + procedure that applied the strongest matrix reduction. In addition, a + contrastive vocabulary analysis with <term type="dh">word embeddings</term> is carried out, based + either on word lists produced by the four tested methods, or on the <term + type="dh">log-likelihood </term>probability distribution for two sub-corpora + containing only dramas already determined to be comedies or tragedies. This + step permits the identification of 130 terms that are each discriminative + either of comedies or of tragedies. The outcome shows that the explored methods + identify tragedies with greater accuracy than comedies, indicating that + tragedies show stronger lexical cohesion. It also becomes apparent that one + could more appropriately consider classifications such as ›tragedy‹ and + ›comedy‹ as poles between which gradual differences can be observed, whereby + the ensuing transitional area contains <hi rend="italic">comedias nuevas + </hi>that have been described in prior research as <term type="dh" + >tragicomedias</term> or <term type="dh">comedias mitológicas</term>.</p> + </argument> + <argument xml:lang="de"> + <p>In dieser Studie klassifizieren wir Komödien und Tragödien in einem Korpus von + 112 Dramen Calderón de la Barcas, wobei wir Verfahren der distributionellen + Semantik anwenden. Je 15 dieser <term type="dh">comedias nuevas</term> sind + bereits von qualitativen Forscher*innen als Tragödien bzw. Komödien + klassifiziert worden; bei weiteren 82 Dramen war die Klassifikation unbekannt. + Es werden vier unüberwachte <term type="dh">document embedding</term>-Verfahren + eingesetzt, die sich durch Matrixerstellung und -reduktion sowie durch die + Berechnung von Ähnlichkeits- oder Distanzmatrizen voneinander unterscheiden. + Die besten Ergebnisse – gemessen gegenüber der vorab vorgenommenen + Klassifikation dieser Dramen – erzielt dabei jenes Klassifikationsverfahren, + bei dem die stärkste Matrixreduktion vorgenommen wurde. Darüber hinaus wird + eine kontrastive Vokabularanalyse mit <term type="dh">word embeddings</term> + durchgeführt. Diese basiert entweder auf den Wortlisten der vier erprobten + Verfahren oder auf der <term type="dh" + >Log-Likelihood</term>-Wahrscheinlichkeitsverteilung für zwei Subkorpora, die + ausschließlich als Komödien oder Tragödien bestimmte Dramen enthielten. Dieser + Arbeitsschritt ermöglicht die Identifikation von je 130 Begriffen, die für + Komödien oder Tragödien diskriminativ sind. Das Ergebnis zeigt, dass die + explorierten Verfahren Tragödien mit größerer Treffsicherheit identifizieren + als Komödien, was darauf hindeutet, dass Tragödien mehr distinktive Merkmale + aufweisen. Es zeigt sich aber auch, dass es angemessener ist, Klassifikationen + wie ›Tragödie‹ und ›Komödie‹ als Pole zu denken, zwischen denen graduelle + Unterschiede bestehen und in deren Übergangsbereich <hi rend="italic" + >comedias nuevas</hi> enthalten sind, die in der Forschung als <term + type="dh">tragicomedias</term> oder <term type="dh">comedias + mitológicas</term> bezeichnet wurden.</p> + </argument> + </div> + <div type="chapter"> + <head>1. Preface</head> + + <p>Pedro Calderón de la Barca (1600–1681) counts, along with Félix Lope de Vega + Carpio (1562–1635), as one of the most important playwrights of the Spanish + baroque, also known as the ›Golden Age‹ (<term type="dh">siglo de oro</term>). His + works include 84 Corpus Christi plays (<term type="dh">autos + sacramentales</term>), 112 <term type="dh">comedias</term> and 41 short pieces + (<term type="dh">bailes, entreméses, jácaras, mojigangas</term>; contemporary + terms also used by Calderón himself). A nearly complete collection of his works + first appeared in the early 20<hi rend="super">th</hi> century from the + Madrid-based publisher Aguilar.<note type="footnote"> <ref type="bibliography" target="#calderon_obras_1951">Calderón de la Barca + 1951–1956</ref>. This publication, however, does not conform to the standards of a + historico-critical edition.</note> Those of his <hi rend="italic">comedias</hi> + which had been published during his lifetime specified the dramas with terms such + as <term type="dh">gran comedia</term> or <term type="dh">comedia famosa</term>. + However, these descriptions did not differentiate between comedies and tragedies. + This was in keeping with the use of language during the Golden Age, as the term + ›comedia‹ was interchangeable with ›play‹ or ›theater piece‹: + <quote>Though the etymology of comedia is simple enough – a play of high + spirits and laughter with a happy ending, – in Early Modern Spain the term + comedia meant ›a play‹ or ›work for the stage‹ in a quite neutral + sense.</quote><note type="footnote"> <ref type="bibliography" target="#sullivan_drama_2018">Sullivan 2018</ref>, p. 33.</note> Because Calderón had never + written any poetics himself, Lope de Vega’s programmatical work <bibl> + <title type="desc">Arte nuevo de hacer comedias en este tiempo</title> + </bibl> + <note type="footnote"> <ref type="bibliography" target="#vega_arte_2010">Lope de Vega 1621</ref>.</note> from 1609 is considered to be a + contemporary reference by whose pragmatic rules Calderón generally oriented + himself, despite some slight modifications. Here, Lope de Vega defines the <term + type="dh">comedia nueva</term> as a play in three acts, and distinguishes the + comedy as a fictional drama involving everyday people, from the tragedy as + pertaining to members of the royal family or people of high descendance and being + based on historic events. Furthermore, Lope characterizes the <hi rend="italic" + >comedia nueva</hi> as a mixture of comedic and tragic elements, thus referring + to the combination of both dramatic genres.<note type="footnote"> This may be + considered a reference to a third genre, which has received little attention up + to now in research. Cf. here <ref type="bibliography" target="#couderc_theatre_2012">Couderc 2012</ref>, pp. 65–75 and 102–109.</note> + Thus, the Spanish playwrights of the 17<hi rend="super">th</hi> century had at + their disposal a central poetological reference, which – superseding Aristotelian + poetics – defined the ›Spanish style‹ as an original idea applying not only to + comedy, but also to tragedy.</p> + <p>After a phase of degradation as being ›irregular‹ according to the doctrines of + French classicism, the historical reception of the Spanish <hi rend="italic" + >comedia nueva</hi> – and especially its understanding of tragedies – became + vitally influenced through the German Enlightenment, the Romantic period and + Idealism. Gotthold Ephraim Lessing (1729–1781) was one of the first in the + German-speaking regions to recognize Calderón’s work. He focused intensely on the + tragedies of the Spanish Golden Age and implemented his theoretical aspirations on + a practical level in a newly founded genre of the middle-class tragic drama. He + was later followed by the Romantics Ludwig Tieck, August Wilhelm and Friedrich + Schlegel, the brothers Grimm and Alexander and Wilhelm von Humboldt, who had all + studied Spanish in Göttingen.<note type="footnote"> Comprehensively in detail + <ref type="bibliography" target="#sullivan_landen_2017">Sullivan 2017</ref>.</note> August Wilhelm Schlegel translated five of Calderón’s + plays for his <bibl> + <title type="desc">Spanisches Theater</title> + </bibl> (Vol. I: 1803, Vol. II: 1809) and examined Calderón in great detail in his <bibl> + <title type="desc">Vorlesungen über dramatische Kunst und Literatur</title> + </bibl> (Lectures on Dramatic Arts and Literature) in Vienna (1809). Wilhelm + Joseph Schelling developed his own theory of tragedies in his presentation <bibl> + <title type="desc">Abhandlung über die Tragödie</title> + </bibl> (Essay on Tragedy) based on Calderón’s work. Even Hegel and Schopenhauer + grappled with the subject of Calderón, and thus it is no wonder that Walter + Benjamin keeps returning to Calderón and his notion of the tragedy again and again + in his <bibl> + <title type="desc">Ursprung des deutschen Trauerspiels</title> + </bibl> (Origin of the German Tragedy).<note type="footnote"> <ref type="bibliography" target="#benjamin_ursprung_1978">Benjamin + 1978</ref>.</note> + </p> + <p>While the interest in the German-speaking regions lay mostly on Calderón’s + tragedies and was, therefore, focused on only a few plays, it was first in the + mid-20<hi rend="super">th</hi> century when serious attempts were made at + examining and classifying the entire body of Calderónian <hi rend="italic" + >comedias nuevas. </hi>It was initially the publishers of Calderón’s <bibl> + <title type="desc">Obras completas</title> + </bibl>, who, in 1951, undertook a binary division of these theater pieces into + <term type="dh">dramas</term> and <term type="dh">comedies</term> + <hi rend="italic">, </hi>thereby distinguishing between ›serious‹ relative to + those resembling tragedies and ›light‹ relative to entertainment-oriented dramas. + In this manner, the modern-day editors of the Aguilar publishing house quite + obviously approached the provided examples of Calderón’s <hi rend="italic" + >comedias</hi> according to the poetic traditions of Antiquity, which, since + the time of Aristotle, have been based on the clear separation of comedy and + tragedy; however the editors proceeded with insufficiently explicit criteria.<note + type="footnote"> Cf. here the introduction <ref type="bibliography" target="#calderon_obras_1951"> + Calderón de la Barca 1951</ref>, pp. 9–34.</note> At the same time, they posed a + pivotal question with this differentiation, which has been heatedly discussed with + opposing positions in the literary research of Calderon’s work from the second + half of the 20<hi rend="super">th</hi> century to the present day. The British + Calderón school (Alexander A. Parker, Bruce Wardropper, Anthony Irving Watson, + Henry W. Sullivan among others) was intensely occupied with Calderónian tragedies. + Their attempts at classification were subjected to a rigorously methodical + critique at the beginning of this millennium by the Spanish researcher Jésus G. + Maestro, who commented, not without sarcasm, on the ›impotence of literary theory‹ + regarding the dramatic genres and the ever-changing attributions accompanying + them.<note type="footnote"> Cf. <ref type="bibliography" target="#maestro_limites_2003">Maestro 2003</ref> and also the discussion by + <ref type="bibliography" target="#arellano_dramaticos_2018">Arellano 2018</ref> on the limits of compiling taxonomies.</note> Now it was left to + the British researcher Henry W. Sullivan to identify, from a qualitative + perspective, twelve criteria according to which the tragic drama of the <hi + rend="italic">siglo de oro</hi> can be characterized. In doing so, Sullivan + focused mainly on thematic traits (father-son conflicts, revenge and honor-based + dramas), extra-literary indications (persons of high social standing),<note + type="footnote"> Usually, the high social standing is explicitly indicated in + the list of <hi rend="italic">dramatis personae</hi> of Calderón’s works, such + as <quote>emperador</quote>, <quote>rey</quote>, <quote>reina</quote>, + <quote>don</quote>, <quote>doña</quote>, <quote>infanta</quote> or + <quote>infante</quote> (emperor, king, queen, esquire, lady, infanta or + infante).</note> characteristics of the plot (unfair judgements or death of the + protagonist), or attributes of reception (creation of <term type="dh">eleos</term> + and <term type="dh">pathos</term> or cathartic endings). He also formulated + exclusionary criteria like the prevalence of themes such as redemption and + damnation, and he also excluded martyr dramas, thus defining tragedies + narrowly.<note type="footnote"> <ref type="bibliography" target="#sullivan_drama_2018">Sullivan 2018</ref>, pp. 362–364.</note> Within the + framework of these criteria, Sullivan was able to identify at least 14 tragedies + in the complete works of Calderónian <hi rend="italic">comedias nuevas.</hi> + </p> + <p>In light of the monumental works of Calderón it is, on the one hand, not + surprising that the classification of the <hi rend="italic">comedias nuevas</hi> – + aside from the Aguilar edition – was never carried out comprehensively:<note + type="footnote"> An attempt at this is being made by the portal <ref + target="http://calderondigital.tespasiglodeoro.it/">Calderón Digital</ref>, + by which around 80 of Calderón’s written texts can be filtered according to + genre characteristics; the researchers responsible for these classifications + are also indicated.</note> Which researcher is prepared to study and classify + 112 dramas? At the same time, it is evident that just this sort of written work is + suitable for the implementation of computational procedures. On the other hand, it + must be understood that a data-based, computational classification of the entire + body of the <hi rend="italic">comedias</hi> has been rendered impossible until + spring 2022, when all of them were made available in an electronic form.<note + type="footnote"> The full collection is available in TEI-XML at <ref + target="https://dracor.org/cal">DraCor</ref>. Not only the 110 <hi + rend="italic">comedias nuevas</hi> listed in the Aguilar edition were made + available, but also two further <hi rend="italic">comedias</hi> attributed to + Calderón, namely <bibl> + <title type="desc">La selva confusa</title> + </bibl> and <bibl> + <title type="desc">Cómo se comunican dos estrellas contrarias</title> + </bibl>. For the discussion of this attribution, see <ref type="bibliography" target="#coenen_selva_2016">Coenen 2016</ref>. The authors + of this study are very thankful to Dr. Simon Kroll and his team at the + University of Vienna for the contribution of more than 50 dramas to this + corpus.</note> Hence, Calderón’s works – with the exception of only a few + studies – have also not yet been analyzed with any methods provided by the <term + type="dh">digital humanities</term> + <hi rend="italic">, </hi>although such a massive corpus quite obviously lends + itself to the examination of structural similarities among works in a particular + genre or differences between dramas of varying genres.<note type="footnote"> For + example, <ref type="bibliography" target="#pena_teatro_2011">Peña-Pimentel 2011</ref>; + <ref type="bibliography" target="#pena_aplicacion_2012">Peña-Pimentel 2012</ref>; + <ref type="bibliography" target="#rosa_role_2018">de la Rosa et al. 2018</ref>; + <ref type="bibliography" target="#ehrlicher_poetica_2020">Ehrlicher et al. + 2020</ref>.</note> Calderón’s work stands out as a rare case in that such a large + body of theater pieces was written by one author within a relatively short period + during the 17<hi rend="super">th</hi> century.</p> + <p>The study at hand<note type="footnote"> This study arose as a part of the project <bibl><title type="desc">QUOTE. Comprehensive Modeling of Conversational Contributions in Prose Texts</title></bibl>, sponsored by the German Research Community (Deutsche + Forschungsgemeinschaft, project No. 350397899). The authors thank Prof. Dr. + Hanno Ehrlicher (University of Tübingen), who commented on the first version of + the article.</note> represents an attempt, based on at least 112 <hi + rend="italic">comedias,</hi> to critically assess the validity of the + distinction between the comedy and the tragedy among these dramas. This goes hand + in hand with assessing the methodical possibilities made available by the digital humanities’ application of <term type="dh" + >distributional semantics </term>procedures for this problem.<note + type="footnote"> Comparable studies on classical French drama have been thus + far presented by, for instance, <ref type="bibliography" target="#schoech_exploration_2017">Schöch 2017</ref> and + <ref type="bibliography" target="#schoech_tools_2013">Schöch 2013</ref>, who approached + the subject with <term type="dh">topic modeling</term> and stylometric methods. For stylometric analysis of + dramas in the <hi rend="italic">siglo de oro</hi> cf. in particular <ref type="bibliography" target="#campion_original_2021">Campión + Larumbel / Cuéllar 2021</ref> and + <ref type="bibliography" target="#cuellar_stylometry_2022">Cuéllar 2022</ref>.</note> Because + thus far only a small portion of the Calderónian <hi rend="italic">comedias</hi> + have been studied, and the majority of them remain entirely unexplored, we expect + that the proven methods can deliver important indications for the classification + of the plays which have yet to be thoroughly analyzed.</p> + </div> + <div type="chapter"> + <head>2. Methodology</head> + + <div type="subchapter"> + <head>2.1 Methodical Basis</head> + + <p>Nowadays, the concept of distributional semantics is used widely in the realm + of computational linguistics. The basic assumption is that the meaning of a + word is established according to how much it is used and how often it co-occurs + with other words within a specific context. Words and documents are represented + in a high-dimensional space; semantic relationships are inferred from the + similarities within that space. For the representation of documents, the + frequencies (absolute or relative) of the words in each document are stored as + matrices of vectors where each word corresponds to a column of the matrix and + every document to a row. The cells of the matrix contain co-occurrence + frequencies; pure frequencies are often replaced through degrees of statistical + association, such as <term type="dh">pointwise mutual information</term> or + <term type="dh">tf-idf</term> (<term type="dh">term frequency–inverse document frequency</term>), in order to counteract the Zipf distribution of + words.<note type="footnote"> Cf. <ref type="bibliography" target="#lowe_theory_2001">Lowe 2001</ref> for details.</note> To + represent the meanings of words, the same kind of matrix is created, with the + target terms forming rows and contextual words forming columns. Such matrices + can serve to compute the distances between single words or texts, to compare + them to each other, to cluster them into groups, and to visualize them. As a + rule, these very large matrices contain thousands of columns and are sparse, i. + e. most of their elements are zero. This calls for reduction to a much smaller + number of dimensions in order to be appropriate for the computation of distance + or similarity matrices. The resulting low dimensional vectors are often + referred to as <term type="dh">word</term> or <term type="dh">document + embeddings</term> and are probably the most common practice for semantic + representation in natural language processing (NLP). They are related to, but + not identical to topic models. The reduction of dimensions is a purely + technical requirement and hardly alters the underlying intention.<note + type="footnote"> A short introduction is given in <ref type="bibliography" target="#jockers_macroanalysis_2013">Jockers 2013</ref>, pp. + 63–67.</note> + </p> + <p>The choice of a distributional approach for the task at hand is based on our + starting assumption, namely the hypothesis that comedies and tragedies – in + accordance with the treatment of each of the different themes – can be + differentiated by observing word choice and word usage. Simply put, it can be + expected that in Calderónian tragedies, terms such as ›honor‹, ›power‹ and + ›death‹ strongly co-occur, while the comedies tend to combine words like + ›love‹, ›disguise‹ and ›jealousy‹. This is quite obviously an approach that + represents an oversimplification – narrative patterns or plot structures, + however, cannot be characterized in this manner. At the same time, the wide + success of approaches based on frequency and co-occurrence of words and common + methods for author recognition demonstrates that such analyses allow for + surprisingly deep understandings even of literary texts.</p> + </div> + <div type="subchapter"> + <head>2.2 Data Basis</head> + + <p>Beginning with the fourteen tragedies identified by Sullivan, yet another was added + to the examined texts, which had apparently remained unknown to him: <bibl><title type="desc">Saber del bien y del mal.</title></bibl><note type="footnote"> Cf. recently to this identification <ref type="bibliography" target="#escudero_amor_2021">Escudero Baztán + 2021</ref>, p. 21.</note> 15 further dramas, which were identified by qualitative + research as comedies and which are often called <term type="dh">comedias + cómicas</term> (or <term type="dh">urbanas</term> or <term type="dh" + >palatinas</term>),<note type="footnote"> See for the most recent overview + of this classification <ref type="bibliography" target="#kroll_sonido_2022">Kroll 2022</ref>, pp. 63–65. Cf. also + <ref type="bibliography" target="#calderon_obras_1951">Calderón de la + Barca 1951</ref>; + <ref type="bibliography" target="#escudero_amor_2021">Escudero Baztán 2021</ref>; + <ref type="bibliography" target="#ehrlicher_einfuehrung_2012">Ehrlicher 2012</ref>; + <ref type="bibliography" target="#maestro_limites_2003">Maestro 2003</ref>; + <ref type="bibliography" target="#parker_mind_1988">Parker 1988</ref>; + <ref type="bibliography" target="#pena_teatro_2011">Peña-Pimentel 2011</ref>; + <ref type="bibliography" target="#tobar_rotonda_2000">Tobar 2000</ref>; + <ref type="bibliography" target="#prat_historia_1950">Valbuena Prat 1950</ref>.</note> make up the + counterpart to the tragedies in this body of work. The other 82 Calderónian <hi + rend="italic">comedias</hi> are available as full digital texts in + modernized and normalized Spanish.<note type="footnote"> For the most part, + these dramas are available under the portal: <ref + target="http://www.cervantesvirtual.com/">Cervantes Virtual</ref> and + the <ref target="http://www.comedias.org/">Association for Hispanic + Classical Theater</ref>. A current overview of all sources can be found + at: <ref target="http://etso.es/">EstilometrÃa aplicada al Teatro del Siglo + de Oro</ref>. Because diacritical symbols used in modern Spanish can be + used according to context, the spelling of certain terms may vary (ex.: solo + / sólo – solo as an adjective means ›sole‹ or ›alone‹, whereas sólo as an + adverb means ›barely‹ or ›merely‹).</note> The spoken texts of the <term + type="dh">dramatis personae</term> were extracted from all 112 plays and + collected for analysis; stage instructions or similar additional texts were not + included. The 15 tragedies were each marked with a T and a consecutive number, + the comedies with a C, and the remaining 82 plays were marked + <quote>Test</quote> and also numbered.<note type="footnote"> See the + appendix below in which this abbreviation was removed and the results of the + applied methods are presented.</note> + </p> + </div> + <div type="subchapter"> + <head>2.3 Research Goal</head> + + <p>In the absence of suitably large bodies of dramatic works beyond the + Spanish-language world, the classification of genre with word or document embeddings is still relatively + new.<note type="footnote"> One exception is the study by <ref type="bibliography" target="#willand_2017">Willand / Reiter + 2017</ref>, cf. here pp. 190–194.</note> Thus, the goal of our study is to + explore various methods and combinations thereof, and to compare the results. + We will compare four approaches, which all follow the same general unobserved + schemes: 1) pre-filtering of the vocabulary; 2) calculation of document embeddings, and, if applicable, dimension reduction; 3) clustering of embeddings; 4) visualization und evaluation. Our corpus provides us with an excellent basis, + as the categories are known in about a quarter of the plays, but not in the + remaining dramas. In this manner, we can simultaneously review the quality of + the process (on the basis of the known categories) and obtain findings on the + yet unclassified dramas. We find this type of methodical comparison to be + important, because it is known that the findings from unobserved distributional + methods depend heavily on the parametrization of the process.<note + type="footnote"> <ref type="bibliography" target="#turney_frequency_2010">Turney / Pantel 2010</ref>; + <ref type="bibliography" target="#bullinaria_representation_2007">Bullinaria / Levy 2007</ref>.</note> + </p> + </div> + <div type="subchapter"> + <head>2.4 Practical Application</head> + + <p>All analyses were implemented with the statistics software R. The + pre-processing of the texts was mostly carried out using the R package + quanteda, as it also enables the exclusion of Spanish stop words, punctuation + and numbers, and the conversion of the prepared corpus of texts to be processed + in other packages. As was revealed in the course of exploration, only a small + number (viz., 308) of Spanish stop words were retained in the quanteda package. + One exploration showed that the exclusion of function words from the matrices + did not lead to significantly different results, thus the stop word list was + considerably expanded manually.<note type="footnote"> These word lists are + documented in the R code, which was published together with the body of + dramas on <ref target="https://doi.org/10.5281/zenodo.6669603">Zenodo</ref>. + Cf. <ref type="bibliography" target="#lehmann_classifikation_2022">Lehmann 2022</ref>.</note> Furthermore, the analysis of the different + methods employed, in particular the tf-idf statistics, showed that the grouping + results were quite negatively affected by names of characters, places, and + countries within the texts, also in their adjectivized form, as these elements + of speech tend to reflect idiosyncrasies of single pieces rather than + stereotypical genre characteristics. These proper names were likewise – + primarily through the list of dramatis personae<hi rend="italic"> – + </hi>compiled and removed from the texts; the number of terms to be excluded + from the corpus thus rose above 800, additionally to the 308 stop words + contained in the quanteda package. As a rule, the frequency of the words in + each drama was calculated, subsequently the frequencies were normalized per + document. This took place wherever the distance and similarity matrices for + grouping were generated. When calculating the similarity between documents + using cosine similarity this could be omitted, because they remain constant in + relation to the vector lengths. Consistently throughout the analyses, work was + done with inflected or conjugated forms of words; a lemmatization or a stemming + of these words was not carried out. In this way linguistic information that + might help in the classification of literary genres (and with respect to style, + authorial signals or diachronic positionality) was preserved.</p> + </div> + </div> + <div type="chapter"> + <head>3. Results</head> + + <div type="subchapter"> + <head>3.1 Experiment 0</head> + + <p>In a first exploration, we applied a well-established method, Skip-gram,<note + type="footnote"> <ref type="bibliography" target="#mikolov_representations_2013">Mikolov et al. 2013</ref>.</note> to the body of text in order to + assess whether <hi rend="italic">word embeddings</hi> could tell us something + interesting about the text and which word pairs within the entire body of 112 + dramas exhibited the highest number of similarities. We reduced the matrix to + the 1,000 terms with the highest log-likelihoods and calculated the cosine + similarity between all pairs of vectors. Cosine similarity, or more precisely, + the cosine of the angle between two vectors, is a widely used measure of + similarity which determines to what extent two vectors ›point‹ in the same + direction in the high dimensional space. Cosine ranges between 0 and 1, and a + high cosine indicates that two terms are found in similar contexts.</p> + <p>Word pairings with a very high cosine similarity value of more than 0.75 are, + for instance, <quote>cielo</quote> and <quote>muerte</quote> (heaven, death), + <quote>esperanza</quote> and <quote>desdichas</quote> (hope, despair), + <quote>poder</quote> and <quote>temor</quote> (power, fear), + <quote>poder</quote> and <quote>gusto</quote> (power, taste), + <quote>honor</quote> and <quote>alma</quote> (honor, soul) or + <quote>alma</quote> and <quote>muerte</quote> (soul, death). One of the + highest cosine similarity values, at 0.96, showed that the word pairing + <quote>honor</quote> and <quote>muerte</quote> – honor and death – can be + determined as a major theme throughout the entire body of work. Indeed, these + first results proved to be surprisingly clear, in that, by using the Skip-gram + algorithm, central themes in the Calderónian <hi rend="italic">comedias</hi> + could be identified, even when they deal with the intersection of social + conventions (honor) and individuality (taste, soul, fear, social or actual + death).</p> + <p>Conversely, word pairings like <quote>honor</quote> and <quote>poder</quote> + (honor, power; 0.58), <quote>amores</quote> and <quote>agravios</quote> + (love, infidelity, each in plural form; 0.69), <quote>gracia</quote> and + <quote>corte</quote> (grace, court; 0.63) or <quote>gracia</quote> and + <quote>culpa</quote> (grace, guilt; 0.60) showed lesser cosine similarity + values. Cosine similarity values under 0.5 exhibit only weakly developed + commonalities in the contexts; this could be observed for the word pairings + <quote>amar</quote> and <quote>honra</quote> (loving, reputation), + <quote>muere</quote> and <quote>sepulcro</quote> (he / she / it dies, + grave), <quote>muerte</quote> and <quote>engaño</quote> (death, deceit), + <quote>mueran</quote> and <quote>suerte</quote> (they may die, fate), + <quote>amores</quote> and <quote>honra</quote> (love, reputation) and also + <quote>mentira</quote> and <quote>gracia</quote> (lie, grace). First and + foremost, it is apparent that the central themes in Calderón’s works + (<quote>Amor, honor y poder</quote><note type="footnote"> Cf. <ref type="bibliography" target="#escudero_amor_2021">Escudero Baztán 2021</ref>.</note> – love, honor, and + power) do not necessarily have to be interconnected with one another. This can + be attributed to the fact that comedies and tragedies can be distinguished from + each other through differing combinations of these terms. It is to be expected + that the combination <quote>honor</quote> and <quote>poder</quote> is more + characteristic of tragedies, and the combination <quote>amar</quote> and + <quote>honra</quote> is more characteristic for comedies, but not for the + entire body of work. We will come back to this point later.</p> + </div> + <div type="subchapter"> + <head>3.2 Experiment 1</head> + + <p>With the first experiment, our goal was to be able to explore the validity of + the <hi rend="italic">document embeddings</hi>. We take advantage of the known + (or: labeled) tragedies and comedies to evaluate our document clusterings as + follows, in the spirit of cluster purity<note type="footnote"> <ref type="bibliography" target="#manning_introduction_2008">Manning et al. + 2008</ref>.</note> analysis: we assign each cluster to the class that the majority + of documents with known affiliation belongs to. We then consider the other + known classes of documents in this cluster, and compute purity, that is, the + degree of agreement between these classes and the majority class, as a measure + of success of our clustering. Our setup has the additional aspect that our data + set includes documents for which the ›true‹ class is unknown. Since purity only + considers documents with known classes, this makes the measure hard to + interpret for clusters that consist predominantly or entirely of such + documents. For such clusters — which we call underdetermined — we refrain from + discussing purity in detail. After carrying out the preprocessing steps + described above, we explored the following four methods: 1) Reduction of the + matrix through the deletion of words according to their frequency and + appearance within the texts; calculating the distance matrix according to + relative frequencies, clustering with the Ward.D2 algorithm<note + type="footnote"> <ref type="bibliography" target="#ward_function_1963">Ward 1963</ref>.</note> based on the Euclidian distance. 2) + Reduction of the matrix through the deletion of <term type="dh">sparse + terms</term> which only appear in a few documents, calculation of the + distance matrix based on relative frequencies, clustering based on the + Euclidian distance with the Ward.D2 distance algorithm. 3) Part-of-speech + tagging in each of the dramas, extraction of verbs, nouns and adjectives, + calculation of the cosine similarity values between the documents, calculation + of the distance matrix, clustering with the Ward.D2 distance algorithm. 4) + Calculation of the tf-idf statistics, calculation of the cosine similarity + values between the documents, calculation of the distance matrix and clustering + with the Ward.D2 distance algorithm. We discuss the results of each method.</p> + <p>The first method represented a conservative approach: only the 1,094 words with + a frequency > 120 and appearing in at least half of the documents were + included. The document word matrix was filled with mere frequencies; no + dimension reduction was carried out. The grouping was carried out through a + clustering with the Ward.D2 distance algorithm. <ref type="graphic" + target="#klassifikation_2022_001">Figure 1</ref> shows the resulting dendrogram. + Recall that among the documents that form the leaf nodes of the dendrogram, + some are known as comedies (CXX), some as tragedies (TXX), but most are unknown + regarding their status (<quote>Test</quote>).</p> + <figure> + <graphic xml:id="klassifikation_2022_001" + url=".../medien/klassifikation_2022_001.png"> + <desc> + <ref type="graphic" target="#abb1">Fig. 1</ref>: Ward.D2 clustering of + 112 Calderónian Comedias. [Lehmann 2022] <ref type="graphic" + target="#klassifikation_2022_001"/> + </desc> + </graphic> + </figure> + <p>Read from left to right, the first cluster represents a pure tragedy cluster + which includes 29 dramas; 10 of these had already been characterized as + tragedies. The third cluster from the left side depicts a pure comedy cluster; + here 22 dramas are included, of which 10 had already been classified as + tragedies. The two additional clusters must be described either as undefined or + mixed clusters, as they either contain only 1 comedy (second cluster from the + left, comprising 39 dramas) and therefore cannot be described as pure, or 4 comedies and 5 tragedies (the cluster to the right, comprising 22 dramas). + Together, these two clusters contain more than half of the plays, namely 61 + works. We conclude that with regard to the main research question, this + approach does not appear to be especially effective, as only 20 of the 30 + previously marked dramas (or 67%) were assigned in a clear fashion, while the + remaining 10 comedies and tragedies mutually appeared in the clusters. + However, the still relatively high dimensionality of the <hi rend="italic" + >document embeddings</hi> makes a failure analysis challenging.</p> + <p>The goal of the second process is to create a low dimensional representation + that is easier to interpret, in order to gain more insight into the + distribution of the two genres. First, only terms which appear in at least 80% + of all of the documents (i. e. in at least 90 plays) are retained; in other + words, the sparsity is limited to 20%. This reduces the number of terms to a + more compact total of 496. Again, a frequency-based word-document matrix is + established and normalized, whereby the frequency of each of the remaining + terms in each drama is divided by the sum of frequencies of <hi rend="italic" + >all</hi> the words in the text. Finally, a distance matrix is established, + based upon the Euclidian distance, and again, clustering is conducted using the + Ward.D2 distance algorithm. </p> + <figure> + <graphic xml:id="klassifikation_2022_002" + url=".../medien/klassifikation_2022_002.png"> + <desc> + <ref type="graphic" target="#abb2">Fig. 2</ref>: Ward.D2 clustering of + 112 Calderónian Comedias. Euclidian distance on the basis of a sparsity + of 20%. [Lehmann 2022] <ref type="graphic" + target="#klassifikation_2022_002"/> + </desc> + </graphic> + </figure> + <p>The dendrogram illustrates three clusters: In the first cluster to the left, + all 15 comedies and 16 further dramas appear. The cluster on the right contains + 14 tragedies and, likewise, 33 dramas of unknown classification. The cluster in + the middle is mixed; it contains 1 tragedy (T4: <bibl> + <title type="desc">El mayor monstruo del mundo</title> + </bibl>) and 33 additional dramas of unknown classification. Through this + process, which only deals with 496 words, 29 of 30 classified dramas, or 97%, + were correctly assigned.<note type="footnote"> Basically, we attempted to alter + only one parameter between each of the analyses, thus using the Euclidian + distance. As an alternative, during the second procedure, we also used the + Manhattan distance, whereby the distance is defined by the sum of absolute + values. The results were clearly less satisfactory than the above + representations resulting from the use of the Euclidian distance: Only two + thirds (67%) of all previously identified tragedies and comedies were + correctly clustered.</note> + </p> + <p>Both of these automatic procedures, in which the fundamental matrices are + reduced on the basis of word frequencies, establish a transitional zone between + tragedy and comedy. This observation presents us with the question of whether + it would be more appropriate, in light of distributional semantics, to consider + classifications like ›tragedy‹ and ›comedy‹ as poles between which gradual + differences appear, showing the resulting overlap in regard to the applied word + selection. In the matter of Calderónian dramas, this seems quite sensible, as + themes such as ›honor‹ and ›power‹ can just as well be included in comedic + plots as in those of the famous honor tragedies. </p> + <p>Comedies may also present serious subjects in a lighthearted, entertaining + manner. For example, power struggles between royal families can be indirectly + alluded to within the framework of a mythological play; the allegory would have + been quite understandable for the court audience at the time.<note + type="footnote"> This possibility was already mentioned by <ref type="bibliography" target="#greer_power_1988">Greer 1988</ref> in an + example from <bibl> + <title type="desc">Fieras afemina amor</title> + </bibl>.</note> + </p> + <p>One possible fundamental critique on simple <hi rend="italic">document + embedding </hi>methods, like those we have observed thus far, is the total + absence of linguistic structure. For this reason, we made the decision to + subject all of the dramas to <term type="dh">part-of-speech tagging</term> + <hi rend="italic">,</hi> including only verbs, nouns and adjectives from each + play in the corpus for clustering.<note type="footnote"> This kind of method + was used by <ref type="bibliography" target="#willand_2017">Willand / Reiter 2017</ref>, pp. 191f.</note> For testing the third + procedure, therefore, a second corpus is established, in which each of the + drama texts include only verbs, nouns and adjectives in their basic forms. All + proper names are once more filtered out of the matrix created for this purpose + – they had been falsely recognized as adjectives – and subsequently a + calculation is made, based on the non-normalized frequencies of the cosine + similarities. This similarity matrix is converted to a distance matrix and, + once again, clustered with the Ward.D2 algorithm. The results are depicted in a + dendrogram.</p> + <figure> + <graphic xml:id="klassifikation_2022_003" + url=".../medien/klassifikation_2022_003.png"> + <desc> + <ref type="graphic" target="#abb3">Fig. 3</ref>: Ward.D2 clustering of + 112 Calderónian Comedias. Cosine similarity based on verbs, nouns and + adjectives. [Lehmann 2022] <ref type="graphic" + target="#klassifikation_2022_003"/> + </desc> + </graphic> + </figure> + <p>The first cluster to the left, which might be identified as a comedy cluster, + contains 14 comedies, 5 tragedies (T1: <bibl> + <title type="desc">A secreto agravio, secreta venganza</title> + </bibl>; T2: <bibl> + <title type="desc">El alcalde de Zalamea</title> + </bibl>; T5: <bibl> + <title type="desc">El médico de su honra</title> + </bibl>;<note type="footnote"> This outcome is especially interesting, because, + according to <ref type="bibliography" target="#couderc_theatre_2012">Couderc 2012</ref>, p. 104<bibl>, + <title type="desc">A secreto agravio, secreta venganza</title> + </bibl> and <bibl> + <title type="desc">El médico de su honra</title> + </bibl> can be described as tragicomedies and <bibl> + <title type="desc">A secreto agravio, secreta venganza</title> + </bibl> is the only play by Calderón which uses the term + <quote>tragicomedia</quote> (tragicomedy) in the spoken text.</note> T6: <bibl> + <title type="desc">El pintor de su deshonra</title> + </bibl>; T13: <bibl> + <title type="desc">Las tres justicias en una</title> + </bibl>) and 18 additional plays of unknown classification. The cluster to the + right is mostly a tragedy cluster, because it contains 10 tragedies and 49 + additional plays, but also 1 comedy (C3: <bibl> + <title type="desc">El encanto sin encanto</title> + </bibl>). In the middle between these two categories is an undefined cluster, + containing 15 plays marked with <quote>Test</quote>. With regard to the plays + identified thus far as tragedies and comedies, 80% of these dramas were + correctly clustered; however, this result applies only if clusters are + identified by the majority of previously identified dramas.<note + type="footnote"> As an alternative, a normalized matrix was established and + a Ward.D2 clustering based on the Euclidian distance was carried out. The + results are clearer, since 4 tragedies as well as 14 comedies were + assigned to a non-mixed cluster. However, the remaining 11 tragedies and 1 comedy formed a mixed cluster, so that all in all only a purity of 60% + in the clustering was reached. See the R code in <ref type="bibliography" target="#lehmann_classifikation_2022">Lehmann 2022</ref>.</note> + </p> + <p>Taking into consideration the previously tested methods, it seems advisable to + focus on every term that carries meaning and thus leads to a differentiation + between the categories. The fourth method we tried was based on the tf-idf + statistics, thus underlying a measure of association commonly used in <term + type="dh">text mining</term>, whereby terms can be evaluated for their + significance within a document or body of work. With the tf-idf statistics, the + weight of each term per document is calculated; the <hi rend="italic">term + frequency</hi> (<hi rend="italic">tf</hi>) is multiplied by the <hi + rend="italic">inverse document frequency</hi> (<hi rend="italic">idf</hi>). + The latter depends not on individual documents, but rather on the total number + of all documents in the corpus. In this way, the tf-idf statistics considers + the relative significance of words which appear frequently in the corpus to + determine how relevant the term is for a document within the corpus under + study. Once more, the proper names are removed, the cosine similarity for the + vectors is calculated, the similarity matrix is converted into a distance + matrix and clustering is carried out with a Ward.D2 algorithm. The results are + depicted in a dendrogram.</p> + <figure> + <graphic xml:id="klassifikation_2022_004" + url=".../medien/klassifikation_2022_004.png"> + <desc> + <ref type="graphic" target="#abb4">Fig. 4</ref>: Ward.D2 clustering of + 112 Calderónian Comedias. Cosine similarity on the basis tf-idf values. + [Lehmann 2022] <ref type="graphic" target="#klassifikation_2022_004"/> + </desc> + </graphic> + </figure> + <p>This image shows three clusters: The first one to the left can best be + described as a comedy cluster. In addition to all of the 15 comedies, however, + it also contains 5 tragedies, exactly the same five ones as in the + part-of-speech based analysis conducted previously (T1, T2, T5, T6, T13), as + well as 20 other dramas. The cluster on the right, with 8 tragedies and 51 + further plays, can be considered a tragedy cluster. The smallest one in the + middle is hard to define, since it is only weakly determined and thus cannot be + understood as pure; it contains only 2 dramas clearly identified as tragedies + and eleven others of unknown classification. In comparison with the dramas + already identified as tragedies or comedies, this result shows that 8 of 15 + tragedies and, respectively, all comedies have been clustered correctly; this + correlates to a recognition rate of 76%.<note type="footnote"> Here, + alternatively, a Ward.D2 clustering was also carried out based on the + Euclidian distance. The result shows five clusters, three of which contain + four dramas labeled with <quote>Test</quote>. The remaining two clusters + consisted of one mixed cluster containing 15 comedies, 12 tragedies, and + 40 further plays; and another cluster containing 3 tragedies as well as + 38 further plays. These results confirm the unreliability of this approach + with respect to clustering.</note> Compared against the models considered + above, this recognition rate seems to be satisfactory. </p> + <p>The four methods explored here differ by the choice of data as well as by the + choice of distance or similarity metrics. Three of the four generated robust to + very good results. The process of employing the strongest matrix reduction + produced the best findings. However, only one approach yielded a clustering + result that would arguably approximate the classification of researchers + applying qualitative analyses.</p> + </div> + <div type="subchapter"> + <head>3.3 Experiment 2</head> + + <p>In a second experiment, we assess to what extent the document clusterings we + found in the first experiment were based on word choice or word use being + consistent with the two genres. To do so, we analyze the word lists upon which + the clusters found by the four methods were based. In addition, we calculate + the log-likelihood distribution over the vocabulary for the sets of (predicted) + comedies and tragedies of each method. This approach determines the 200 words + with the highest log-likelihood values for each genre, and these lists can be + compared across methods (contrastive vocabulary analysis with <hi rend="italic" + >word embeddings</hi>).</p> + <p>Recall that the first procedure in experiment 1 (Ward.D2 clustering based on + the Euclidian distance between normalized word frequencies) created a + clustering in which only the first and the fourth clusters could be clearly + assessed as comedy or, relatively, tragedy clusters. For both of these + clusters, the probability margin for each word is evaluated based on the + previously established matrix, and the 15 terms with the highest probability + margin for each were investigated. These 15 selected terms for both comedy and + tragedy clusters with the highest probability margins give an impression of the + cluster formation. For the comedy cluster, the terms <quote>don</quote>, + <quote>casa</quote>, <quote>calle</quote>, <quote>papel</quote>, + <quote>caballero</quote>, <quote>puerta</quote>, <quote>dama</quote>, + <quote>padre</quote>, <quote>hermano</quote>, <quote>saber</quote>, + <quote>cuarto</quote>, <quote>amigo</quote>, <quote>hombre</quote>, + <quote>sé</quote>, and <quote>señora</quote> (esquire, house, street, paper, + knight, door, lady, father, brother, knowledge, room, friend, man, I know, and + madam) appeared. Very interesting is the word <quote>papel</quote>, since it + points to the paper or card fanning the intrigue; however, beyond this term, + the word list does not seem to be significantly distinctive of comedies. By + contrast, for the tragedy cluster, the words <quote>rey</quote>, + <quote>muerte</quote>, <quote>dios</quote>, <quote>cielo</quote>, + <quote>hoy</quote>, <quote>vida</quote>, <quote>sol</quote>, + <quote>valor</quote>, <quote>mar</quote>, <quote>tierra</quote>, + <quote>gran</quote>, <quote>rigor</quote>, <quote>mundo</quote>, + <quote>quiero</quote>, and <quote>poder</quote> (king, death, God, heaven, + today, life, sun, value / valor, sea, earth, grand, severity, world, I want, + and power) were especially frequent. At any rate, people of high social + standing, death, God, valor and power stand out as being characteristic terms + relating to these storylines.</p> + <p>The 496 words selected for their sparsity of 20% enable a preview of terms + which carry a strong distinction with regard to the separation of comedies and + tragedies. For the comedy cluster, meaningful terms like <quote>don</quote>, + <quote>casa</quote>, <quote>dama</quote>, <quote>calle</quote>, + <quote>puerta</quote>, <quote>sé</quote>, <quote>señor</quote>, + <quote>caballero</quote>, <quote>bien</quote>, <quote>cuarto</quote>, + <quote>papel</quote>, <quote>señora</quote>, <quote>saber</quote>, + <quote>amigo</quote>, and <quote>celos</quote> (esquire, house, lady, + street, door, I know, lord, knight, good, room, paper, madam, knowledge, + friend, and zeal) are present. For the tragedy cluster, words like + <quote>rey</quote>, <quote>señor</quote>, <quote>dios</quote>, + <quote>hoy</quote>, <quote>muerte</quote>, <quote>cielo</quote>, + <quote>sol</quote>, <quote>quiero</quote>, <quote>rigor</quote>, + <quote>mundo</quote>, <quote>gran</quote>, <quote>valor</quote>, + <quote>alma</quote>, <quote>viento</quote>, and <quote>sangre</quote> (king, + lord, God, today, death, heaven, sun, I want, severity, world, grand, + value / valor, soul, wind, and blood) appear. At first glance, the high degree + of consistency of both lists of words from the first and second procedures may + come as a surprise. Then again, it appears that the high degree of purity in + the clustering of the second procedure quite obviously depends upon the + condensed and precise selection of distinct terms. </p> + <p>With regard to the third procedure – based upon a <hi rend="italic" + >part-of-speech </hi>tagged corpus – the most frequent words found in the + clusters in the underlying matrix illustrate why it does not lead to compelling + results: Not surprisingly, the most frequent words here are the verbs + <quote>ser</quote> (to be) and <quote>haber</quote> (to have), followed by a + list of much less frequent additional verbs, like <quote>ver</quote>, + <quote>decir</quote>, <quote>estar</quote>, <quote>dar</quote>, + <quote>poder</quote>, <quote>saber</quote>, <quote>hacer</quote>, + <quote>tener</quote>, <quote>ir</quote>, <quote>querer</quote>, + <quote>venir</quote> (seeing, saying, being, giving, being able, knowing, + doing, having, going, wanting, and coming). This is then followed by a list of + nouns, like <quote>señor</quote>, <quote>vida</quote>, <quote>cielo</quote> or + <quote>don</quote> (lord, life, heaven or esquire). In light of the fact + that these frequently used words seem to have little ability to distinguish + between comedies and tragedies, the results of the clustering can be described + as rather poor.</p> + <p>In the fourth procedure – based on the tf-idf matrix – an approach analogous to + methods 1 and 2 is applied. The 15 terms that show the highest probability + margin within the comedy cluster are: <quote>don</quote>, <quote>doña</quote>, + <quote>tapada</quote>, <quote>hermana</quote>, <quote>calle</quote>, + <quote>hermano</quote>, <quote>coche</quote>, <quote>amiga</quote>, + <quote>anoche</quote>, <quote>papel</quote>, <quote>cuarto</quote>, + <quote>aposento</quote>, <quote>reja</quote>, and <quote>casa</quote> + (esquire, lady, veil, sister, street, brother, carriage, friend, last night, + paper, room, chamber, grid, and house). In the tragedy cluster, terms such as + <quote>arma</quote>, <quote>dioses</quote>, <quote>cristianos</quote>, + <quote>templo</quote>, <quote>montes</quote>, <quote>cueva</quote>, + <quote>ciencias</quote>, <quote>cruz</quote>, <quote>muro</quote>, + <quote>reino</quote>, <quote>pastor</quote>, <quote>rey</quote>, + <quote>cristiano</quote>, <quote>cajas</quote>, and <quote>guerra</quote> + (arms, gods, Christians, temple, mountains, cave, sciences, cross, wall, + kingdom, pastor, king, Christian, crates, and war) are characteristic. While + the frequent terms selected for the comedy cluster seem, for the most part, to + be less discriminating, save for the typical allusions to veiling and masking + or intrigue through forgery, the terms relating to tragedy reflect, at least, + military and Christian themes as well as the aristocratic descent of the + protagonists.</p> + <p>An open question at this point is how robust these methods are. Thus, in the + next step, we test the word lists created in the steps above and base them on a + larger body of works. We extend our data basis to clusters, expand the body of + plays identified as comedies or tragedies and create two somewhat larger + subgroups. From the dramas hitherto marked as <quote>Test</quote>, we choose 16 + which were unanimously clustered as being ›tragedy‹ by all four procedures, as + well as ten which were unanimously clustered as ›comedy‹. For the comedies, we + corroborated this classification on the basis of secondary literature;<note + type="footnote"> Nearly all of these dramas fall in the category + <quote>Comedias cómicas</quote> described by <ref type="bibliography" target="#kroll_sonido_2022">Kroll 2022</ref>, pp. 64–65. + However, there are two exceptions: In contrast to Kroll’s estimation, who + puts <bibl> + <title type="desc">No hay cosa como callar</title> + </bibl> into the category <quote>Tragedias y dramas de honor</quote>, we + classify this drama as comedy, since all the four employed methods were in + agreement. By comparison, we dismissed <bibl> + <title type="desc">Las manos blancas no ofenden</title> + </bibl> from the list of comedies, since the estimation of <ref type="bibliography" target="#prat_historia_1950">Valbuena Prat + 1950</ref>, who counts this play amongst <quote>obras exclusivamente + cómicas</quote> (p. 541), was not corroborated by the procedures applied + by us.</note> moreover, all of these dramas were included in the collection + of comedies by the editors of the Aguilar edition. In this manner, we generate + two new subgroups, one for tragedies, containing 31 plays, and one for + comedies, containing 25 plays.<note type="footnote"> Cf. for a comparative + method <ref type="bibliography" target="#peirsman_identification_2010">Peirsman et al. 2010</ref>.</note> Both of these subgroups are converted + into matrices using the prevalent preprocessing techniques, whereby all of the + terms found in less than four of the plays are filtered out. For the remaining + words, the 200 most informative for each subgroup are identified for inclusion, + using the log-likelihood function, with which discriminative terms can be + found. The comparison of the results for each subgroup shows that only 70 terms + appear in both lists, while 130 terms for each (almost exactly two-thirds) are + discriminative for either the tragedy or the comedy subgroup.</p> + <p>The analysis of these 130 discriminative terms for each subgroup proves to be + very revealing. In the case of the comedies, we discover references to certain + themes (<quote>ama</quote>, <quote>amiga</quote>, <quote>carta</quote>, + <quote>celoso</quote>, <quote>desdichas</quote>, <quote>desengaño</quote>, + <quote>escondido</quote>, <quote>favor</quote>, <quote>joyas</quote>, + <quote>juego</quote>, <quote>máscara</quote>, <quote>papeles</quote>, + <quote>secreto</quote>, <quote>tapada</quote>, <quote>vestido</quote> – + mistress, girlfriend, letter, jealous, misfortune, disappointment, veiled, + favor, jewelry, game, mask, papers, secret, hidden / stashed, disguise), + typical indications relating to the mythological background of the comedies + (<quote>astrólogo</quote>, <quote>duende</quote>, <quote>forastero</quote>, + <quote>jardines</quote>, <quote>ninfas</quote> – astrologer, elf / gnome, + foreigner, gardens, nymphs) and also the appearance of some rather surprising + terms (like <quote>enemigo</quote>, <quote>pendencia</quote>, + <quote>razón</quote> or <quote>saber</quote> – enemy, brawl, reason or + knowledge).</p> + <p>By contrast, among the tragedies we find references to the (mostly high) + standing of the characters (<quote>convento</quote>, <quote>corona</quote>, + <quote>emperador</quote>, <quote>esclavo</quote>, <quote>infanta</quote>, + <quote>infante</quote>, <quote>majestad</quote>, <quote>reina</quote>, + <quote>reinar</quote>, <quote>reino</quote>, <quote>rey</quote>, + <quote>tirano</quote>, <quote>villano</quote> – cloister, crown, emperor, + slave, infant, infanta, highness, queen, ruling, kingdom, king, tyrant or + villain), the contents of the plot (<quote>cristo</quote>, <quote>cruz</quote>, + <quote>desdichado</quote>, <quote>divina</quote>, esperanza, + <quote>gloria</quote>, <quote>laurel</quote>, <quote>lealtad</quote>, + <quote>libertad</quote>, <quote>morir</quote>, <quote>poder</quote>, + <quote>salud</quote>, <quote>sangre</quote>, <quote>traÃción</quote>, + <quote>triste</quote>, <quote>triunfo</quote>, <quote>venganza</quote>, + <quote>victoria</quote> – Christ, cross, misery, divine, hope, fame, laurel, + devotion, freedom, dying, power, health, blood, treason, sad, triumph or + revenge, victory) and a few surprises as well (<quote>ciencias</quote>, + <quote>enamorado</quote>, <quote>sueño</quote> – sciences, enamored or + dream). Altogether, the word lists determined log-likelihoods in the two + subgroups outline the contents of the comedies and tragedies much more + precisely than the word lists based on each cluster.</p> + </div> + <div type="subchapter"> + <head>3.4 Experiment 3</head> + + <p>In our final experiment, we move beyond the analysis of documents in terms of + words, as in experiment 2, to an analysis of the usage of individual words + across the two genres. For this purpose, we used the embedding method + fastText<note type="footnote"> <ref type="bibliography" target="#bojanowski_word_2017">Bojanowski et al. 2017</ref>.</note> and the R + package of the same name. In each subgroup, the ten nearest neighbor terms of + interest are established, so that each word which was identified as pertaining + to both genres is visible, along with the terms found closest to it within the + text. In contrast to Skip-gram, fastText is more appropriate for smaller bodies + of text, as it does not compute an <hi rend="italic">embedding </hi>for each + word. Instead, <hi rend="italic">embeddings</hi> for parts of words are + calculated (for instance, for <quote>honor</quote>: <quote>hon</quote>, + <quote>ono</quote>, <quote>nor</quote>, etc.) and accumulated to create an + <hi rend="italic">embedding</hi> for the whole word. In this way, more + robust representations emerge for rarely used or unknown words.<note + type="footnote"> <ref type="bibliography" target="#papay_scenarios_2018">Papay et al. 2018</ref>.</note> + </p> + <p>In order to contrast the terms in each subgroup, we will illustrate in the + following the ten nearest neighbor terms per subgroup together with the + similarities for each, whereby the maximum possible similarity is represented + by the number 1.</p> + <p>The keyword <quote>honor</quote>, which is found not only in comedies, but also + in tragedies, when assessed within the comedy subgroup, shows no common + neighboring terms in the tragedy subgroup, nor were they found for the word + <quote>hado</quote> (fate). In other words, both terms are used in comedies + and tragedies, but within completely different contexts according to each. It + becomes apparent that the terms ›honor‹ and ›fate‹ appearing in tragedies are + more clearly outlined within the context and the meaning of the terms more + precisely defined. For example, ›honor‹, within the context of the tragedy, + refers to the loss thereof, or defamation, for which the remedy is obviously + associated with possible death.</p> + <table> + <row> + <cell>Comedia</cell> + <cell>Tragedia</cell> + </row> + <row> + <cell cols="2">honor</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item>pundonor 0.81 (honorability)</item> + <item>ofrecer 0.80 (offer)</item> + <item>lograr 0.79 (achieve)</item> + <item>honrar 0.79 (to honor)</item> + <item>obedecer 0.78 (obey)</item> + <item>menor 0.78 (minor)</item> + <item>reconocer 0.78 (acknowledge)</item> + <item>rencor 0.77 (grudge)</item> + <item>confesar 0.77 (confess)</item> + <item>ofender 0.77 (offend)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>satisfación 0.81 (satisfaction)</item> + <item>sujeción 0.78 (subjection)</item> + <item>oración 0.77 (prayer)</item> + <item>rigor 0.76 (rigor)</item> + <item>maldición 0.76 (curse)</item> + <item>opinión 0.75 (opinión)</item> + <item>satisfecha 0.75 (satisfied)</item> + <item>satisfacción 0.75 (satisfaction)</item> + <item>honra 0.75 (honor)</item> + <item>acción 0.75 (action)</item> + </list> + </cell> + </row> + <row> + <cell cols="2">hado (fate)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item>hallado 0.92 (found)</item> + <item>amado 0.91 (loved)</item> + <item>hablado 0.91 (spoken)</item> + <item>madrugado 0.90 (gotten up at dawn)</item> + <item>echado 0.90 (thrown)</item> + <item>mirado 0.89 (looked)</item> + <item>negado 0.89 (denied)</item> + <item>pecado 0.89 (sinned)</item> + <item>tocado 0.87 (touched)</item> + <item>enfadado 0.87 (angry)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>estimado 0.92 (estimated)</item> + <item>librado 0.91 (liberated)</item> + <item>engañado 0.90 (enchanted)</item> + <item>sobrado 0.88 (surplus)</item> + <item>nombrado 0.88 (named)</item> + <item>tratado 0.88 (treated)</item> + <item>rendido 0.87 (surrendered)</item> + <item>desengañado 0.87 (disenchanted)</item> + <item>mostrado 0.87 (shown)</item> + <item>estrado 0.87 (stage)</item> + </list> + </cell> + </row> + <trailer xml:id="tab01"> + <ref type="intern" target="#tab1">Tab. 1</ref>: 10 nearest neighbor terms + for »honor« and »hado«. [Lehmann / Padó 2022] </trailer> + </table> + + <p>The many similar word endings in this table may be baffling at first glance, + but hardly surprising: All of Calderón’s plays are written in verses. Through + this metric alone, the selection of possible neighboring words is drastically + limited.<note type="footnote"> An example from the tragedy <bibl> + <title type="desc">La gran Cenobia</title> + </bibl> + <hi rend="italic">,</hi> where <quote>honor</quote> rhymes with + <quote>rigor</quote>: <quote>[Libio:] Por verme con alto honor, / La + muerte á Abdenato di, / Mi misma sangre vendÃ, / A mi patria fui traidor. + / Llegó el rigor / A castigarme, y á ser / Mi verdugo osado y fuerte; / + Pues advierte, / ¿Qué tengo ya que perder, / Perdido el miedo á la + muerte?</quote> There are also examples of two words that rhyme within a + verse, such as in the comedy <bibl> + <title type="desc">Cuál es mayor perfección, hermosura o + discreción</title> + </bibl>, where <quote>honor</quote> rhymes with <quote>pundonor</quote>: + <quote>[Beatriz:] ¿Félix, restado su honor / y yo sabidora de ello / y no + tratar de enmendarlo? / Eso no; que por mi mesmo / pundonor debo + acudirle.</quote> + </note> To make things worse, the similar inflections and conjugations of the + Spanish language also left Calderón with a very narrow selection of possible + neighboring words when composing his dramatic works.</p> + <p>Other terms which were used in both subgroups also produce a similar pattern. + The words <quote>fineza</quote>, <quote>justicia</quote>, and + <quote>amistad</quote> (nicety, justice, friendship) yielded only one or two + common neighboring words within both subgroups (represented in bold type); + these terms are found in both comedies and tragedies alike, but within very + different contexts. While these three terms within the comedic context tend to + reflect the profane, their appearance in the tragic context reflects the formal + authority of the court and its jurisdiction as well as seriousness and the + realm of divine providence and justice.</p> + <table> + <row> + <cell>Comedia</cell> + <cell>Tragedia</cell> + </row> + <row> + <cell cols="2">fineza (nicety)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item><hi rend="bold">firmeza</hi> 0.84 (firmness)</item> + <item>fianza 0.81 (pledge)</item> + <item>importuna 0.81 (important)</item> + <item>fina 0.80 (fine)</item> + <item>impida 0.80 (impede)</item> + <item>implica 0.79 (implies)</item> + <item>naturaleza 0.79 (nature)</item> + <item>nobleza 0.78 (nobility)</item> + <item>templanza 0.78 (temperance)</item> + <item>belleza 0.77 (beauty)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>fiereza 0.84 (fierceness)</item> + <item>gloria 0.78 (glory)</item> + <item>peregrina 0.77 (pilgrim)</item> + <item>indignación 0.77 (indignation)</item> + <item>insignia 0.77 (insignia)</item> + <item>ofrecà 0.76 (offered)</item> + <item>grandeza 0.76 (greatness)</item> + <item><hi rend="bold">firmeza</hi> 0.75 (firmness)</item> + <item>imperial 0.75 (imperial)</item> + <item>ignorancia 0.75 (ignorance)</item> + </list> + </cell> + </row> + <row> + <cell cols="2">justicia (justice)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item><hi rend="bold">justa</hi> 0.83 (just)</item> + <item>hidalga 0.78 (noble)</item> + <item>acompañada 0.77 (accompanied)</item> + <item><hi rend="bold">malicia</hi> 0.77 (malice)</item> + <item>salida 0.76 (departure)</item> + <item>diligencia 0.75 (diligence)</item> + <item>hidalguÃa 0.75 (nobility)</item> + <item>historia 0.75 (history)</item> + <item>dispensación 0.75 (dispensation)</item> + <item>traición 0.75 (treason)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item><hi rend="bold">justa</hi> 0.83 (just)</item> + <item>justiciero 0.82 (avenging)</item> + <item>licencia 0.80 (licence)</item> + <item>precia 0.79 (precious)</item> + <item>milicia 0.79 (militia)</item> + <item><hi rend="bold">malicia</hi> 0.78 (malice)</item> + <item>usted 0.77 (you)</item> + <item>gusta 0.77 (like)</item> + <item>estudiar 0.77 (study)</item> + <item>condición 0.76 (condition)</item> + </list> + </cell> + </row> + <row> + <cell cols="2">amistad (friendship)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item>dad 0.85 (giving)</item> + <item>vanidad 0.83 (vanity)</item> + <item><hi rend="bold">mitad</hi> 0.83 (half)</item> + <item>debéis 0.83 (owe)</item> + <item>decid 0.81 (decide)</item> + <item><hi rend="bold">calidad</hi> 0.81 (quality)</item> + <item>mirad 0.80 (look)</item> + <item>libertad 0.80 (freedom)</item> + <item>perdonad 0.79 (forgive)</item> + <item>podáis 0.79 (can)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>acudid 0.82 (attend)</item> + <item><hi rend="bold">calidad</hi> 0.82 (quality)</item> + <item>ofrezca 0.81 (offer)</item> + <item>seguridad 0.81 (safety)</item> + <item>fealdad 0.77 (ugliness)</item> + <item>temeridad 0.77 (recklessness)</item> + <item><hi rend="bold">mitad</hi> 0.77 (half)</item> + <item>sacad 0.76 (pull)</item> + <item>firmeza 0.76 (firmness)</item> + <item>salid 0.76 (get out)</item> + </list> + </cell> + </row> + <trailer xml:id="tab02"> + <ref type="intern" target="#tab2">Tab. 2</ref>: 10 nearest neighbor terms + for »fineza«, »justicia« and »amistad«. [Lehmann / Padó 2022] </trailer> + </table> + + <p>However, other terms clearly show overlaps with regards to the nearest neighbor + terms; for instance, <quote>celos</quote>, <quote>gusto</quote> or + <quote>muera</quote> (zeal / jealousy, taste, he / she / it dies) each share + three or four nearest neighbor terms within the ten words in the selection.</p> + <table> + <row> + <cell>Comedia</cell> + <cell>Tragedia</cell> + </row> + <row> + <cell cols="2">celos (zeal, jealousy)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item><hi rend="bold">celosos</hi> 0.91 (jealous)</item> + <item><hi rend="bold">recelos</hi> 0.90 (suspicions)</item> + <item>duelos 0.89 (duel)</item> + <item><hi rend="bold">cielos</hi> 0.85 (heavens)</item> + <item>puestos 0.84 (posts)</item> + <item>palos 0.83 (sticks)</item> + <item>dellos 0.83 (from them)</item> + <item>desconsuelos 0.82 (hopelessness)</item> + <item>opuestos 0.82 (opposites)</item> + <item>laberintos 0.82 (mazes)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>consuelos 0.91 (consolations)</item> + <item><hi rend="bold">recelos</hi> 0.91 (suspicions)</item> + <item><hi rend="bold">celosos</hi> 0.90 (jealous)</item> + <item>antojos 0.89 (cravings)</item> + <item>pueblos 0.89 (villages)</item> + <item>regalos 0.88 (gifts)</item> + <item>demos 0.88 (we give)</item> + <item><hi rend="bold">cielos</hi> 0.87 (heavens)</item> + <item>caballos 0.87 (horses)</item> + <item>verlos 0.87 (see them)</item> + </list> + </cell> + </row> + <row> + <cell cols="2">gusto (taste)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item>admito 0.87 (admitted)</item> + <item>visto 0.86 (seen)</item> + <item>susto 0.86 (scare)</item> + <item><hi rend="bold">justo</hi> 0.84 (just)</item> + <item>gasto 0.84 (expense)</item> + <item><hi rend="bold">disgusto</hi> 0.84 (disgust)</item> + <item>pedido 0.83 (order)</item> + <item>considero 0.82 (consider)</item> + <item>adentro 0.82 (in)</item> + <item>pecado 0.82 (sin)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item><hi rend="bold">justo</hi> 0.87 (just)</item> + <item>desprecio 0.85 (contempt)</item> + <item>precio 0.84 (prize)</item> + <item>justiciero 0.84 (righteousness)</item> + <item><hi rend="bold">disgusto</hi> 0.83 (displeasure)</item> + <item>precepto 0.82 (precept)</item> + <item>preciso 0.82 (precise)</item> + <item>profano 0.82 (profane)</item> + <item>favorecido 0.82 (favored)</item> + <item>convencido 0.82 (convinced)</item> + </list> + </cell> + </row> + <row> + <cell cols="2">muera (he / she / it dies)</cell> + </row> + <row> + <cell> + <list type="unordered"> + <item><hi rend="bold">muriera</hi> 0.89 (dying)</item> + <item><hi rend="bold">muerta</hi> 0.89 (dead)</item> + <item>defuera 0.85 (outside)</item> + <item><hi rend="bold">muralla</hi> 0.85 (wall)</item> + <item>muestra 0.84 (sample)</item> + <item><hi rend="bold">manera</hi> 0.83 (way)</item> + <item>mira 0.82 (look)</item> + <item>enferma 0.81 (sick)</item> + <item>dondequiera 0.81 (anywhere)</item> + <item>cólera 0.81 (anger)</item> + </list> + </cell> + <cell> + <list type="unordered"> + <item>viviera 0.94 (living)</item> + <item><hi rend="bold">muriera</hi> 0.94 (dying)</item> + <item><hi rend="bold">muerta</hi> 0.92 (dead)</item> + <item><hi rend="bold">muralla</hi> 0.91 (wall)</item> + <item>diera 0.90 (giving)</item> + <item>madera 0.90 (wood)</item> + <item><hi rend="bold">manera</hi> 0.90 (way)</item> + <item>viera 0.90 (watching)</item> + <item>hermosura 0.89 (beauty)</item> + <item>matara 0.89 (kill)</item> + </list> + </cell> + </row> + <trailer xml:id="tab03"> + <ref type="intern" target="#tab3">Tab. 3</ref>: 10 nearest neighbor terms + for »celos«, »gusto« and »muera«. [Lehmann / Padó 2022] </trailer> + </table> + + <p>This analysis illustrates that the differences between tragedies and comedies + do not merely consist of different vocabularies, but rather, that even shared + vocabularies are substantially <hi rend="italic">used in a different way</hi>. + The more central for the genre, the more distinguishable the usage – at least, + this is the tendency our results have shown so far.</p> + </div> + </div> + <div type="chapter"> + <head>4. Discussion of the Results and Outlook</head> + + <p>The comparison of the methods shows that with two of them – clustering of dramas + on the basis of verbs, nouns, and adjectives and clustering on the basis of tf-idf + values – results can be reached that approximate expert judgments. Both methods + are considered standard procedures in text mining. In order + for the clustering to reach a purity of 70% and beyond, however, comprehensive + filtering was needed, extending beyond the usual punctuation and stop words to + further function words, proper nouns and their adjectivized forms. A part of the + latter can only be manually assembled for each corpus under study, which requires + considerable effort. A rather good purity of the clustering can be reached fairly + fast by conducting a massive reduction of the output matrix to a sparsity of 20%, + thus considering only terms which appear in at least 80% of all of the documents. </p> + <p>The preliminary observations of this study considering the comparison of the four + explored methods permit us to identify further dramas of each category (sixteen + tragedies and ten comedies) which could be regarded, with a high probability, as + being either tragedies or comedies. They also point to characteristic mixtures of + the vocabularies in use as well as to contradictory results. This particularly + concerns comedic passages in the dramas – even when they appear within a tragedy – + but also any terms that reflect themes that are typical for comedies or tragedies, + extra-literary attributes or plot characteristics. </p> + <p>One particular example would be <bibl> + <title type="desc">Amor, honor y poder</title> + </bibl>, a title unknown to the authors in this study before the analysis began. + Though it is commonly classified as a comedy because of its happy ending, the + intrigue deals with unhappy relations between two pairs of characters and is + therefore dominated by a semantics typical of tragedies. While the methods + employed in this study all classify this drama as a tragedy, another exception is + formed by <bibl> + <title type="desc">No hay cosa como callar</title> + </bibl>. Again, all the four procedures classify this drama unanimously, in this + case as a comedy, and so does the Aguilar edition. The judgments of qualitative + research, however, are more divided: While Alexander A. Parker classified it in + 1962 as a tragedy, he later revised his judgment and described it as a + <quote>comedy of intrigue</quote>, and Simon Kroll puts it into the section + <quote>Tragedias y dramas de honor</quote>.<note type="footnote"> Cf. + <ref type="bibliography" target="#parker_definition_1962">Parker + 1962</ref>, p. 228; + <ref type="bibliography" target="#parker_mind_1988">Parker 1988</ref>, pp. + 181–182; <ref type="bibliography" target="#kroll_sonido_2022">Kroll 2022</ref>, p. 63.</note> Certainly, + the analysis conducted here will inspire further debates, since such variations in + the classification of a drama may be resolved by a differentiated examination: The + vocabulary in <bibl> + <title type="desc">No hay cosa como callar</title> + </bibl> may be one typical for comedies, but the plot as well as other qualitative + criteria might support its classification as a tragedy.</p> + <p>Also interesting is the insight that the Calderónian tragedies, obviously because + of the way the words are used within the text, are much more reliably identifiable + than the comedies. This is underlined by the way in which all of the four applied + methods identified the group of so-called <term type="dh">comedias + religiosas</term>: <bibl> + <title type="desc">El José de las mujeres, El purgatorio de san Patricio, Judas + Macabeo, La cisma de Ingalaterra, La exaltación de la cruz, La sibila del + Oriente y gran reina de Sabá, Las cadenas del demonio, Los dos amantes del + cielo, and Origen, pérdida y restauración de la Virgen del Sagrario</title> + </bibl>. All these dramas are consistently marked by the use of a tragic + vocabulary. On the other hand and with regard to the comedies, it is quite obvious + that they are much harder to define than tragedies. This is true, for example, + with respect to a group of comedies which are frequently regarded as <hi + rend="italic">comedias mitológicas</hi>. The mythological plays <bibl> + <title type="desc">El castillo de Lindabridis, El mayor encanto amor, La puente + de Mantible</title> + </bibl>, and <bibl> + <title type="desc">Los tres mayores prodigios</title> + </bibl> exhibit very strong tragedy signals in our analysis, whereas most other + dramas classified as <hi rend="italic">comedias mitológicas</hi> exhibit mixed + signals.<note type="footnote"> For the assessments of these works as <hi + rend="italic">comedias mitológicas</hi>, see <ref type="bibliography" target="#kroll_sonido_2022">Kroll 2022</ref>; + <ref type="bibliography" target="#castro_alquimia_2001">Castro de Moux + 2001</ref>; <ref type="bibliography" target="#greer_power_1988">Greer 1988</ref>; + <ref type="bibliography" target="#cancelliere_teatro_2000">Cancelliere 2000</ref>; + <ref type="bibliography" target="#arellano_teatro_2000">Arellano 2000</ref>; + <ref type="bibliography" target="#pena_teatro_2011">Peña-Pimentel 2011</ref>. </note> + </p> + <p>Certainly, with regard to dramas stipulated on the basis of our analysis which, up + to now, have received very little attention, the binary separation of <hi + rend="italic">dramas</hi> and <hi rend="italic">comedias</hi> previously + conducted by the publishers of the Aguilar edition must be viewed with a critical + eye. A good example for this is provided by <bibl> + <title type="desc">Amar después de la muerte</title> + </bibl>, which stood out through the use of tragic vocabulary as identified by the + most precise clustering approach (method 2). This classification was verified by + the historical-critical edition presented by Jorge Checa.<note type="footnote"> + <ref type="bibliography" target="#checa_calderon_2010">Checa (Ed.) 2010</ref>.</note> Since Checa, in the preface of his analysis, discusses a + series of criteria regarding the designation of tragedies according to Parker and + Sullivan, this insight presents an invitation to qualitatively working researchers + to work systematically and to consistently implement these established criteria + for classification on an entire sequence of plays. The status of the group of + dramas called <hi rend="italic">comedias mitológicas</hi> – as with those + recognized by Parker and Sullivan as being <quote>on the brink of tragedy</quote><note type="footnote"> Cf. <ref type="bibliography" target="#parker_mind_1988">Parker 1988</ref>, pp. 58, 181, 182; + <ref type="bibliography" target="#sullivan_drama_2018">Sullivan 2018</ref>, pp. 70, + 316, 321.</note> – should therefore be discussed anew with regard to their + designated categories and the vocabularies used. The same is true concerning the + scarcely examined group of dramas which can be classified as + <quote>tragicomedias</quote>. The intermediate area found between comedies and + tragedies throughout these methods points to this in an emphatic way. In the sense + of the digital humanities, this conclusion represents an + invitation to qualitative researchers to take a deeper look at the texts they have + already examined and to create lists of characteristic words for each category to + be distinguished. </p> + <p>The approach performed through distributional semantics contributes only one + factor among others – albeit an arguably important one – to the classification of + plays, in particular when, as is the case here, lexical and semantic analyses go + hand in hand. This is especially relevant in view of the large number of works + which have yet been only scarcely researched or not at all. The systematic + comparison of various methods, as carried out here, presents the opportunity to + better evaluate the results of heterogeneous corpora (plays by various playwrights + or from different centuries). The implementation of these tested procedures on, + for example, all available dramas in the <hi rend="italic">siglo de oro, + </hi>would provide a broader basis for the achieved results upon which + characteristic lexica for comedies and tragedies could be identified. Precisely, + however, the example of Calderón with his 112 <hi rend="italic">comedias + nuevas</hi> illustrates that the methods explored here provide qualitative + researchers with information, which may stimulate further analyses. Potentially, + the current undertakings aiming at the presentation of all of the Calderónian + dramas as historical-critical editions<note type="footnote"> A critical new + edition of the complete body of <hi rend="italic">comedias </hi>is in progress + under the direction of Ignacio Arellano within the series <bibl> + <title type="desc">Biblioteca Aurea hispánica</title> + </bibl> from the Vervuert publishing house. Currently, however, only 21 titles + have been published. This editing project can be seen as the most reliable + textual basis; the editing principles are clarified in <ref type="bibliography" target="#arellano_editar_2007">Arellano 2007</ref>. + Additionally, the <bibl> + <title type="desc">Partes de las comedias</title> + </bibl>, which appeared during Calderón’s lifetime, are available in a modern + edition in six volumes through the Madrid-based publisher Fundación José + Antonio de Castro, newly edited under the direction of Luis Iglesias + Feijo.</note> can take up the findings presented in this study.</p> + </div> + <div type="chapter"> + <head>5. Appendix</head> + + <p>Abbreviations: T = Tragedy, C = Comedy, M = Mixed Cluster, U = Undefined + Cluster</p> + <table> + <row> + <cell>Brief description and name of drama</cell> + <cell>Euklid Ward.D2</cell> + <cell>Euklid Ward Sparse20</cell> + <cell>POS Cosine</cell> + <cell>tf-idf Cosine</cell> + </row> + <row> + <cell>T1-A secreto agravio</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>T2-El alcalde de Zalamea</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>T3-El mágico prodigioso</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T4-El mayor monstruo del mundo</cell> + <cell>T</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T5-El médico de su honra</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>T6-El pintor de su deshonra</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>T7-El prÃncipe constante</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T8-La devoción de la Cruz</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T9-La hija del aire. Primera parte</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T10-La hija del aire. Segunda parte</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T11-La vida es sueño</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T12-La gran Cenobia</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>T13-Las tres justicias en una</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>T14-Los cabellos de Absalon</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>T15-Saber del bien y del mal</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>C1-Casa con dos puertas mala es de guardar</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C2-También hay duelo en las damas</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C3-El encanto sin encanto</cell> + <cell>M</cell> + <cell>C</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>C4-Fuego de dios en el querer bien</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C5-El astrólogo fingido</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C6-El maestro de danzar</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C7-La dama duende</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C8-Los empeños de un acaso</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C9-Mejor está que estaba</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C10-Peor está que estaba</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C11-Primero soy yo</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C12-Mañanas de abril y mayo </cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C13-Antes que todo es mi dama</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C14-No siempre lo peor es cierto</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>C15-Dicha y desdicha del nombre</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test1-Afectos de odio y amor</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test2-El galan fantasma</cell> + <cell>M</cell> + <cell>C</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test3-Las fortunas de Androméda y Perseo</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test4-Los dos amantes del cielo (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test5-Amor, honor y poder (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test6-La cisma de Ingalaterra (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test7-En esta vida todo es verdad y todo mentira</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test8-La aurora en Copacabana</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test9-Las cadenas del demonio (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test10-Amado y aborrecido</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test11-Amar después de la muerte o el Tuzanà de la Alpujarra</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>T</cell> + </row> + <row> + <cell>Test12-Las armas de la hermosura</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test13-Celos, aun del aire, matan</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test14-Darlo todo y no dar nada</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test15-Eco y Narciso</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test16-Fieras afemina amor</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test17-Luis Pérez el Gallego</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test18-El mayor encanto, amor (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test19-La púrpura de la rosa</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test20-El sitio de Breda</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test21-Nadie fÃe su secreto</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test22-No hay burlas con el amor (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test23-El escondido y la tapada (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test24-No hay cosa como callar (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test25-Las Manos Blancas No Ofenden</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test26-Con quien vengo, vengo (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test27-Céfalo y Pocris (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test28-La puente de Mantible (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test29-El castillo de Lindabridis (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test30-El monstruo de los jardines</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test31-La fiera el rayo y la piedra</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test32-Para vencer a amor, querer vencerle</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test33-Lances de amor y fortuna</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test34-Hombre pobre todo es trazas (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test35-Judas Macabeo (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test36-El alcaide de sà mismo (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test37-El purgatorio de san Patricio (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test38-La banda y la flor</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test39-Un castigo en tres venganzas</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test40-Bien vengas mal</cell> + <cell>C</cell> + <cell>C</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test41-Mañana será otro dÃa (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test42-La sibila del Oriente y gran reina de Sabá (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test43-Argenis y Poliarco (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test44-El jardin de Falerina</cell> + <cell>M</cell> + <cell>M</cell> + <cell>C</cell> + <cell>T</cell> + </row> + <row> + <cell>Test45-Los tres mayores prodigios (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test46-Origen, pérdida y restauración de la Virgen del Sagrario + (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test47-La desdicha de la voz (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test48-El secreto a voces</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test49-El Faetonte</cell> + <cell>M</cell> + <cell>M</cell> + <cell>C</cell> + <cell>T</cell> + </row> + <row> + <cell>Test50-La exaltación de la cruz (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test51-El agua mansa (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test52-La niña de Gómez Arias</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>T</cell> + </row> + <row> + <cell>Test53-Los hijos de la fortuna, Teágenes y Cariclea</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test54-Agradecer y no amar</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test55-Amigo amante y leal</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test56-El golfo de las sirenas</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test57-Gustos y disgustos son no más que imaginación</cell> + <cell>M</cell> + <cell>T</cell> + <cell>C</cell> + <cell>U</cell> + </row> + <row> + <cell>Test58-El acaso y el error</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test59-El José de las mujeres (T)</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test60-Los tres afectos de amor piedad desmayo y valor</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test61-Cada uno para sÃ</cell> + <cell>C</cell> + <cell>C</cell> + <cell>U</cell> + <cell>C</cell> + </row> + <row> + <cell>Test62-El conde Lucanor</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test63-Dar tiempo al tiempo (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test64-Mujer, llora y vencerás</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test65-Cuál es mayor perfección, hermosura o discreción (C)</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test66-El laurel de Apolo</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test67-Ni amor se libra de amor</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test68-El mayor monstruo los celos</cell> + <cell>T</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test69-El postrer duelo de españa</cell> + <cell>M</cell> + <cell>C</cell> + <cell>C</cell> + <cell>C</cell> + </row> + <row> + <cell>Test70-El gran prÃncipe de Fez</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test71-Fineza contra fineza</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test72-El segundo Scipión</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test73-La señora y la criada</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test74-Basta callar</cell> + <cell>M</cell> + <cell>C</cell> + <cell>T</cell> + <cell>U</cell> + </row> + <row> + <cell>Test75-De una causa dos efectos</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test76-Hado y divisa de Leonido y Marfisa</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test77-La estatua de Prometeo</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test78-Apolo y Climene</cell> + <cell>M</cell> + <cell>M</cell> + <cell>U</cell> + <cell>T</cell> + </row> + <row> + <cell>Test79-Duelos de amor y lealtad</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test80-Auristela y Lisidante</cell> + <cell>M</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + </row> + <row> + <cell>Test81-Cómo se comunican dos estrellas contrarias</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>C</cell> + </row> + <row> + <cell>Test82-La selva confusa</cell> + <cell>M</cell> + <cell>T</cell> + <cell>T</cell> + <cell>U</cell> + </row> + </table> + </div> + </div> + <div type="bibliography"> + <head>Bibliography</head> + <listBibl> + <bibl xml:id="arellano_teatro_2000">Ignacio Arellano: El Teatro de Corte y Calderón. In: Atti della Tavola Rotonda sulla + Singolarità Storica e Estetica di »La púrpura de la rosa« di Calderón de la Barca. + Ed. by MarÃa Luisa Tobar. Messina 2000, pp. 31–53. <ptr type="gbv" cRef="345272080"/></bibl> + <bibl xml:id="arellano_editar_2007">Ignacio Arellano: Editar a Calderón. Hacia una edición crÃtica de las comedias + completas. Frankfurt / Main 2007. (= Comedias completas de Calderón, 5) <ptr type="gbv" cRef="538319577"/></bibl> + <bibl xml:id="arellano_dramaticos_2018">Ignacio Arellano: Calderón y los géneros dramáticos, con otras cuestiones anejas. + Honor, amor, legitimación polÃtica y autoridad de las taxonomÃas. In: Rilce. Revista + de FilologÃa Hispánica 34 (2018), pp. 100–126. DOI: <ref + target="https://doi.org/10.15581/008.34.1.100-26">10.15581/008.34.1.100-26</ref> <ptr type="gbv" cRef="171309456"/></bibl> + <bibl xml:id="benjamin_ursprung_1978">Walter Benjamin: Ursprung des deutschen Trauerspiels. Frankfurt / Main 1978. (= + Suhrkamp-Taschenbuch Wissenschaft, 225) <ptr type="gbv" cRef="011350512"/></bibl> + <bibl xml:id="bojanowski_word_2017">Piotr Bojanowski / Edouard Grave / Armand Joulin / Tomas Mikolov: Enriching Word + Vectors with Subword Information. In: Transactions of the Association for + Computational Linguistics 5 (2017), pp. 135–146. PDF. [<ref + target="https://aclanthology.org/Q17-1010.pdf">online</ref>] </bibl> + <bibl xml:id="bullinaria_representation_2007">John Andrew Bullinaria / Joseph P. Levy: Extracting Semantic Representations from Word Co-occurrence Statistics. A Computational Study. In: Behavior Research Methods + 39 (2007), pp. 510–526. DOI: <ref target="https://doi.org/10.3758/BF03193020" + >10.3758/BF03193020</ref> <ptr type="gbv" cRef="129578975"/></bibl> + <bibl xml:id="calderon_obras_1951">Pedro Calderón de la Barca: Obras completas. Textos Ãntegros según las primeras + ediciones y los manuscritos autógrafos. Ed. by Ãngel Valbuena Briones / Luis Astrana + MarÃn. 3 vols. Madrid 1951–1956. <ptr type="gbv" cRef="125347006"/></bibl> + <bibl xml:id="calderon_comedias_2007">Pedro Calderón de la Barca: Comedias y otras obras. Madrid 2007–2010. <ptr type="gbv" cRef="547883641"/></bibl> + <bibl xml:id="campion_original_2021">Miguel Campión Larumbe / Ãlvaro Cuéllar: Discernir entre original y refundición en el teatro del Siglo de Oro a través de la estilometrÃa. El caso de El mejor amigo, el + muerto. In: TalÃa. Revista de estudios teatrales 3 (2021), pp. 59–69. DOI: <ref + target="https://doi.org/10.5209/tret.74021">10.5209/tret.74021</ref> + </bibl> + <bibl xml:id="cancelliere_teatro_2000">Enrica Cancelliere: Calderón e il Teatro di Corte. In: Atti della Tavola Rotonda + sulla Singolarità Storica e Estetica di »La púrpura de la rosa« di Calderón de la + Barca. Ed. by MarÃa Luisa Tobar. Messina 2000, pp. 55–76. <ptr type="gbv" cRef="345272080"/></bibl> + <bibl xml:id="castro_alquimia_2001">MarÃa Esther Castro de Moux: Alquimia y gnosticismo en Fortunas de Andrómeda y Perseo + de Calderón: In: Actas del V Congreso Internacional. Ed. by Christoph Strosetzki. + (Asociación Internacional Siglo de Oro (AISO), Münster, 20.–24.07.1999) Frankfurt / + Main 2001, pp. 319–330. <ptr type="gbv" cRef="337332312"/></bibl> + <bibl xml:id="checa_calderon_2010">Jorge Checa (Ed.): Pedro Calderón de la Barca: Amar después de la muerte. Edición y + estudio. Kassel 2010. (= Teatro del Siglo de Oro / Ediciones crÃticas, 167) + <ptr type="gbv" cRef="623997010"/></bibl> + <bibl xml:id="coenen_selva_2016">Erik Coenen: »La selva confusa« y »Cómo se comunican dos estrellas contrarias«: + comedias gemelas. In: Revista de filologÃa española 96 (2016), pp. 61–80. DOI: <ref + target="https://doi.org/10.3989/rfe.2016.03">10.3989/rfe.2016.03</ref> + </bibl> + <bibl xml:id="couderc_theatre_2012">Christophe Couderc: Le théâtre tragique au Siècle d’or. Cristóbal de Virués, Lope de + Vega, Calderón de la Barca. Paris 2012. <ptr type="gbv" cRef="1601095228"/></bibl> + <bibl xml:id="cuellar_stylometry_2022">Ãlvaro Cuéllar: Stylometry and Spanish Golden Age Theatre: An Evaluation of + Authorship Attribution in a Control Group of Undisputed Plays. In: Digital + Stylistics in Romance Studies and Beyond. Ed. by Christof Schöch / José Calvo Tello / + Ulrike Henny-Krahmer / Robert Hesselbach / Daniel Schlör. [Forthcoming]</bibl> + <bibl xml:id="ehrlicher_einfuehrung_2012">Hanno Ehrlicher: Einführung in die spanische Literatur und Kultur des Siglo de Oro. + Berlin 2012. <ptr type="gbv" cRef="715983598"/></bibl> + <bibl xml:id="ehrlicher_poetica_2020">Hanno Ehrlicher / Jörg Lehmann / Nils Reiter / Marcus Willand: La poética dramática + desde una perspectiva cuantitativa: la obra de Calderón de la Barca. In: Revista de + Humanidades Digitales 5 (2020), pp. 1–25. DOI: <ref + target="https://doi.org/10.5944/rhd.vol.5.2020.27716" + >10.5944/rhd.vol.5.2020.27716</ref> + </bibl> + <bibl xml:id="escudero_amor_2021">Juan Manuel Escudero Baztán: Amor, honor y poder o el universo dramático de Calderón. + Madrid et al. 2021. (= Comedias completas de Calderón, 24) <ptr type="gbv" cRef="1749191083"/></bibl> + <bibl xml:id="greer_power_1988">Margaret Rich Greer: The Play of Power: Calderón’s »Fieras afemina amor« and »La + estatua de Prometeo«. In: Hispanic Review 56 (1988), issue 3, pp. 319–341. <ptr type="gbv" cRef="129509124"/></bibl> + <bibl xml:id="jockers_macroanalysis_2013">Matthew Jockers: Macroanalysis. Digital Methods & Literary History. Urbana, IL + et al. 2013. <ptr type="gbv" cRef="726039551"/></bibl> + <bibl xml:id="kroll_sonido_2022">Simon Kroll: Sonido y afecto en Calderón. Un estudio de las asonancias. Kassel 2022. + <ptr type="gbv" cRef="1804113506"/></bibl> + <bibl xml:id="lehmann_classifikation_2022">Jörg Lehmann: Classification of Tragedies and Comedies in Calderón de la Barca’s + Comedias Nuevas [Data set]. In: zenodo.org. Version 1 from 20.06.2022. DOI: <ref + target="https://doi.org/10.5281/zenodo.6669603">10.5281/zenodo.6669603</ref> + </bibl> + <bibl xml:id="vega_arte_2010">Félix Lope de Vega: Arte nuevo de hacer comedias en este tiempo. Dirigido a la + Academia de Madrid. Madrid 1621 [1609]. In: books.google.de. Original from la + Biblioteca de Catalunya, digitized on 31.03.2010. [<ref + target="https://books.google.de/books?id=Ihh5oI6I4TsC">online</ref>] </bibl> + <bibl xml:id="lowe_theory_2001">Will Lowe: Towards a Theory of Semantic Space. Proceedings of the Annual Meeting of + the Cognitive Science Society 23 (2001), pp. 576–581. [<ref + target="https://escholarship.org/uc/item/0wk159m0">online</ref>]</bibl> + <bibl xml:id="maestro_limites_2003">Jesús G. Maestro: Los lÃmites de una interpretación trágica y contemporánea del + teatro calderonniano: El prÃncipe constante. In: Teatro calderoniano sobre el + tablado: Calderón y su puesta en escena a través de los siglos. Ed. by Manfred Tietz. + (Coloquio Anglogermano sobre Calderón, Firenze 10.–14.07.2002) Stuttgart 2003, pp. + 285–327. (= Archivum Calderonianum, 10) <ptr type="gbv" cRef="371289408"/></bibl> + <bibl xml:id="manning_introduction_2008">Christopher D. Manning / Prabhakar Raghavan / Hinrich Schütze: Introduction to + Information Retrieval. Cambridge, UK 2008. <ptr type="gbv" cRef="538088214"/></bibl> + <bibl xml:id="mikolov_representations_2013">Tomas Mikolov / Ilya Sutskever / Kai Chen / Greg Corrado / Jeffrey Dean: Distributed + Representations of Words and Phrases and Their Compositionality. In:Advances in Neural Information Processing Systems 26: 27th Annual Conference on Neural + Information Processing Systems. Ed. by Chris Burges et al. (NeurIPS 26, Lake Tahoe, + NV, 05.–10.12.2013), pp. 3111–3119. [<ref + target="https://papers.nips.cc/paper/2013/hash/9aa42b31882ec039965f3c4923ce901b-Abstract.html" + >online</ref>] <ptr type="gbv" cRef="783828063"/></bibl> + <bibl xml:id="papay_scenarios_2018">Sean Papay / Sebastian Padó / Ngoc Thang Vu: Addressing Low-Resource Scenarios with + Character-aware Embeddings. In: Subword and Character Level Models in NLP – + proceedings of the second workshop. Ed. by Association for Computational Linguistics. + (NAACL-HLT 16, New Orleans, 06.06.2018) Stroudsburg, PA, 2018, pp. 32–37. DOI: <ref + target="http://dx.doi.org/10.18653/v1/W18-1204">10.18653/v1/W18-1204</ref> + </bibl> + <bibl xml:id="parker_definition_1962">Alexander Augustine Parker: Towards a Definition of Calderonian Tragedy. In: Bulletin + of Hispanic Studies 39 (1962), pp. 222–237. <ptr type="gbv" cRef="129851906"/></bibl> + <bibl xml:id="parker_mind_1988">Alexander Augustine Parker: The Mind and Art of Calderón. Essays on the Comedias. Ed. + by Deborah Kong. Cambridge et al. 1988. <ptr type="gbv" cRef="025317172"/></bibl> + <bibl xml:id="pena_teatro_2011">Miriam A. Peña-Pimentel: El Gracioso en el Teatro de Calderón. Un Análisis desde las + Humanidades Digitales. London / Ontario 2011. (= Electronic Thesis and Dissertation + Repository, 307) [<ref target="https://ir.lib.uwo.ca/etd/3070">online</ref>]</bibl> + <bibl xml:id="peirsman_identification_2010">Yves Peirsman / Dirk Geeraerts / Dirk Speelman: The Automatic Identification of Lexical Variation between Language Varieties. In: Natural Language Engineering 16 + (2010), issue 4, pp. 469–491. DOI: <ref + target="https://dx.doi.org/10.1017/S1351324910000161" + >10.1017/S1351324910000161</ref> <ptr type="gbv" cRef="188854029"/></bibl> + <bibl xml:id="pena_aplicacion_2012">Miriam A. Peña-Pimentel: Aplicación de mapas de tópicos al análisis semántico de + algunas comedias de Calderón. In: Calderón virtual. Anuario calderoniano 5 (2012), + pp. 115–130. <ptr type="gbv" cRef="727545906"/></bibl> + <bibl xml:id="rosa_role_2018">Javier de la Rosa / Adriana Soto-Corominas / Juan Luis Suárez: The Role of Emotions + in the Characters of Pedro Calderón de la Barca’s autos sacramentales. In: Emotion + and the Seduction of the Senses, Baroque to Neo-Baroque. Ed. by Lisa Beaven / Angela + Ndalianis. (Conference, Melbourne, 27.–29.11.2013) Kalamazoo 2018, pp. 99–125. (= + Studies in medieval and early modern culture, 59) <ptr type="gbv" cRef="1645566358"/></bibl> + <bibl xml:id="schoech_tools_2013">Christof Schöch: Fine-Tuning our Stylometric Tools. Investigating Authorship and + Genre in French Classical Drama. In: Digital Humanities Conference 2013. Hg. von + European Association for Digital Humanities. (DH 2013, Lincoln, NE, 16.-19.07.2013) + Lincoln, NE 2013. <ptr type="gbv" cRef="771005539"/></bibl> + <bibl xml:id="schoech_exploration_2017">Christof Schöch: Topic Modeling Genre: An Exploration of French Classical and + Enlightenment Drama. In: Digital Humanities Quarterly 11 (2017), pp. 1–53. [<ref + target="http://www.digitalhumanities.org/dhq/vol/11/2/000291/000291.html" + >online</ref>] </bibl> + <bibl xml:id="sullivan_landen_2017">Henry Wells Sullivan: Calderón in deutschen und niederen Landen. Eine + dreihundertjährige Rezeptionsgeschichte. Berlin 2017. <ptr type="gbv" cRef="825775477"/></bibl> + <bibl xml:id="sullivan_drama_2018">Henry Wells Sullivan: Tragic Drama in the Golden Age of Spain. Kassel 2018. (= Teatro + del Siglo de Oro / Estudios de literatura, 133) <ptr type="gbv" cRef="1028592345"/></bibl> + <bibl xml:id="tobar_rotonda_2000">MarÃa Luisa Tobar: Atti della Tavola Rotonda sulla Singolarità Storica e Estetica di + »La púrpura de la rosa« di Calderón de la Barca. Messina 2000. <ptr type="gbv" cRef="345272080"/></bibl> + <bibl xml:id="turney_frequency_2010">Peter D. Turney / Patrick Pantel: From Frequency to Meaning: Vector Space Models of + Semantics. In: Journal of Artificial Intelligence Research 37 (2010), pp. 141–188. + DOI: <ref target="https://doi.org/10.1613/jair.2934">10.1613/jair.2934</ref> + <ptr type="gbv" cRef="215076869"/></bibl> + <bibl xml:id="prat_historia_1950">Ãngel Valbuena Prat: Historia de la literatura española. 4 vols. 3rd edition. + Barcelona 1950. Vol. 2: Los Siglos de oro, pp. 479–571. <ptr type="gbv" cRef="08470523X"/></bibl> + <bibl xml:id="ward_function_1963">Joe H. Ward: Hierarchical Grouping to Optimize an Objective Function. In: Journal of + the American Statistical Association 58 (1963), pp. 236–244. <ptr type="gbv" cRef="129497681"/></bibl> + <bibl xml:id="willand_2017">Marcus Willand / Nils Reiter: Geschlecht und Gattung. Digitale Analysen von Kleists + ›Familie Schroffenstein‹. In: Kleist-Jahrbuch 2017. Ed. by Andrea Allerkamp / Günter + Blamberger / Ingo Breuer / Barbara Gribnitz / Hannah Lotte Lund / Martin Roussel. + Stuttgart 2017, pp. 177–195. <ptr type="gbv" cRef="897046382"/></bibl> + + </listBibl> + </div> + + + <div type="abbildungsnachweis"> + <head>List of Figures and Tables</head> + + <desc type="graphic" xml:id="abb1">Ward.D2 clustering of 112 Calderónian Comedias. [Lehmann 2022]<ref type="graphic" target="#klassifikation_2022_001"/></desc> + <desc type="graphic" xml:id="abb2">Ward.D2 clustering of 112 Calderónian Comedias. Euclidian distance on the + basis of a sparsity of 20%. [Lehmann 2022]<ref type="graphic" target="#klassifikation_2022_002"/></desc> + <desc type="graphic" xml:id="abb3">Ward.D2 clustering of 112 Calderónian Comedias. Cosine similarity based on + verbs, nouns and adjectives. [Lehmann 2022]<ref type="graphic" target="#klassifikation_2022_003"/></desc> + <desc type="graphic" xml:id="abb4">Ward.D2 clustering of 112 Calderónian Comedias. Cosine similarity on the + basis tf-idf values. [Lehmann 2022]<ref type="graphic" target="#klassifikation_2022_004"/></desc> + <desc type="table" xml:id="tab1"><ref target="#tab01" type="intern">Tab. 1</ref>: 10 + nearest neighbor terms for »honor« and »hado«. [Lehmann / Padó 2022]<ref + type="graphic" target="#klassifikation_2022_t1"/> + </desc> + <desc type="table" xml:id="tab2"><ref target="#tab02" type="intern">Tab. 2</ref>: 10 + nearest neighbor terms for »fineza«, »justicia« and »amistad«. [Lehmann / Padó + 2022]<ref type="graphic" target="#klassifikation_2022_t2"/> + </desc> + <desc type="table" xml:id="tab3"><ref target="#tab03" type="intern">Tab. 3</ref>: 10 + nearest neighbor terms for »celos«, »gusto« and »muera«. [Lehmann / Padó 2022]<ref + type="graphic" target="#klassifikation_2022_t3"/> + </desc> + </div> + </body> + </text> +</TEI> diff --git a/2022_012_lehmann_et_al/klassifikation_2022_001.png b/2022_012_lehmann_et_al/klassifikation_2022_001.png new file mode 100644 index 0000000000000000000000000000000000000000..2f8ba5f0ed2dc4992916c1287d70f3bb43149c7e Binary files /dev/null and b/2022_012_lehmann_et_al/klassifikation_2022_001.png differ diff --git a/2022_012_lehmann_et_al/klassifikation_2022_002.png b/2022_012_lehmann_et_al/klassifikation_2022_002.png new file mode 100644 index 0000000000000000000000000000000000000000..eec8d83fb9d379b384b0d96dcbfc2a0797f8a06e Binary files /dev/null and b/2022_012_lehmann_et_al/klassifikation_2022_002.png differ diff --git a/2022_012_lehmann_et_al/klassifikation_2022_003.png b/2022_012_lehmann_et_al/klassifikation_2022_003.png new file mode 100644 index 0000000000000000000000000000000000000000..f3b509d2ae2d81ce8b4ef9a1f048f177b5ee953c Binary files /dev/null and b/2022_012_lehmann_et_al/klassifikation_2022_003.png differ diff --git a/2022_012_lehmann_et_al/klassifikation_2022_004.png b/2022_012_lehmann_et_al/klassifikation_2022_004.png new file mode 100644 index 0000000000000000000000000000000000000000..d94aa2d625afdb5934d1692b902266c89763f652 Binary files /dev/null and b/2022_012_lehmann_et_al/klassifikation_2022_004.png differ