diff --git a/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf b/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..cbfab67a3f54191c3c3156e8700bf37137c91f8d
Binary files /dev/null and b/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf differ
diff --git a/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml b/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml
new file mode 100644
index 0000000000000000000000000000000000000000..19788567193a01991df52d378f30cfd8ae831503
--- /dev/null
+++ b/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml
@@ -0,0 +1,1753 @@
+<?xml version="1.0" encoding="utf-8"?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html"
+   xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink"
+   xmlns:xhtml="http://www.w3.org/1999/xhtml">
+   <teiHeader>
+      <fileDesc>
+         <titleStmt>
+            <title>
+               <biblStruct>
+                  <analytic>
+                     <title level="a">Sinn und Segment. Wie die digitale Analysepraxis unsere
+                        Begriffe schärft</title>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                           <forename>Sabine</forename>
+                           <surname>Bartsch</surname>
+                           <email>sabine.bartsch@tu-darmstadt.de</email>
+                           <idno type="gnd">122348839X</idno>
+                           <idno type="orcid">0000-0001-7379-2158</idno>
+                           <affiliation>Technische Universität Darmstadt</affiliation>
+                        </persName>
+                     </respStmt>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                           <forename>Evelyn</forename>
+                           <surname>Gius</surname>
+                           <email>evelyn.gius@tu-darmstadt.de</email>
+                           <idno type="gnd">1084241307</idno>
+                           <idno type="orcid">0000-0001-8888-8419</idno>
+                           <affiliation>Technische Universität Darmstadt</affiliation>
+                        </persName>
+                     </respStmt>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                           <forename>Marcus</forename>
+                           <surname>Müller</surname>
+                           <email>marcus.mueller@tu-darmstadt.de</email>
+                           <idno type="gnd">133933482</idno>
+                           <idno type="orcid">0000-0003-4921-4512</idno>
+                           <affiliation>Technische Universität Darmstadt</affiliation>
+                        </persName>
+                     </respStmt>
+                     
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                           <forename>Andrea</forename>
+                           <surname>Rapp</surname>
+                           <email>andrea.rapp@tu-darmstadt.de</email>
+                           <idno type="gnd">118015915</idno>
+                           <idno type="orcid">0000-0003-4933-4397</idno>
+                           <affiliation>Technische Universität Darmstadt</affiliation>
+                        </persName>
+                     </respStmt>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                           <forename>Thomas</forename>
+                           <surname>Weitin</surname>
+                           <email>thomas.weitin@tu-darmstadt.de</email>
+                           <idno type="gnd">128442433</idno>
+                           <idno type="orcid">0000-0002-9003-5746</idno>
+                           <affiliation>Technische Universität Darmstadt</affiliation>
+                        </persName>
+                     </respStmt>
+                     <idno type="doi">10.17175/2023_003</idno>
+                     <idno type="ppn">1830041150</idno>
+                     <idno type="zfdg">2023.003</idno>
+                     <idno type="url">https://www.zfdg.de/node/406</idno>
+                     <date when="2023-06-01">01.06.2023</date>
+                  </analytic>
+                  <monogr>
+                     <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
+                     <respStmt>
+                        <resp>Publiziert von</resp>
+                        <orgName role="marc_pbl">Herzog August Bibliothek</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Transformation der
+                           Word Vorlage nach TEI</resp>
+                        <persName/>
+                        <name role="marc_trc">
+                           <surname>Baumgarten</surname>
+                           <forename>Marcus</forename>
+                           <idno type="gnd">1192832655</idno>
+                        </name>
+                     </respStmt>
+                     <availability status="free">
+                        <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref>
+                        </p>
+                     </availability>
+                     <imprint>
+                     <biblScope unit="year">2023</biblScope>
+                     <biblScope unit="artikel">03</biblScope>
+                     </imprint>
+                  </monogr>
+               </biblStruct>
+            </title>
+         </titleStmt>
+         <editionStmt>
+            <edition>Elektronische Ausgabe nach TEI P5</edition>
+         </editionStmt>
+         <publicationStmt>
+            <distributor>
+               <name>
+                  <orgName>Herzog August Bibliothek Wolfenbüttel</orgName>
+               </name>
+            </distributor>
+            <idno type="doi">10.17175/zfdg.01</idno>
+            <idno type="ppn">819494402</idno>
+            <authority>
+               <name>Herzog August Bibliothek</name>
+               <address>
+                  <addrLine>Lessingplatz 1</addrLine>
+                  <addrLine>38304 Wolfenbüttel</addrLine>
+               </address>
+            </authority>
+            <authority>
+               <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name>
+               <address>
+                  <addrLine>Burgplatz 4</addrLine>
+                  <addrLine>99423 Weimar </addrLine>
+               </address>
+            </authority>
+            <availability status="free">
+               <p> Sofern nicht anders angegeben </p>
+               <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence>
+            </availability>
+            <availability status="free">
+               <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund
+                     MWW</ref>
+               </p>
+            </availability>
+         </publicationStmt>
+         <sourceDesc>
+            <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p>
+         </sourceDesc>
+      </fileDesc>
+      <encodingDesc>
+         <editorialDecl>
+            <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und
+               XSLT-Skripten</p>
+         </editorialDecl>
+         <editorialDecl>
+            <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von <persName>Caroline Jansky</persName>.</p>
+         </editorialDecl>
+         <editorialDecl>
+            <p>Medienrechte liegen bei den Autor*innen</p>
+         </editorialDecl>
+         <editorialDecl>
+            <p>All links checked<date when="2023-05-16">16.05.2023</date>
+            </p>
+         </editorialDecl>
+      </encodingDesc>
+      <profileDesc>
+         <creation>Einreichung als Artikel der Zeitschrift für digitale
+            Geisteswissenschaften</creation>
+         <langUsage>
+            <language ident="de">Text auf Deutsch</language>
+            <language ident="de">Abstract auf Deutsch</language>
+            <language ident="en">Abstract auf Englisch</language>
+         </langUsage>
+         <textClass>
+            <keywords scheme="gnd">
+               <term>Linguistik<ref target="4074250-7"/></term>
+               <term>Literaturwissenschaft<ref target="4036034-9"/></term>
+               <term>Philologie<ref target="4174271-0"/></term>
+               <term>Segmentierung<ref target="4180694-3"/></term>
+               <term>Textanalyse<ref target="4194196-2"/></term>
+            </keywords>
+         </textClass>
+      </profileDesc>
+      <revisionDesc>
+         <change/>
+      </revisionDesc>
+   </teiHeader>
+   <text>
+      <body>
+         <div>
+            <div type="abstract">
+            <argument xml:lang="de">
+                  <p>Zu einer nachhaltigen Entwicklung der Digital Humanities (DH) gehören
+                     Ergebnisse, die auch für Geisteswissenschaftler:innen jenseits der
+                     DH-Communities relevant sind, weil sie auf existierende Forschungsfragen
+                     Antworten geben. Als ein möglicher Weg, um in dieser Hinsicht ins Gespräch zu
+                     kommen, erscheint uns das Nachdenken darüber, wie digitale Analysen
+                     Grundbegriffe der Sprach- und Literaturwissenschaft problematisch und damit
+                     deutlicher werden lassen. Wir zeigen das exemplarisch an der <term type="dh"
+                        >Segmentierung</term> von Text, die für viele Analysen eine Basis darstellt,
+                     die gleichermaßen, aber auf je unterschiedliche Art und Weise zum Lesen und zum
+                     Rechnen im Sinne einer intellektuellen und computationellen Verarbeitung von
+                     Text genutzt werden kann. Vor dem Hintergrund von konkreten Problemen aus der
+                     sprach- und literaturwissenschaftlichen Segmentierungspraxis diskutieren wir
+                     Ansätze aus den Teildisziplinen der Philologie. </p>
+               </argument>
+            </div>
+            <div type="abstract">
+               <argument xml:lang="en">
+                  <p>Part of a sustainable development of the Digital Humanities (DH) are findings
+                     whose relevance extends beyond DH communities because they are providing answers
+                     to existing research questions. A possible way of entering into this
+                     conversation seems to be a reflection on questions of how digital analyses
+                     critically question basic concepts of linguistics and literary studies and thus
+                     sharpen their definition. In this paper, we are going to address such questions
+                     based on the example of <term type="dh">text segmentation</term> which forms
+                     the basis for many analyses, and which can be used, albeit in different ways, as a foundation for both reading and computational processing of text. We are taking exemplary issues
+                     from linguistic and literary segmentation practice as a vantage point for
+                     discussion in this paper. </p>
+               </argument>
+            </div>
+            <div type="chapter">
+               <head>1. Die epistemische Bedeutung digitaler Zugänge</head>
+            <p>Zu einer nachhaltigen Entwicklung der Digital Humanities gehören Erkenntnisse, die
+               auch für Geisteswissenschaftler:innen jenseits der DH-Communities relevant sind, weil
+               sie auf existierende Forschungsfragen Antworten geben oder auf neue, mit den
+               Forschungsfragen zusammenhängende Problemfelder verweisen.<note type="footnote">
+                  Dieser Beitrag basiert auf einem gleichnamigen Vortrag, den wir im Dezember 2019
+                  auf der Tagung ›Wozu Digitale Geisteswissenschaften? Innovationen, Revisionen,
+                  Binnenkonflikte‹ an der Leuphana Universität Lüneburg gehalten haben.</note>
+               Entsprechend ist auch der an unserem Institut<note type="footnote"> Es handelt sich
+                  um das Institut für Sprach- und Literaturwissenschaft an der Technischen
+                  Universität Darmstadt.</note> praktizierte Zugang zur <term type="dh">Digital
+                  Philology</term> so ausgerichtet, dass bestimmte Forschungsaspekte als gemeinsame
+               Herausforderung und als Diskussionsgegenstand zwischen den Teilfächern der Philologie
+               – Linguistik und Literaturwissenschaft (einschließlich der Mediävistik) – betrachtet
+               werden. Das Digitale wird im Kontext der Digital Philology nicht als vom
+               Nichtdigitalen abgesetzt, sondern als damit zusammenhängend betrachtet. Der digitale
+               Zugang zu philologischen Fragen wird entsprechend auch für eine Auseinandersetzung
+               über die philologischen Teilfächer hinweg genutzt, der sich häufig als
+               erkenntnisproduktiver erweist.<note type="footnote"> Vgl. 
+                  <ref type="bibliography" target="#adler_philologie_2020">Adler et al. 2020</ref>.</note>
+            </p>
+            <p>Das Nachdenken darüber, wie digitale Analysen Grundbegriffe in den Philologien
+               problematisch und damit deutlicher werden lassen, ist ein möglicher Weg, um in dieser
+               Hinsicht ins Gespräch zu kommen. Im Folgenden wollen wir anhand von
+               Forschungsproblemen aus der Linguistik und Literaturwissenschaft zeigen, wie eine
+               digitale Betrachtung von fachspezifischen Problemen übergeordnete Konzepte in den
+               Blick bringen und so zu einem produktiven Austausch zwischen den Disziplinen
+               beitragen kann. Dies geschieht exemplarisch anhand eines Verfahrens, das für viele
+               Textanalysen eine Basis darstellt: die <term type="dh">Segmentierung</term> von Text.
+               Denn jede Textanalyse bezieht sich auf bestimmte Textsegmente, welche wiederum auf je
+               unterschiedliche Art und Weise zum Lesen und auch zum Rechnen genutzt werden. In den
+               verschiedenen Zugängen unterscheidet sich nicht nur die Auffassung von Text als einer aus
+               Textsegmenten zusammengesetzte Einheit. Je nach disziplinärer Verortung und
+               theoretischem Hintergrund eines Forschungszugangs wird auch die Segmentierung als
+               Verfahren nicht immer explizit gemacht, genauso wenig wie die methodologischen
+               Konsequenzen des genutzten Konzepts von Segment bzw. des angewendeten Verfahrens der
+               Segmentierung thematisiert werden.</p>
+            <p>Das Konzept der Segmentierung, das alle in diesem Beitrag diskutierten Ansätze
+               verbindet, steht dabei im weitesten Sinne für eine Aufteilung des zu untersuchenden
+               Textmaterials. Während eine solche Aufteilung in der Linguistik selbstverständlich
+               ist – deren Grundvoraussetzung ist die Segmentierung des sprachlichen Kontinuums in
+               diskrete Einheiten wie Phonem, Morphem, Wort, Phrase oder Satz (siehe <ref
+                  type="intern" target="#hd3">Kapitel 2.1</ref>) –, ist das Konzept in der
+               literaturwissenschaftlichen Terminologie wenig verankert. Mehr noch: Selbst die
+               Entwicklung von computationellen Zugängen im Kontext der literaturwissenschaftlichen
+               Digital Humanities, die häufig auf Textsegmenten basiert, führte bislang nicht zu
+               einer disziplinär begründeten Auseinandersetzung mit der Frage der
+               Textsegmentierung.</p>
+            <p>Trotz dieser unterschiedlichen Ausgangslage in den Teildisziplinen wird an den im
+               Folgenden diskutierten fünf Zugängen eine sie verbindende Herausforderung sichtbar.
+               Die Segmentierung von Texten ist eng verbunden mit der Kategorisierung von Phänomenen
+               und der Interpretation dieser Phänomene in den Texten, also der kontrollierten Praxis
+               der Herstellung von Sinn. Mit ›Sinn‹, dessen reiche Begriffsgeschichte in Linguistik,
+               Hermeneutik und Sprachphilosophie wir an dieser Stelle nicht diskutieren können,<note
+                  type="footnote"> Für die hermeneutische Diskussion vgl. 
+                  <ref type="bibliography" target="#angehrn_sinn_2010">Angehrn 2010</ref>; für die
+                     linguistische Semantik <ref type="bibliography" target="#katz_sense_2004">Katz 2004</ref>; für die Diskursforschung 
+                        <ref type="bibliography" target="#keller_diskurs_2015">Keller 2015</ref>.</note>
+               meinen wir hier die durch Interpretation hergestellte Situationsbedeutung einer
+               textuellen und diskursiven Einheit (im Gegensatz etwa zur Systembedeutung oder dem
+               referenziellen Potenzial sprachlicher Zeichen). Hilfreich mag es sein, darauf
+               hinzuweisen, dass ›Sinn‹ etymologisch auf die indogermanische Wurzel *sent- ›eine
+               Richtung nehmen, gehen‹ zurückführbar ist<note type="footnote"> Vgl. 
+                  <ref type="bibliography" target="#pfeifer_woerterbuch_1993">Pfeifer et al.
+                     1993</ref>. </note> und dem Begriff, wie Donatus Thürnau ausführt,<note type="footnote"><ref type="bibliography" target="#thuernau_sinn_2017">Donatus Thürnau 2017</ref>.</note> metaphorisch die Idee der Richtungsgebung
+               innewohnt. Bei der Herstellung von sprachlichem Sinn geht es darum, das
+               Sprachverstehen in eine von typischerweise mehreren möglichen Richtungen zu treiben.
+               Dazu braucht es Kontextsignale. Wir wollen in diesem Beitrag zeigen, dass dieser
+               Prozess der Kontextualisierung sprachlicher Bedeutung unmittelbar und ursächlich mit der Größe der dafür in Betracht gezogenen Textsegmente sowie den gewählten
+               Segmentierungsverfahren in Zusammenhang steht. Eine weitere Ebene ergibt sich, wenn
+               man auch den ›materiellen‹ Textträger in den Blick nimmt und dessen texttopografische
+               Einheiten analytisch segmentiert. Das Layout wird in diesem Verständnis als weiterer
+               Bedeutungsträger gesehen. </p>
+            </div>
+            <div type="chapter">
+               <head>2. Segmentierung</head>
+            <div type="subchapter">
+               <head>2.1 Segmentierung in der Linguistik</head>
+            <p>Das älteste Segmentierungsverfahren ist nach dem Artikel von Wolf Thümmel im <bibl>
+                  <title type="desc">Metzler Lexikon Sprache</title>
+               </bibl><note type="footnote"> <ref type="bibliography" target="#thuemmel_segmentierung_2016">Thümmel 2016</ref>, S.&#x00A0;602.</note> die Schrift, da im Prozess der
+               Verschriftung das Lautkontinuum der mündlichen Sprache notwendigerweise in diskrete
+               Einheiten zerlegt und so der Kategorisierung und Reflexion zugänglich gemacht wird.
+               Auch Schriften und Texte können verschiedene Stufen von Segmentierung durchlaufen:
+               Das moderne Schrift- und Layoutbild mitteleuropäischer Schrift- und Textzeugen z. B.
+               entwickelt sich erst im Mittelalter nach einer Phase der <term type="dh">Scriptio
+                  Continua</term> ohne Segmentierung der Wort- und Texteinheiten. Segmentierung
+               nennt man in der Linguistik die Zerlegung komplexer Einheiten in ihre Elemente zum
+               Zweck ihrer Klassifikation. Es geht also darum, in der <term type="dh">chaine
+                  parlée</term><note type="footnote"> Vgl. <ref type="bibliography" target="#saussure_cours_1916">Saussure 1916</ref>, S.&#x00A0;16.</note> Einheiten voneinander
+               abzugrenzen und kategorial zu bestimmen, z. B. einen Laut (<term type="dh"
+                  >Phon</term>) einer Lautklasse (<term type="dh">Phonem</term>) zuzuordnen.
+               Segmentierung hat sich im Paradigma der strukturalistischen Sprachbeschreibung zu
+               einem Standardverfahren entwickelt, das traditionellerweise auf die linguistischen
+               Einheiten unterhalb der Satzebene angewendet wird: Phonem (Lautklasse), Morphem, Wort
+               und Phrase. Auch außerhalb der Linguistik bekannte Segmentierungsverfahren sind
+               beispielsweise die im Schulunterricht eingeübten Praktiken zur Erkennung von
+               Satzgliedern wie die Umstell- und Ersetzungsprobe. </p>
+            <table>
+               <row>
+                  <cell>
+                     <hi rend="bold">Einheiten</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Beispiel</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Klasse</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Beispiel</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>
+                     Phon |<lb/>
+                     Graph
+                  </cell>
+                  <cell>
+                     [daχ] |<lb/>
+                     Dach<lb/>
+                  </cell>
+                  <cell>Phonem | Graphem</cell>
+                  <cell>
+                     /d/ – /a/ – /x/ |<lb/>
+                     &lt;D&gt; – &lt;a&gt; – &lt;ch&gt;
+                  </cell>
+               </row>
+               <row>
+                  <cell>Morph</cell>
+                  <cell>
+                     Bett – <hi rend="italic">en</hi><lb/>
+                     Kind – <hi rend="italic">er</hi><lb/>
+                  </cell>
+                  <cell>Morphem</cell>
+                  <cell>Flexionsmorphem, Nominativ Plural</cell>
+               </row>
+               <row>
+                  <cell>Wort / Token</cell>
+                  <cell>
+                     Klang<lb/>
+                     Wunder<lb/>
+                  </cell>
+                  <cell>Wortart</cell>
+                  <cell>Nomen appellativum</cell>
+               </row>
+               <row>
+                  <cell>Phrase</cell>
+                  <cell>
+                     die kleine Biene<lb/>
+                     unser schöner Garten<lb/>
+                  </cell>
+                  <cell>Phrasentyp</cell>
+                  <cell>Nominalphrase</cell>
+               </row>
+               <row>
+                  <cell>Satz</cell>
+                  <cell>
+                     Der Klügere gibt nach.<lb/>
+                     Gertrud, deren Nachbarin Kakteen züchtet, steht am Fenster.
+                  </cell>
+                  <cell>Satztyp</cell>
+                  <cell>Aussagesatz</cell>
+               </row>
+               <row>
+                  <cell>
+                     Text
+                  </cell>
+                  <cell>
+                     Liebe Heidrun,<lb/>
+                     mir geht es gut.<lb/>
+                     Dein Volker<lb/>
+                  </cell>
+                  <cell>Textsorte</cell>
+                  <cell>Brief</cell>
+               </row>
+               <trailer xml:id="tab01">
+                  <ref type="intern" target="#tab1">Tab. 1</ref>: Linguistische Einheiten der Segmentierung.<ref type="graphic" target="#segment_t1"/>
+               </trailer>
+            </table>
+            
+            <p>Seit die Linguistik sich der Einheit <term type="dh">Text</term> zugewandt hat,
+               werden Segmentierungsverfahren auch oberhalb der Satzebene, etwa zur Erkennung von
+               Layout- und Textstrukturen oberhalb des Satzes, also Absätzen, Kapiteln etc.,
+               angewendet. Solche Verfahren der Textsegmentierung spielen insbesondere bei der
+               Arbeit mit digitalen Korpora eine große Rolle. In der digitalen Linguistik bezeichnet
+               man Segmentierungsverfahren auf Wort- und Satzebene als <term type="dh"
+                  >Tokenisierung</term>. Das beinhaltet die Identifikation von Satzgrenzen
+               (Satztokenisierung oder <term type="dh">sentence splitting</term>) und die Bestimmung
+               von Datumsangaben (z. B. <term type="figure">9. Nov. 1989</term>) und sogenannten Alphabetismen
+               (z. B. <term type="figure">U.S.A</term>.) ebenso wie die Tokenisierung der Einheiten
+               auf der Ebene des Wortes (z. B. die Identifikation von einfachen <term type="dh"
+                  >Lexemen</term> wie <term type="figure">Haus</term> sowie von Komposita wie <term
+                  type="figure">Hausboot</term> oder <term type="figure">Vitamin-B-haltig</term> als
+               Tokens). Segmentierungsentscheidungen im Sinne der Tokenisierung werden zumeist in
+               unmittelbarer Abhängigkeit der Identifizierbarkeit von Zeichenketten als Einheiten
+               implementiert. So wird als einfachste Annahme beispielsweise das Leerzeichen als
+               Tokengrenze angenommen und durch das verbundene Auftreten von Interpunktionszeichen
+               als Tokengrenze ergänzt. Ein Komma oder Punkt am Ende einer Sequenz alphabetischer
+               Zeichen, die ein linguistisches Wort konstituieren, sind also ebenso wie ein
+               Leerzeichen als Tokenisierungsgrenze definiert. Ausnahmen zu dieser Regel, wie im
+               Falle von Abkürzungswörtern, Titeln, wie <term type="figure">Dr.</term>, oder
+               Alphabetismen, wie <term type="figure">R.E.M.</term>, werden anhand von
+               Regelerweiterungen definiert. Computationell implementiert werden
+               Tokenisierungsalgorithmen beispielsweise auf der Grundlage sogenannter regulärer
+               Ausdrücke und durch Regeln für spezifische Anwendungsszenarien ergänzt. Ein Beispiel
+               hierfür ist die Tokenisierung von Diskursen mit Elementen konzeptioneller
+               Mündlichkeit, wie <term type="dh">Social-Media-Kommunikate</term> (z. B. Bildungen
+               aus Vollverb + Personalpronomen wie <term type="figure">schreibste</term> und sogenannter Aktionswörter wie
+               <term type="figure">*grins*</term> oder <term type="figure">beidirseinwill</term> sowie Bildungen mit Sonderzeichen als Wortbestandteil,
+               wie Formen mit Hashtags <term type="figure">#Urlaub</term> oder E-Mail-Adressen und URLs). Die automatische
+               Implementierung solcher Tokenisierungsalgorithmen wird häufig in regelbasierten
+               Tokensierungsprozessen eingesetzt und durch Verfahren des maschinellen Lernens
+               ergänzt und kann im Fall einer sehr guten Passung zwischen Modell bzw. Trainingsdaten
+               und der Komplexität der zu tokenisierenden Daten hohe Genauigkeiten von über 99 % (<term type="dh">F1
+                  score</term>) erreichen,<note type="footnote"> <ref type="bibliography" target="#beisswenger_empirist_2016">Beißwenger et al. 2016</ref>.</note> bei
+               schlechterer Passung aber auch deutlich darunter liegen. Der Prozess der
+               Tokenisierung steht in direkter Abhängigkeit zu den Eigenschaften der zu
+               tokenisierenden Textdaten sowie der Qualität bzw. der Passung der Modellierung des
+                  Tokenisierungsprozesses.<note type="footnote"> 
+                     <ref type="bibliography" target="#ortmann_tools_2019">Ortmann et al. 2019</ref>.</note></p>
+            </div>
+            <div type="subchapter">
+               <head>2.2 Segmentierung in der Literaturwissenschaft</head>
+            <p>In der literaturwissenschaftlichen Textanalyse geht es zumeist um wesentlich größere
+               Texteinheiten als in der Linguistik. In der Analyse von Erzähltexten umfasst eine
+               Einheit typischerweise sogar den ganzen Text, wobei nicht selten eine ganze Reihe von
+               Texten im Fokus steht, etwa das Gesamtwerk eine:r Autor:in oder eine Sammlung zumeist
+               als exemplarisch geltender Texte z. B. einer Strömung oder Gattung. Wenn auch im
+               Einzelfall durchaus Kapitel und ähnliche strukturelle Einheiten in Analysen mit
+               einbezogen werden, gibt es kaum konventionalisierte Unterteilungen von Texten, die in
+               Analysen normalerweise genutzt werden. </p>
+            <p>Das wird bei der Betrachtung von literaturwissenschaftlichen Grundlagenwerken
+               offensichtlich. So findet sich im <bibl>
+                  <title type="desc">Handbuch Literaturwissenschaft</title>
+               </bibl> mit seinen drei Bänden zu Gegenständen und Grundbegriffen (Band 1), Methoden
+               und Theorien (Band 2) und Institutionen und Praxisfeldern (Band 3) nichts zu
+               Segmentierung als Verfahren oder zu Segmenten als Texteinheiten.<note type="footnote"
+                  > Vgl. <ref type="bibliography" target="#anz_handbuch_2013">Anz (Hg.) 2013</ref>.</note> Zwar wird in den Bänden 1 und 2 auf Segmentierung im
+               Kontext von Dramen und von Lyrik eingegangen und es werden jeweils typische Segmente
+                  genannt.<note type="footnote"> Für Dramen wird etwa festgestellt: <quote>Den
+                     sichtbar markierten Segmentierungen von Texten in ›Auftritte‹, ›Szenen‹,
+                     ›Akte‹, ›Kapitel‹ oder den unmarkierten Segmentierungen liegt vielfach ein
+                     Zeit- und Raumwechsel zugleich zugrunde</quote> (vgl. <ref type="bibliography" target="#anz_textwelten_2013">Anz 2013</ref>, S.&#x00A0;118). Bei
+                  lyrischen Texten werden darüber hinaus semantische Segmente thematisiert:
+                     <quote>In einem ersten Schritt kann der Interpret eine erste Gliederung seines
+                     Textes in syntaktische Einheiten (etwa Strophen, Kapitel, Abschnitte) und
+                     semantische Segmente (etwa Orte, Figuren, Figurencharakteristika,
+                     Handlungselemente) vornehmen</quote> (vgl. <ref type="bibliography" target="#koeppe_theorien_2013">Köppe / Winko 2013</ref>, S.&#x00A0;296).</note>
+               Dies geschieht aber ohne Explizierung des Konzepts bzw. des Verfahrens. Für
+               Erzähltexte hingegen werden die in der Analyse genutzten Segmente erst gar nicht
+               bestimmt, allerdings wird zumindest implizit Text als aus Segmenten zusammengesetzt
+               dargestellt. Außerdem klingt, wie auch bei der Beschreibung lyrischer Texte, eine
+               semantische Segmentierung – etwa nach Handlung oder Figuren – an, die jedoch nicht
+               systematisch in Bezug auf das Segmentieren der Texte beschrieben wird.<note
+                  type="footnote"> Vgl. dazu den Abschnitt »Erzähltexttheorie« im Handbuch
+                  Literaturwissenschaft (<ref type="bibliography" target="#schmid_erzaehltextanalyse_2013">Schmid 2013</ref>, S.&#x00A0;89–120).</note> Dieser geringen Relevanz
+               von Segmenten und Segmentierung in der Literaturwissenschaft entspricht auch, dass
+               sich im Standardnachschlagewerk der germanistischen Literaturwissenschaft, dem <bibl>
+                  <title type="desc">Reallexikon der deutschen Literaturwissenschaft</title>
+               </bibl><note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>.</note>, kein eigener
+               Eintrag dazu findet. In Bezug auf Prosatexte – und zum Teil auch auf alle Texte – ist
+               der literaturwissenschaftliche Zugang zu Text also insofern vorwiegend ein
+               holistischer, als er keine allgemein akzeptierte Segmentierung kennt.</p>
+            <p>Für die Automatisierung im Bereich der computationellen Literaturwissenschaft ist die
+               fehlende Segmentierung von Prosatexten problematisch. Anders als in den meisten
+               linguistischen Fragestellungen kann hier nicht auf standardisierte Segmente
+               zurückgegriffen werden, dabei basieren viele Verfahren auf Segmenten. Sei es bei der
+               Bestimmung von Autor:innenschaft, bei der Berechnung von als eine Art thematische Struktur
+               aufgefassten <term type="dh">Topics</term>, bei <term type="dh"
+                  >Sentiment-Analysen</term> oder bei Verfahren zur Bestimmung semantischer
+               Ähnlichkeiten, wie sie in der distributionellen Semantik gerade populär sind: Die
+               Verfahren basieren in verschiedenem Umfang auf einer Unterteilung der Texte in
+               kleinere Einheiten. Dabei segmentieren sie je nachdem, ob sie dem Paradigma der Suche
+               in oder der abstrakten Repräsentation von Texten verpflichtet sind, auf ganz
+               unterschiedlichen Ebenen. Für Verfahren wie die Sentiment-Analyse ist zu vermuten,
+               dass eine literaturwissenschaftliche Bestimmung der genutzten Einheiten – etwa als
+               figurenbezogene Segmente oder eine Segmentierung der Handlung – zu einer wesentlichen
+               Verbesserung der Verfahren führen würde. Andere Verfahren nehmen zwar bereits
+               behelfsmäßig eine Unterteilung der Texte in Segmente gleichen Wortumfangs vor, können
+               damit aber wahrscheinlich nicht ihre vollen Möglichkeiten ausschöpfen. Das betrifft
+               etwa das <term type="dh">Topic Modeling</term>, welches insbesondere für auch in
+               ihrer Struktur vergleichbare Texte bzw. Texteinheiten entworfen wurde. Da bislang mit
+               von der Wortzahl bestimmten Segmenten gearbeitet wird, wird die Textstruktur nicht
+               berücksichtigt.</p>
+            </div>
+            </div>
+            <div type="chapter">
+               <head>3. Fünf Beispiele </head>
+            <div type="subchapter">
+               <head>3.1 Segmentierung von Layout und Textstruktur</head>
+               <p>Neben der inhaltsbezogenen Bildrecherche,<note type="footnote"> Vgl. <ref type="bibliography" target="#bullin_bildsuche_2020">Bullin / Henrich
+                  2020</ref>.</note> die auf u. a. Segmentierungsverfahren aufsetzt, ist die
+               Segmentierung von Layoutelementen und entsprechenden Textstrukturen für
+               Texterkennungsverfahren wie <term type="dh">Optical Character Recognition</term>
+               (OCR) und <term type="dh">Handwriting Recognition</term> (HWR) bzw. <term type="dh"
+                  >Handwritten Text Recognition</term> (HTR) von zentraler Bedeutung. Darüber hinaus
+               erlaubt eine solche Segmentierung jedoch auch die Analyse von Schreibprozessen<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#gabler_primacy_2007">Gabler 2007</ref>.</note> und gibt neue Einsichten in
+               Textüberlieferungsprozesse auch sehr komplexer Natur.<note type="footnote"> Vgl.
+                  <ref type="bibliography" target="#krewet_wissenstransfer_2015">Krewet 2015</ref>.</note> Die mathematischen und informatisch-methodischen Grundlagen
+               der verschiedenen Verfahren beschreibt Rainer Herzog.<note type="footnote"> Vgl.
+                  <ref type="bibliography" target="#herzog_ansatz_2018">Herzog 2018</ref>. </note> Aus dieser Perspektive ist die Segmentierung von
+               Texteinheiten auf der Bildoberfläche eine seit langem erkannte Herausforderung, die
+               intensiv erforscht wird. Die Analyse von modernen oder historischen Drucken sowie von
+               Handschriften aller Art bringt dabei aufgrund der Beschaffenheit und des
+               Erhaltungszustands unterschiedliche Anforderungen mit sich.</p>
+            <p>Das Beispiel der als so ›kontaminiert‹ geltenden Überlieferung der
+               Aristoteles-Schrift <bibl>
+                  <title type="desc">de interpretatione</title></bibl>, dass sie in vertretbarer bzw. verfügbarer Zeit eines Forscher:innenlebens
+               nicht entschlüsselt werden könne,<note type="footnote"> Vgl. <ref type="bibliography" target="#krewet_aristoteles_2019">Krewet et al. 2019</ref>, S.
+                  77.</note> soll zeigen, wie eine Segmentierung von Layout- und Textstrukturen in
+               Grundtext und Paratexte neue Einsichten in die Überlieferungs- und
+               Rezeptionsgeschichte geben kann. Dabei werden sowohl Veränderungen der Texteinheiten
+               und ihrer Layoutgestalt(ung) als äußerer Transfer (materielles Resultat) wie auch die
+               sich daraus ergebende Veränderung der Konstitution des Grundtexts als innerer
+               Transfer (epistemischer Prozess) in den Blick genommen, denn beides gehört untrennbar
+               zusammen. Segmentierung erlaubt also Analyse textueller Dynamiken an der Oberfläche
+               (Layout) sowie in der Tiefe (Textverständnis).</p>
+            <p>Solche Segmentierungsfragen an Texte bzw. Textüberlieferungen sind im Zuge des <term
+                  type="dh">Material Turns</term> in den Blick geraten,<note type="footnote"> Vgl.
+                     <ref type="bibliography" target="#schubert_materialitaet_2010">Schubert (Hg.) 2010</ref>.</note> erfahren vor allem aber auch durch digitale
+               Möglichkeiten weitere Aufmerksamkeit. Zum einen lassen sich Segmente umfangreicher
+               Überlieferungen (semi-)automatisch bestimmen, zum anderen solche Segmente und ihre
+               Schichtungen dann anschaulich visualisieren. Darüber hinaus eröffnet gerade ein
+               gemischter Ansatz von automatischer (Vor-)Segmentierung und intellektueller
+               (Tiefen-)Annotation sowie quantitativer und qualitativer Verfahren bessere
+               Analysemöglichkeiten, wie unsere Arbeiten im Infrastruktur- sowie im Gastprojekt des
+               SFB 980 ›Episteme in Bewegung‹ zeigen konnten.<note type="footnote"> Vgl. <ref type="bibliography" target="#krewet_aristoteles_2019">Krewet et
+                  al. 2019</ref>; <ref type="bibliography" target="#krewet_diagramme_2020">Krewet / Hegel 2020</ref>.</note> Die strukturelle und materielle Organisation
+               der Wissensbestände in <bibl>
+                  <title type="desc">de interpretatione</title>
+               </bibl> verändert sich im Laufe der Überlieferungsgeschichte beständig:
+               Verschiedenste Arten und Formen von Interlinear- oder Marginal-Glossen, Scholien,
+               Diagrammen und Kommentaren können in gleicher, ähnlicher oder stark veränderter Form
+               bis hin zur Aufnahme in den Grundtext in eine neu entstehende Abschrift aufgenommen
+               werden. Die Segmentierung dieser Einheiten und ihre eindeutige Kategorisierung führt
+               dazu, dass Versionen dieser Einheiten vergleichbar gemacht und damit Kontaminationen
+               aufgespürt werden können.<note type="footnote"> Vgl. dazu ausführlich <ref type="bibliography" target="#krewet_diagramme_2020">Krewet / Hegel
+                  2020</ref>.</note>
+            </p>
+            <p>Auch im Bereich der materiellen Textoberfläche wirken also digitale Modellierungen
+               auf Forschungsfragen und Forschungsergebnisse zurück, indem in einem ersten Schritt
+               der Segmentierung relevante Eigenschaften der Forschungsgegenstände kategorisiert und
+               festgehalten werden. Idealerweise geschieht dies in einem Aushandlungsprozess
+               zwischen Text- und Informationswissenschaftler:innen, damit die gemeinsame Arbeit am
+               Modell zu Erkenntnisfortschritt am Gegenstand und zu Interoperabilität der Kategorien
+               führt.</p>           
+            </div>
+            <div type="subchapter">
+               <head>3.2 Segmentierung jenseits der Textoberfläche: Mehrwortausdrücke</head>
+            <p>Segmentierung kann verschiedene Formen und Rollen im analytischen Workflow annehmen.
+               Neben ihrer Rolle als Teil der Vorverarbeitung von Korpora spielt die Segmentierung
+               auch als Teil der Heuristik zur Identifikation und Extraktion lexikalischer <term
+                  type="dh">Mehrwortausdrücke</term> (MWA) eine zentrale Rolle. In diesem Abschnitt
+               soll am Beispiel der Identifikation und Extraktion lexikalischer Mehrwortausdrücke in
+               Korpora, hier anhand von <term type="dh">Kollokationen</term>, gezeigt werden, auf
+               welchen Segmentierungen der Prozess beruht und wie diese das Extraktionsergebnis
+               beeinflussen. Die Herausforderung ist im Falle solcher MWA, dass sie keine feste
+               identifizierbare Oberflächenform aufweisen, also keinem festen Muster folgen, sondern
+               neben kontinuierlichen, ununterbrochenen Wortfolgen, wie z. B. Kollokationen zwischen
+               prädikativem Adjektiv und Substantiv (wie <term type="figure">blondes Haar</term>)
+               auch diskontinuierliche MWA, wie z. B. Kollokationen zwischen Prädikatsverb und
+               Substantiv in der Nominalphrase (wie <term type="figure">ein Verbrechen
+                  begehen</term> – <term type="figure">jemand begeht schreckliche Verbrechen</term>)
+               umfassen. </p>
+            <p>Segmentierungsentscheidungen beruhen auf möglichst gut beschriebenen Merkmalen zur
+               Identifikation der zu segmentierenden Einheiten an der sprachlichen Oberfläche.
+               Typischerweise werden entsprechende Entscheidungskriterien in Segmentierungs- und
+               Annotationsrichtlinien festgehalten sowie bei automatischen Verfahren in
+               entsprechenden Segmentierungsalgorithmen implementiert. Dabei kommt es auf eine
+               Balance zwischen der Treffsicherheit und Zuverlässigkeit der Segmentierung, der
+               möglichst exhaustiven Identifikation der zu untersuchenden linguistischen Einheiten
+               und der Implementierungs- bzw. Anwendungsanforderungen an. Das heißt, dass sich unter
+               Umständen nicht alle aus linguistischer Perspektive interessanten Einheiten mit der
+               angestrebten Zuverlässigkeit in Form manuell oder automatisch anwendbarer
+               Segmentierungsanweisungen umsetzen lassen. Entscheidend sind hierfür eine Reihe von
+               Faktoren, denen es systematisch beizukommen gilt. Auf der ersten Ebene geht es um die
+               eineindeutige Beschreibung der Merkmale in Form von Segmentierungsrichtlinien. Diese
+               müssen auf der nächsten Ebene entweder manuell von menschlichen Segmentierer:innen
+               möglichst gut verstanden und so bei der Segmentierung befolgt und bei automatisierten
+               Verfahren in Form von Regeln implementiert werden. Grundvoraussetzung ist im Fall der
+               manuellen Anwendung der Segmentierung ein intellektuelles Verstehen der Eigenschaften
+               der zu segmentierenden sprachlichen Einheiten im Sinne ihrer diskreten Identifikation
+               in den Daten. Dieser Prozess beinhaltet als elementaren Bestandteil eine Beschreibung
+               der Merkmale, an denen diskrete Segmentierungseinheiten an der Oberfläche der Daten
+               identifizierbar sind. Eine solche Modellierung von Segmentierungseinheiten und deren
+               Kennzeichen an der sprachlichen Oberfläche ist elementar für die algorithmische
+               Implementierung der Segmentierung. Die relative Einfachheit der Identifikation von
+               Segmentierungsmerkmalen an der Oberfläche ist zugleich die größte Stärke und Schwäche
+               des Verfahrens, denn zuverlässig lassen sich so zunächst am besten solche
+               Segmentierungsentscheidungen modellieren, die sich anhand oberflächenstruktureller
+               Merkmale möglichst eineindeutig, z. B. anhand regulärer Ausdrücke, abbilden lassen.
+               Anhand solcher Verfahren gut zu modellierende Segmentierungen sind Wortgrenzen auf
+               der Basis von Leerzeichen und Interpunktionszeichen sowie regelkonforme Sätze. </p>
+            <p>Korpora mit auf diese Weise vorgenommenen Segmentierungen, wie die Tokenisierung auf
+               Wortebene sowie die Satztokenisierung, bilden die Grundlage für die linguistische
+               Kategorisierung durch Verfahren wie die automatische Wortartenannotation (<term
+                  type="dh">Part-of-Speech-Tagging</term>). Das Part-of-Speech-Tagging ist so eng
+               mit der Tokenisierung auf Wort-und Satzebene verwoben und von der
+               Tokenisierungsqualität abhängig, dass beide Prozesse in der Regel in einem Workflow
+               miteinander verbunden sind. So implementieren gängige Part-of-Speech-Tagger, wie der <bibl>
+                  <title type="desc">Stanford Log-Linear Part-of-Speech Tagger</title></bibl><note type="footnote"> Vgl. <ref type="bibliography" target="#toutanova_enriching_2000">Toutanova / Manning 2000</ref>.</note> und der <bibl>
+                  <title type="desc">TreeTagger</title></bibl><note type="footnote">Vgl. <ref type="bibliography" target="#schmid_part_1994">Schmid 1994</ref>; 
+                  <ref type="bibliography" target="#schmid_improvements_1995">Schmid 1995</ref>.</note> eigene
+               Tokenisierungsprozesse, die dem Part-of-Speech-Tagging innerhalb des Workflows
+               vorgeschaltet werden. Es handelt sich bei der Tokenisierung also um
+               Vorverarbeitungsschritte, die Voraussetzung und Grundlage für automatische
+               Annotationsprozesse, wie das Part-of-Speech-Tagging, sind. Die meisten aktuellen
+               Part-of-Speech-Tagger bringen eine eigene Implementierung der Tokenisierung mit, da
+               die Modellierung der Wortartenannotation eine spezifische Tokenisierung voraussetzt
+               und eine gute Tokenisierung auch entscheidenden Einfluß auf die Qualität der
+               Wortartenannotation hat.</p>
+            <p>Doch Segmente als Grundlage linguistischer Analysen konstituieren sich im Prozess der
+               Analyse auch auf andere Weise, nämlich dann, wenn die zu untersuchenden
+               linguistischen Phänomene zwar auf tokenisierten Elementen beruhen, sich jedoch
+               darüber hinaus strukturell auf weiteren Ebenen der linguistischen Organisation
+               konstituieren. Ein Beispiel hierfür sind Kollokationen und andere komplexe
+               lexikalische Gruppen, die sich aus zwei oder mehr kontinuierlichen oder
+               diskontinuierlichen lexikalischen Einheiten konstituieren. Die folgenden Beispiele
+               sollen dies illustrieren:</p>
+            <table>
+               <row>
+                  <cell>
+                     <hi rend="bold">Mehrwortausdruck</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Beispiel</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>Stützverbkonstruktionen, z. B. <term type="figure">Rede halten</term>, <term
+                        type="figure">Bad nehmen</term>
+                  </cell>
+                  <cell>Diese <hi rend="bold">Rede hielt </hi>die Kanzlerin anlässlich des …<lb/>
+                     Die <hi
+                        rend="bold">Rede</hi>, die die Kanzlerin anlässlich des ... <hi rend="bold"
+                           >hielt</hi>.<lb/></cell>
+               </row>
+               <row>
+                  <cell>trennbare Verben, z. B. <term type="figure">stoßen auf</term>, <term
+                        type="figure">binden an</term>
+                  </cell>
+                  <cell>Im Verlaufe der Untersuchung <hi rend="bold">stießen </hi>die Ärzte <hi
+                        rend="bold">auf </hi>neue Symptome.</cell>
+               </row>
+               <row>
+                  <cell>Kollokationen, z. B. <term type="figure">Verbrechen begehen</term>
+                  </cell>
+                  <cell>
+                     Von dieser Gruppierung wurden über Jahre schwerste <hi rend="bold"
+                        >Verbrechen begangen</hi>.<lb/>
+                     Die <hi rend="bold">Verbrechen </hi>wurden von
+                        dieser Gruppierung über mehrere Jahre <hi rend="bold">begangen</hi>.</cell>
+               </row>
+               <trailer xml:id="tab02">
+                  <ref type="intern" target="#tab2">Tab. 2</ref>: Beispiele lexikalischer Mehrwortausdrücke.<ref type="graphic" target="#segment_t2"/>
+               </trailer>
+            </table>
+            
+            
+            <p>Lexikalische Mehrwortausdrücke sind phraseologisch also als relativ feste
+               Kombinationen im Inventar der Sprache etabliert. Manche davon sprichwörtlich und
+               relativ unveränderlich (›Der Spatz in der Hand ist besser als die Taube auf dem
+               Dach‹), die meisten aber – wie die hier adressierten Beispiele – flexibler im Rahmen
+               des Sprachsystems. Ihr habituelles kombiniertes Auftreten, das J. R. Firth mit dem DiKtum <quote>You shall know a word by the company it keeps</quote><note type="footnote"><ref type="bibliography" target="#firth_papers_1964">Firth 1964 [1957]</ref>.</note> beschreibt – hat in der
+               Forschung der vergangenen Jahrzehnte, vor allem aber seit der Einführung digitaler
+               Daten und Verfahren in der Linguistik eine Reihe von Ansätzen mit dem Ziel
+               hervorgebracht, relevante und reproduzierbare Ergebnismengen lexikalischer
+               Mehrwortausdrücke aus Korpora zu extrahieren. Dies geschieht üblicherweise auf der
+               Grundlage statistischer Verfahren, wie zum Beispiel anhand von Assoziationsmaßen,
+               unter denen <term type="dh">Log-Likelihood-Ratio</term>, <term type="dh"
+                  >t-Score</term>, der <term type="dh">Dice-Koeffizient</term> und <term type="dh"
+                  >Mutual Information Score</term> (MI) zu den am häufigsten verwendeten
+               zählen.<note type="footnote"> Vgl. <ref type="bibliography" target="#evert_corpora_2008">Evert 2008</ref>; 
+                  <ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> Neben
+               der relativ etablierten Kookkurrenz von zwei oder mehr Konstituenten der
+               lexikalischen Ebene weisen lexikalische Mehrwortausdrücke aber auch ein gewisses Maß
+               an Flexibilität bezüglich struktureller Permutationen im Rahmen der regulären
+               Grammatik auf, können also je nach Kontext modifiziert und anhand der Regeln der
+               Grammatik verändert und umgestellt werden (siehe Beispiel zu Kollokationen in <ref type="intern" target="#tab02">Tabelle 2</ref>). Kollokationen sind zudem
+               häufig zu einem gewissen Grad semantisch transparent, ihre Bedeutung lässt sich also
+               vollständig oder teilweise aus den Einzelbedeutungen ihrer Konstituenten
+               ableiten.</p>
+            <p>Im Folgenden soll am Beispiel der Extraktion von Kollokationen im Firth’schen
+               Sinne<note type="footnote"> Vgl. <ref type="bibliography" target="#firth_papers_1964">Firth 1964 [1957]</ref>.</note> habitueller
+               Kookkurrenzen lexikalischeblor Einheiten – also des wiederkehrenden gemeinsamen
+               Auftretens als Wortverbindungen – und einer um syntaktische Relationen erweiterten
+               Definition diskutiert werden, welchen Einfluss die Segmentierung im Sinne von
+               Tokenisierung und Satzsegmentierung auf die Extraktion von Kollokationen aus Korpora
+               anhand statistischer Assoziationsmaße hat und wie die Veränderung von Parametern mit
+               Bezug auf den Suchraum – die gleichfalls eine Form der Segmentierung darstellt –,
+               die Ergebnismenge bei der Identifikation von Kollokationen beeinflusst. Anhand dieses
+               Beispiels lässt sich zeigen, dass die Operationalisierung einer bereits in prä-computationaler Zeit
+               formulierten Definition mittels digitaler Verfahren und statistischer
+               Assoziationsmaße auf Segmentierungsentscheidungen fußt und auf dieser
+               Grundlage im Digitalen geschärft und weiterentwickelt werden konnte.</p>
+            <p>Bei Kollokationen handelt es sich um ein Phänomen, das Stefan Evert als ›Epiphänomen‹<note
+               type="footnote"> <ref type="bibliography" target="#evert_corpora_2008">Evert 2008</ref>.</note> bezeichnet hat, da diese im klassischen
+               Firth’schen Sinne zunächst ein Effekt der habituellen Kookkurrenz ihrer Konstituenten
+               sind, denen man auch nach Firth eine gegenseitige Erwartbarkeit (»mutual expectancy
+               between certain words«<note type="footnote"><ref type="bibliography" target="#firth_selected_1968">Firth 1968</ref>, S.&#x00A0;181.</note>) zwischen
+               bestimmten Wörtern zuschreibt. Diese habituell kookkurrierenden, wechselseitig
+               erwartbaren lexikalischen Konstituenten bilden von kompetenten Muttersprachler:innen
+               im Sprachgebrauch beherrschte, relativ feste, aber auch im Rahmen der Grammatik
+               flexible, wiederkehrende Einheiten, die zumeist semantisch relativ transparent sind,
+               aber auch anhand der etablierten Kookkurrenz zusätzliche Bedeutung tragen können.
+               Jedenfalls sind Kollokationen aber derart etabliert, dass sie im Sprachgebrauch als
+               Einheiten empfunden werden und entsprechend funktional sind. Ein Verstoß gegen die
+               Verwendung der etablierten Wortkombinationen wird unter Umständen verstanden, aber
+               auch als den Konventionen widersprechend erkannt.</p>
+            <p>Eine der zentralen Herausforderungen der Identifikation von Kollokationen in Korpora
+               liegt nun darin, dass sie einerseits relativ fest etablierte, wiederkehrende
+               Verbindungen aus zwei oder mehr Konstituenten darstellen, dass diese Konstituenten
+               aber erstens, wie oben ausgeführt, den im Rahmen der Grammatik gestatteten
+               Permutationen ihrer relativen Reihenfolge und Formenbildung unterliegen (z. B. <term type="figure">ein
+                  Verbrechen begehen</term> und <term type="figure">Verbrechen werden begangen</term>), und dass die Konstituenten von
+               Kollokationen im Gegensatz zu n-Grammen nicht notwendigerweise konsekutiv
+               aufeinanderfolgen. Weiterhin wird in den meisten Definitionen des Phänomens die
+               Kookkurrenz innerhalb der Satzgrenzen, entweder innerhalb von Phrasen (z. B. in der
+               Nominalphrase <term type="figure">blondes Haar</term>) oder über Phrasengrenzen hinweg zwischen
+               Satzkonstituenten definiert (z. B. die Kollokation aus dem Prädikats-Verb und einem
+               Substantiv als Kopf der Nominalphrase in Objektposition, <term type="figure">X
+               begeht ein Verbrechen</term>). Die Identifikation von Kollokationen fußt so auf
+               der Tokeniserung der lexikalischen Ebene, also der Identifikation von Lexemen des
+               untersuchten Korpus, und wird begrenzt durch die Satztokenisierung als äußerer Grenze.
+               Kollokationen reichen in den meisten Definitionen nicht über die Satzgrenze
+               hinaus,<note type="footnote"> Vgl. jedoch die abweichende Definition von <ref type="bibliography" target="#halliday_cohesion_1976">Halliday /
+                  Hasan 1976</ref>, S.&#x00A0;284–286.</note> wiewohl Konstituenten selbstverständlich im
+               Folgesatz erneut aufgegriffen werden können. Es ist bei der Identifikation von
+               Kollokationen in Korpora authentischer Sprache also einerseits, wie bei vielen
+               Analysen, die Tokenisierung Grundvoraussetzung. Andererseits ist auf Grundlage der
+               Tokenisierung im Korpus der Gegenstand trotzdem nicht sicher erfassbar, weil eben die
+               Konstituenten von Kollokationen nicht notwendigerweise konsekutiv aufeinander folgen.
+               Kollokationen müssen also innerhalb eines definierten Kontexts (oder Fensters) als an
+               der sprachlichen Oberfläche zunächst scheinbar unverbundene – und für uninformierte
+               Sprachteilnehmer:innen nicht unmittelbar erkennbare – Einheiten durch statistische
+               Verfahren ermittelt werden.</p>
+            <p>Umfang und Qualität der Korpusdaten und hier vor allem der Segmentierung als Teil der
+               linguistischen Vorverarbeitung sind von entscheidender Bedeutung für die
+               Identifikation von Kollokationen, da korrekt identifizierte Tokens und Satzgrenzen
+               die Einhaltung der Parameter, die Identifikation der Konstituenten und damit auch von
+               Kollokationen beeinflussen. Gerade in sehr großen Korpora, deren Vorverarbeitung
+               aufgrund des Datenumfangs nicht manuell qualitätsgesichert werden kann und wird,
+               verbleiben häufig Artefakte der Digitalisierung, unverbundene Zeichen etc., die die
+               Vorverarbeitung erschweren und damit auch die Qualität der Kollokationsextraktion
+               negativ beeinflussen. So konnte in der erwähnten Studie von Sabine Bartsch und Stefan Evert<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> gezeigt werden, dass bei der
+               Extraktion von Kollokationen entgegen quantitativer Vorannahmen, die große Korpora
+               als zentrale Grundlage für die Kollokationsforschung annehmen, das Kriterium der
+               Korpusgröße immer auch gegen die Korpusqualität abgewogen werden muss und dass
+               kleinere, aber sehr sauber vorverarbeitete Korpora durchaus bessere
+               Extraktionsergebnisse liefern können als sehr große Korpora, die aufgrund ihrer Größe
+               unter Umständen weniger saubere Daten enthalten. </p>
+            <p>Bei der Kollokationsextraktion kommt darüber hinaus eine zweite Ebene der
+               Segmentierung zusätzlich zur im Rahmen des <term type="dh">Pre-Processings</term>
+               erfolgten Tokenisierung zum Einsatz, durch die der Suchraum, innerhalb dessen
+               Konstituenten von Kollokationen erwartbar auftreten, eingegrenzt und für die
+               Statistik beherrschbar wird, indem das Rauschen in
+               den Daten reduziert und damit die Sicherheit der Identifikation relevanter
+               Kollokationen erhöht wird. Die hier vorgenommene Segmentierung ist eine heuristische,
+               sie modelliert und grenzt den potenziellen Suchraum ein, ohne dabei das gesuchte
+               Phänomen direkt auszuwählen. Sie nähert sich sozusagen dem gesuchten Phänomen durch
+               Begrenzung des Suchraumes an, ohne direkt Kollokationskandidaten zu adressieren. In
+               extensiven Untersuchungen konnte gezeigt werden, dass die Parameter für die
+               Begrenzung des Suchraums sowohl Einfluss auf die Menge der identifizierten
+               Kollokationskandidaten (<term type="dh">Recall</term>), also auch auf die der
+               tatsächlich relevanten Kollokationskandidaten (<term type="dh">Precision</term>)
+               haben, die in Tests als tatsächliche Kollokationen identifiziert werden konnten. Das
+               Verhältnis zwischen Precision und Recall gibt schließlich Aufschluss über
+               die Güte der Extraktion im Sinne des Umfangs der mit einer gewissen Konfidenz (im
+               nichttechnischen Sinne) identifizierbaren Ergebnismenge.</p>
+            <p>Die von Evert und Bartsch<note type="footnote"><ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> getesteten Parameter-Settings für den Suchraum
+               umfassen neben den etablierten wort-basierten Suchfenstern<note type="footnote"> Vgl.
+                  <ref type="bibliography" target="#sinclair_corpus_1991">Sinclair 1991</ref>.</note> 3:3, 5:5 und 10:10 Wörter als je linker und rechter Kontext
+               auch die Satzgrenze, also den kompletten Satz als delimitierenden Kontext. Weiterhin
+               werden einer z. B. von Bartsch (2004) vorgeschlagenen Definition folgend und über die
+               Firth’sche Definition hinausgehend Kollokationskandidaten auf der Grundlage einer
+               direkten syntaktischen Relation zwischen den Konstituenten extrahiert.<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#bartsch_properties_2004">Bartsch 2004</ref>, S.&#x00A0;76.</note> Dies erfordert wiederum eine
+               weitere Segmentierung und Annotation im Sinne der Identifikation syntaktischer
+               Einheiten und Relationen. Es kann so unter anderem der Einfluss unterschiedlicher
+               Parametersettings für den Suchraum systematisch evaluiert werden, zum anderen kann
+               aufgezeigt werden, dass unter Hinzuziehung unterschiedlicher linguistischer
+               Parameter, wie zum Beispiel Lemmatisierung, lexiko-grammatischer
+               Wortartenklassifikation und grammatischer Dependenz, die Ergebnisse der
+               Kollokationsextraktion beeinflusst und die Ergebnismengen verändert und verbessert
+               werden können. </p>
+            <p>Anhand dieses Beispiels konnte gezeigt werden, dass Segmentierungsentscheidungen zum
+               einen als Teil des linguistischen Pre-Processings Einfluss auf die Qualität
+               linguistischer Analysen haben, indem sie den Zugriff auf lexikalische Einheiten als
+               Konstituenten von Kollokationen ermöglichen. Zum anderen ist eine Segmentierung im
+               Sinne der Auswahl begrenzter Suchräume innerhalb der Korpusdaten elementarer
+               Bestandteil von linguistischen und statistischen Verfahren zur Identifikation von
+               Kollokationskandidaten. So werden auf der Grundlage wortbasierter Suchfenster (3–5
+               Wörter als linker und rechter Kontext eines Suchwortes) oder grammatisch definierter
+               Segmente, wie Sätze oder Konstituenten in direkter syntaktischer Relation,
+               Kollokationskandidaten anhand statistischer Maße für die Bedeutung des gemeinsamen
+               Auftretens ermittelt.</p>
+            </div>
+            <div type="subchapter">
+               <head>3.3 Analyse heuristischer Textpraktiken </head>
+            <p>An der Diskussion von Mehrworteinheiten ist schon deutlich geworden, dass sprachliche
+               Segmente nur funktional zu bestimmen sind: Es gehört zusammen, was gemeinsam eine
+               Funktion in der Kommunikation übernimmt. Während Mehrworteinheiten funktional auf den
+               Satz bezogen sind, konstituiert sich die Einheit des Satzes dadurch, dass mit ihr
+               sprachliche Praktiken vollzogen werden. Bei deren Analyse wiederum ist das
+               Zusammenspiel von Handlungsinterpretation, kategorialer Subsumption und struktureller
+               Segmentierung entscheidend. Was das bedeutet, soll im Folgenden anhand von
+               Segmentierungsfragen beim Erstellen eines Tagsets zur Analyse heuristischer
+               Textpraktiken erläutert werden. Unter ›heuristischen Textpraktiken‹ verstehen wir
+               Formulierungsverfahren, mit denen in institutionell verankerten Routinen neues Wissen
+               generiert und an vorhandenes Wissen angeschlossen wird, z. B. ›die Relevanz eines
+               Forschungsthemas markieren‹, ›einen Begriff definieren‹ oder ›eine Aussage
+               argumentativ stützen‹. Dabei interessiert uns, wie solche Formulierungsverfahren in
+               Dissertationen verschiedener wissenschaftlicher Disziplinen zum Einsatz kommen, an
+               welcher Stelle im Text sie verwendet werden, wie sie miteinander kombiniert werden,
+               welche Textfunktion sie haben und was man aus all dem über die epistemischen
+               Praktiken der jeweiligen Disziplin lernen kann. Dieser Forschungsansatz ist
+               ausführlich in einer Pilotstudie dokumentiert.<note type="footnote"> Vgl. <ref type="bibliography" target="#bender_textpraktiken_2020">Bender /
+                  Müller 2020</ref>.</note> Darin wurde in einem abduktiven Verfahren ein Tagset
+               entwickelt und ein Pilotkorpus von 65 Einleitungen zu Dissertationen aus den 13 an
+               der Technischen Universität Darmstadt vertretenen Fachbereichen händisch kollaborativ
+               annotiert. Es ergeben sich als übergeordnete Textpraktiken die expositorischen
+               Verfahren der Relevanzmarkierung, der Zielsetzung und der Thesenstellung sowie
+               Praktiken der Definition und der Stützung von Assertionen. Dazu gibt es jeweils
+               Subkategorien (vgl. <ref type="graphic" target="#segment_001">Abbildung
+                  1</ref>).<note type="footnote"> Ausführlich in <ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>, S.
+                  22–24.</note>
+            </p>
+            <figure>
+               <graphic xml:id="segment_001" url="Medien/segment_001.png">
+                  <desc>
+                     <ref type="graphic" target="#abb1">Abb. 1</ref>: Das taxonomische Annotationsschema HeuTex. 
+                     [<ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>,
+                     S.&#x00A0;23]<ref type="graphic" target="#segment_001"/>
+                  </desc>
+               </graphic>
+            </figure>
+            <p>Wie bei allen pragmatischen Untersuchungen in der Linguistik handelt es sich dabei um
+               ein x-als-y-Verfahren: Da Formulierungsverfahren nicht sinnvoll in actu beobachtet
+               werden können (zumindest nicht großflächig), gilt es, die Textsegmente zu ermitteln,
+               mit denen eine bestimmte Textpraktik vollzogen wurde. Nun kann zum Beispiel die
+               Praktik des Argumentierens – je nach Argumentationsbegriff – mit einem Wort, einem
+               Satz oder einer Buchreihe vollzogen werden. Würde man aber ad hoc für jede
+               sprachliche Praktik das Textsegment festlegen, mit dem sie vollzogen wird, könnte man
+               die Segmente nicht miteinander vergleichen, zumindest eine quantitative Auswertung
+               wäre unmöglich. Daher haben wir Annotations-Kategorien grundsätzlich der Einheit
+               ›Satz‹ zugewiesen. Das ist auch die Basiskategorie der linguistischen Pragmatik:
+               Sprachliche Handlungen werden typischerweise mit Sätzen vollzogen. Da andererseits
+               Textpraktiken, wie man sich am Argumentieren gut verdeutlichen kann, oft über die
+               Satzgrenze hinausreichen, ist bei der Analyse mit ›Zonen‹ aufeinanderfolgender
+               diskreter heuristischer Textpraktiken zu rechnen. </p>
+            <p>Die Festlegung einer linguistischen Einheit zur Segmentierung war auch aus einem
+               anderen Grund wichtig: Das Projekt zielt darauf ab, heuristische Textpraktiken
+               automatisch zu klassifizieren. Hierzu liegen vielversprechende Ergebnisse einer
+               Pilotstudie vor, in der wir eine <term type="dh">Deep-Learning</term><hi rend="italic">-</hi>Architektur, genauer: ein <term type="dh">Recurrent Neural
+                  Network</term> (RNN), zur Klassifikation auf der Basis unseres Tagsets (vgl. <ref
+                  type="graphic" target="#segment_001">Abbildung 1</ref>) verwendet haben.<note
+                     type="footnote"> Vgl. <ref type="bibliography" target="#becker_heuristic_2020">Becker et al. 2020</ref>.</note> Wir konnten feststellen, dass
+               unser Modell auf allen Annotationsebenen recht gut funktioniert und Genauigkeitswerte
+               von bis zu 93 % (Level 0) erreicht. Auf Level 0 ist die Basisebene der
+               Kategorisierung angesiedelt, die Levels 1 und 2 sind jeweils Unterkategorien. Wir
+               sehen auch ein ausgewogenes Verhältnis zwischen <term type="dh">Precision-</term> und <term type="dh">Recall-Scores</term> auf
+               allen Ebenen, mit dem größten Unterschied auf Level 0, wo der <term type="dh"
+                  >Recall</term> 8 Prozentpunkte über dem <term type="dh">Precision-Score</term>
+               liegt, was darauf hindeutet, dass das Modell hier (etwas) besser darin ist, alle
+               relevanten Instanzen jedes Labels innerhalb unseres Datensatzes zu finden, als
+               korrekte Vorhersagen der Labels für die Instanzen zu machen. Um diese Ergebnisse zu
+               interpretieren, muss die <term type="dh">Majority Baseline</term> – d. h. die Menge
+               der häufigsten Instanzen innerhalb des Datensatzes – berücksichtigt werden. Wir haben
+               die Majority Baseline auf allen drei Ebenen übertroffen, wobei die auffälligste
+               Verbesserung auf Ebene 2 zu verzeichnen war (vgl. <ref type="intern" target="#tab03">Tabelle 3</ref>). Da es sich um eine komplexe
+               Klassifikationsaufgabe auf der Basis eines extrem kleinen Trainingsdatensatzes (2.689
+               Sätze) handelt, haben sich Tagset und Segmentierungspraxis als robust erwiesen.</p>
+            <table>
+               <row>
+                  <cell/>
+                  <cell>
+                     <hi rend="bold">Level 0</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Level 1</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">Level 2</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>Numb. of Labels</cell>
+                  <cell>
+                     <hi rend="bold">5</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">11</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">2</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Accuracy</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">0.8302</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">0.7548</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">0.9292</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">F1</hi>
+                  </cell>
+                  <cell>0.8071</cell>
+                  <cell>0.7546</cell>
+                  <cell>0.9291</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Precision</hi>
+                  </cell>
+                  <cell>0.7661</cell>
+                  <cell>0.7541</cell>
+                  <cell>0.9309</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Recall</hi>
+                  </cell>
+                  <cell>0.8537</cell>
+                  <cell>0.7549</cell>
+                  <cell>0.9295</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Majority Baseline</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="bold">0.7164 </hi>(Relevanzmarkierung)</cell>
+                  <cell>
+                     <hi rend="bold">0.6219 </hi>(Sachbeschreibung)</cell>
+                  <cell>
+                     
+                     <hi rend="bold">0.6023</hi><lb/>
+                     (gerichtet)<lb/>
+                  </cell>
+               </row>
+               <trailer xml:id="tab03">
+                  <ref type="intern" target="#tab3">Tab. 3</ref>: Ergebnis der RNN-Klassifizierung auf verschiedenen Ebenen. [Aus:
+                  <ref type="bibliography" target="#becker_heuristic_2020">Becker et al. 2020</ref>]<ref type="graphic" target="#segment_t3"/>
+               </trailer>
+            </table>
+            
+            <p>Nun mag man annehmen, die Satzsegmentierung sei ein mechanischer Schritt des
+               Pre-Processings ohne weitere semantische Implikationen. Hier soll aber an zwei Fällen
+               demonstriert werden, dass die Segmentierungsentscheidung unmittelbaren Einfluss auf
+               kategoriale Zuweisungen hat, und zwar weil sie die Tiefe des hermeneutischen Zugriffs
+               delimitiert, die wiederum die Kategorisierung bestimmt. Unsere Segmentierung ist
+               grundsätzlich der syntaktisch autonome Satz (<term type="dh">Sentence</term>), da untergeordnete Teilsätze
+               funktional dem Matrixsatz beigeordnet sind und daher auch keine eigenständige
+               Texthandlung repräsentieren. Wird zum Beispiel der folgende Teilsatz (<term type="dh"
+                  >Clause</term>) als Segment der Kategorisierungsentscheidung zugrundegelegt (a)
+               und kategorisiert man flach, d. h. ohne Einbeziehung von Kontextwissen, dann ist ein
+               assertiver Sprechakt, in unserem Schema eine Relevanzmarkierung durch
+               Sachbeschreibung, zu kategorisieren. Ist das Segment aber der Satz im Sinne von
+               <term type="dh">Sentence</term>, in diesem Fall also ein Satzgefüge, dann ergibt sich eine Argumentation
+               (b).
+               <list type="unordered">
+            <item>a) <term type="figure">Ihr Lebenslauf ist für die bürgerlichen Frauen ihrer Epoche keineswegs
+               exemplarisch</term><note type="footnote"> Vgl. <ref type="bibliography" target="#siegel_hang_2002">Siegel 2002</ref>, S.&#x00A0;241.</note></item>
+            <item>b) <term type="figure">Ihr Lebenslauf ist für die bürgerlichen Frauen ihrer Epoche keineswegs
+               exemplarisch, denn diese wurden weiterhin als Hausfrauen und Mütter definiert.</term><note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#siegel_hang_2002">Siegel 2002</ref>, S.&#x00A0;241.</note>
+            </item></list></p>
+            <p>Ein etwas anders gelagerter Fall findet sich in den Beispielen (c) und (d).
+               Betrachtet man Satz (c) isoliert und ohne Kontextwissen einzubeziehen, dann wäre er
+               als deontisch modalisierte Proposition zu interpretieren und pragmatisch als
+               direktiver Sprechakt einzuordnen, konkret als Handlungsempfehlung. Berücksichtigt man
+               aber den unmittelbaren Textzusammenhang (d), linguistisch gesprochen: den <term
+                  type="dh">Kotext</term>, dann ergibt sich nach unserem Kategorienschema die
+               heuristische Textpraktik einer Zielsetzung.
+               <list type="unordered">
+            <item>c) <term type="figure">Die Arbeit soll in diesen [sic] Zusammenhang Aspekte darstellen, die bei der
+               Erstellung eines solchen Verfahrens grundsätzlich zu beachten sind, und Wege
+               aufzeigen, wie diese im konkreten Anwendungsfall zu einem anwendungsfähigen Verfahren
+               konkretisiert werden können.</term><note type="footnote"> Vgl. <ref type="bibliography" target="#dieleman_hinweise_2016">Dieleman 2016</ref>, S.&#x00A0;3.</note>
+            </item>
+            <item>d) <term type="figure">1.2 Zielsetzung der Arbeit. Ziel der Arbeit ist die Erarbeitung von
+               allgemeingültigen Hinweisen für die Entwicklung von Entscheidungsverfahren, [...].</term> <hi
+                  rend="super">→</hi><hi rend="sub">i</hi> <term type="figure">Die Arbeit soll in diesen [sic] Zusammenhang Aspekte
+               darstellen, die bei der Erstellung eines solchen Verfahrens grundsätzlich zu beachten
+               sind,<hi rend="sub">i</hi> <hi rend="sub">ii</hi> und Wege aufzeigen, wie diese im konkreten Anwendungsfall zu einem
+               anwendungsfähigen Verfahren konkretisiert werden können.</term><hi rend="sub">ii</hi><hi rend="super">←</hi>
+               <note type="footnote"> Vgl. <ref type="bibliography" target="#dieleman_hinweise_2016">Dieleman 2016</ref>, S.&#x00A0;3.</note>
+               </item></list></p>
+            <p>An dem Beispiel sieht man, dass das Segment ›Satz‹ auch im konkretisierten Sinne
+               keineswegs eindeutig ist. Das Automatisierungsvorhaben unseres Projektes bringt es
+               mit sich, dass Sätze formal im Sinne von ›mit satzabschließendem
+               Interpunktionszeichen abgeschlossene Einheit‹ bestimmt sein müssen. Im entscheidenden
+               Satz der Beispiele (c) und (d) sind aber zwei Satzgefüge miteinander koordiniert, die
+               textpragmatisch nach unserem Schema jeweils unterschiedlich zu kategorisieren wären,
+               nämlich als deskriptive Zielsetzung (Teilsatz i) bzw. als konstruktive Zielsetzung
+               (Teilsatz ii). In unserem Ansatz muss nun aber eine Kategorisierungsentscheidung
+               getroffen und das Satzgefüge damit als pragmatisch subordinativ interpretiert werden:
+               in diesem Fall als deskriptive Zielsetzung.</p>
+            <figure>
+               <graphic xml:id="segment_002" url="Medien/segment_002.png">
+                  <desc>
+                     <ref type="graphic" target="#abb2">Abb. 2</ref>: Dimensionen der Segmentierung. [Eigene Darstellung]<ref type="graphic" target="#segment_002"/>
+                  </desc>
+               </graphic>
+            </figure>
+            <p>Segmentierung ist also keineswegs eine rein formale Angelegenheit, sondern muss immer
+               als hermeneutische Praktik gedacht werden, in der drei Teilprozesse untrennbar
+               ineinandergreifen und aufeinander bezogen sind (vgl. <ref type="graphic"
+                  target="#segment_002">Abbildung 2</ref>): das Ausschneiden eines Segments aus
+               dem Textkontinuum (<term type="dh">Zoning</term>), die Zuweisung des Segments zu
+               einer analytischen Kategorie (<term type="dh">Subsumption</term>) und die Festlegung
+               der Tiefe des gedanklichen Zugriffs auf der Basis von mehr oder weniger
+               Kontextinformation (<term type="dh">Interpretation</term>). An den hier diskutierten
+               Beispielen heuristischer Textpraktiken konnten wir zeigen, dass diese drei
+               Teilprozesse bei jeder Segmentierungsentscheidung eine zentrale Rolle spielen und
+               dementsprechend zu reflektieren sind.</p>
+            </div>
+            <div type="subchapter">
+               <head>3.4 Die Sequenzierbarkeit der Novelle</head>
+            <p>Dass Segmentierung heute in der Literaturwissenschaft systematisch unterreflektiert
+               erscheint, erstaunt nicht nur wegen ihrer großen Bedeutung bei der
+               Operationalisierung von Textanalysen. Es erstaunt auch historisch im Hinblick auf
+               alle generischen Ansätze in der Gattungspoetik, die seit dem 19. Jahrhundert zum
+               festen Bestandteil der Literaturtheorie gehören. Vor allem bei den an der Schwelle
+               zur Moderne viel theoretisierten Prosagattungen Märchen und Novelle hat die
+               Segmentierbarkeit definitorischen Charakter. Vladimir Propps legendäre <bibl>
+                  <title type="desc">Morphologie des Märchens</title>
+               </bibl> leitet aus der Analyse eines einschlägigen Korpus ein festes Set von
+               Handlungssequenzen ab, aus dem sich jedes Märchen (re)produzieren lassen soll.<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#propp_morphologie_1975">Propp 1975</ref>.</note> Dieser Ansatz hat heute in der
+               Filmbranche wieder Konjunktur, um Plots automatisch herzustellen.<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#batty_slugune_2014">Batty 2014</ref>.</note> Während Formalismus und früher
+               Strukturalismus die generische Funktion von Segmenten und Sequenzen vor allem
+               texttheoretisch ausgebeutet haben,<note type="footnote"> Vgl. etwa <ref type="bibliography" target="#barthes_sequences_1971">Barthes
+                  1971</ref>.</note> sind die früheren Versuche im Zeichen des literarischen Realismus
+               für die aktuelle Forschung besonders wertvoll, weil sie noch stark auf
+               Operationalisierungen in einem hermeneutischen Rahmen ausgelegt sind. Textmerkmale
+               werden dabei nicht isoliert, sondern rezeptionsästhetisch im Hinblick auf ihre
+               kognitive Wirkung beim Lesen betrachtet, was Wolfgang Iser später als das Zusammenwirken von
+               Text- und Aktstruktur bezeichnet hat.<note type="footnote"> Vgl. <ref type="bibliography" target="#iser_akt_1976">Iser 1976</ref>, S.
+                  101–102.</note>
+            </p>
+               <p>Im <ref target="https://www.linglit.tu-darmstadt.de/institutlinglit/mitarbeitende/weitin/litla">Darmstädter LitLab</ref> sind schon seit einiger Zeit verschiedene korpusbasierte
+               Untersuchungen zu Novellen des 19. Jahrhunderts durchgeführt worden. Im
+               Sommersemester 2019 wurde erstmals eine empirische Wirkungsstudie durchgeführt, um
+               das gattungspoetisch bedeutsame Kriterium der Sequenzierbarkeit zu testen.
+               Theoretische Grundlage dafür war neben Propp die realistische Gattungspoetik, die
+               Paul Heyse in der Einleitung zum <bibl>
+                  <title type="desc">Deutschen Novellenschatz</title>
+               </bibl> 1871 formuliert hat. Sie geht davon aus, dass die zeitgenössische
+               Hochkonjunktur der Novelle mit der im literarischen Massenmarkt unvermeidlichen
+               Auseinandersetzung um die knappe Ressource Aufmerksamkeit erklärt werden kann und die
+               daraus resultierenden Eigenschaften zugleich das zentrale Merkmal darstellen, das
+               Novellen von anderen Erzähltexten unterscheidet. Eine Novelle zeichnet sich demnach
+               dadurch aus, dass sie ein handlungsleitendes ›Grundmotiv‹ besitzt, das Leser:innen in
+               die Lage versetzt, <quote>den Inhalt in wenige Zeilen zusammenzufassen</quote>. Heyse
+               fordert dazu auf, die <quote>Probe« zu machen, »ob der Versuch gelingt</quote>.<note
+                  type="footnote"> Vgl. <ref type="bibliography" target="#heyse_einleitung_1871">Heyse / Kurz 1871</ref>, S.&#x00A0;XIX.</note>
+            </p>
+            <p>Bei unserem Test kam es uns darauf an, von den insgesamt 86 Novellen der Anthologie
+               eine auszuwählen, die der Einschätzung der historischen Herausgeber nach ihre
+               Novellen-Definition gut erfüllt (den Einleitungen zufolge gab es bei der Aufnahme von
+               Texten zum Teil auch andere Rücksichten) und zugleich unter pragmatischen
+               Gesichtspunkten für ein Leseexperiment geeignet ist, vor allem was die Textlänge
+               angeht. Die Wahl fiel auf Hieronymus Lorms <bibl>
+                  <title type="desc">Ein adeliges Fräulein</title>
+               </bibl> (1867). Der Text hat ein klares Grundmotiv, das wie in den meisten Fällen als
+               Dingsymbol angelegt ist. Auf der Suche nach einem bestimmten Gemälde trifft ein
+               Kunstexperte auf die Besitzerin (Rahmenhandlung), die ihm die Geschichte des Bildes
+               erzählt (Binnenhandlung). Es stammt aus dem Geschenkfundus einer gescheiterten
+               Brautwerbung. Der Vater der adligen Titelheldin hatte sie einem vermögenden
+               Bürgerlichen versprochen, fühlt sich daran jedoch nicht mehr gebunden, als ein
+               adliger Mitbewerber auftaucht. Nachdem dieser sich jedoch als mittellos entpuppt,
+               will der Vater die ursprünglich angebahnte Ehe schließen. Obwohl das ihren
+               aufrichtigen Gefühlen entspricht, weigert sich die Tochter des gebrochenen
+               Versprechens wegen.</p>
+            <p>Unser Experiment wurde am 20. Mai 2019 in einem Hörsaal der Technischen Universität
+               Darmstadt mit 85 Proband:innen durchgeführt, die dafür eine Aufwandsentschädigung von
+               10 Euro erhielten. Den Teilnehmenden wurde neben einem Ausdruck der Novelle ein
+               Fragebogen mit fünf Rubriken vorgelegt. An Metadaten wurden neben Alter, Geschlecht
+               und Muttersprache die Lesehäufigkeit im Alltag und die Art der gelesenen Texte
+               erhoben (Nachrichten, Sachbücher, Literatur, Social Media). Außerdem wurde gefragt,
+               ob die Novelle vorab bekannt war. Im zweiten Schritt wurde darum gebeten, den Text
+               aufmerksam durchzulesen. Die drei restlichen Aufgaben wurden nach der Lektüre
+               absolviert. Wir fragten zunächst, was vom Inhalt des Textes als Erstes in den Sinn
+               kommt, dann baten wir, das Geschehen in ganzen Sätzen zusammenzufassen, wozu
+               unnummerierte Zeilenkästen vorgegeben wurden. Schließlich fragten wir nach der
+               wesentlichen Textaussage.</p>
+            <p>Bei der Studie, die aus dem Experiment hervorgehen soll, arbeiten wir mit der
+               Arbeitsgruppe ›Soziale Netzwerke‹ von Ulrik Brandes an der ETH Zürich zusammen.<note
+                  type="footnote"> Autor:innen der Studie: Thomas Weitin, Katharina Herget,
+                  Anastasia Glawion, Simon Päpcke, Ulrik Brandes.</note> Ziel der Studie ist es,
+               herauszufinden, ob sich die als Gattungsmerkmal postulierte leichte
+               Zusammenfassbarkeit der Novelle empirisch nachweisen lässt. Eine starke
+               Übereinstimmung in den Zusammenfassungen der Teilnehmenden unseres Experiments wäre
+               ein Beleg dafür. Grundlage der Auswertung sind die Transkriptionen der Fragebögen,
+               die die Studierenden des Seminars ›Empirische Textanalysen‹ im Sommersemester 2019 an
+               der Technischen Universität Darmstadt angefertigt haben. Da sich die Proband:innen
+               bei ihren Zusammenfassungen weniger klar an die von uns vorgegebenen Zeilenkästen
+               gehalten haben als erhofft, haben wir für die Auswertung jeden einzelnen Satz als
+               Segment aufgefasst. Im Pre-Processing wurden die Stoppwörter entfernt und mit Hilfe
+               der Levenshtein-Distanz<note type="footnote"> <ref type="bibliography" target="#levenshtein_codes_1966">Levenshtein 1966 [1965]</ref>.</note>
+               automatische Vereinheitlichungen vorgenommen (z. B. ›adelig‹ – ›adlig‹). Die Auswertung
+               der Daten dauert derzeit noch an. In den bisherigen Berechnungen wurde für die
+               Wortebene eines jeden Segments der <term type="dh">term frequency - inverse document
+                  frequency</term> (tf-idf)-Score ermittelt, um zu bestimmen, wie charakteristisch
+               es sich im Korpus sämtlicher Segmente ausnimmt. Auf der Basis dieser Formalisierung
+               kann die Distanz zu einer von uns selbst stammenden Muster-Zusammenfassung berechnet
+               werden. Ein erstes <term type="dh">Clustering</term> der Ergebnisse schien unter
+               Berücksichtigung unserer Metadaten die Tendenz zu zeigen, dass im Subset derjenigen
+               Proband:innen, die häufig lesen, eine größere Übereinstimmung herrscht als im Subset
+               der deutschen Muttersprachler:innen. Allerdings sind bei der Auswertung eine Reihe
+               von Schwierigkeiten aufgetaucht, die wir erst bewältigen müssen, bevor wir solchen
+               Ergebnissen Erklärungslasten aufbürden. Im Vergleich des <term type="dh"
+                  >Goldstandards</term> unserer eigenen Muster-Zusammenfassung und den
+               Zusammenfassungen der Fragebögen fiel uns auf, dass die Teilnehmenden vor allem
+               Schwierigkeiten hatten, das Verhältnis von Rahmen- und Binnenhandlung in die
+               verlangte Folge von ganzen Sätzen einzugliedern. Wir haben daher die Studierenden des
+               Seminars ›Empirische Textanalysen‹ gebeten, aus den Satzfolgen der Fragebögen eine
+               weitere Muster-Zusammenfassung zu erstellen. Wir wollen auf dieser Basis unsere
+               bisherigen Ergebnisse und den Ansatz des Experiments kritisch hinterfragen.</p>
+            </div>
+            <div type="subchapter">
+               <head>3.5 Inter-Annotator-Agreement-Parameter als Heuristik für die Segmentierung
+                  literarischer Texte</head>
+            <p>Als letztes Beispiel wird ein Segmentierungsproblem vorgestellt, das in einem
+               weiteren Projekt aus dem Bereich der <term type="dh">Computational Literary
+                  Studies</term> offensichtlich wurde. Dieses Projekt ist genauso wie der oben
+               vorgestellte Zugang zur Sequenzierung datengetrieben, hat aber im Unterschied dazu
+               eine automatisierte Textanalyse zum Ziel, die auf in der Computerlinguistik bzw. der
+               automatischen Sprachverarbeitung etablierten Verfahren zur Automatisierung basiert.
+               Ziel des noch laufenden Projektes ist die Automatisierung der Erkennung szenenhafter
+               Passagen in Prosatexten.<note type="footnote"> Vgl. dazu <ref type="bibliography" target="#gius_detection_2019">Gius et al. 2019</ref>; <ref type="bibliography" target="#zehe_scenes_2021">Zehe et
+                  al. 2021</ref>.</note> Als szenenhaft werden dabei jene Abschnitte erzählender Texte
+               verstanden, in denen die Figurenkonstellation und der Raum der Erzählung weitgehend
+               unverändert sind und die Geschehnisse chronologisch, zusammenhängend und weitgehend
+               zeitdeckend erzählt werden.<note type="footnote"> Szene wird dabei verstanden als
+                     <quote>segment of the discours (presentation) of a narrative which presents a
+                     part of the histoire (chronologically ordered, causally connected events in the
+                     narrated world) in such a way that a) time is more or less equal in discours
+                     and histoire, b) place stays – more or less – the same c) it centers around a
+                     particular action, and d) the character configuration is – again: more or less
+                     – equal</quote> (<ref type="bibliography" target="#gius_detection_2019">Gius et al. 2019</ref>, Abs. 3). Für eine weitere Diskussion und
+                        Beispiele vgl. <ref type="bibliography" target="#zehe_scenes_2021">Zehe et al. 2021</ref>.</note> Textgrundlage sind sogenannte Heftromane,
+               die in ihrer Struktur weniger komplex sind als Höhenkammliteratur und insbesondere
+               weniger Varianz aufweisen. Im skizzierten Projekt ist das Auffinden der Szenen zwar
+               das Ziel, allerdings sind diese Szenen als Vorverarbeitungsschritt für eine Reihe
+               zukünftiger computationeller Analysen angelegt. Die automatisierte Annotation
+               szenenhafter Passagen stellt nämlich eine für literaturwissenschaftliche
+               computationelle Textanalysen geeignete Segmentierung literarischer Texte zur
+               Verfügung.</p>
+            <p>Im ›Szenen-Projekt‹ wird ein für viele Analyseansätze in den Computational Literary
+               Studies typischer Zugang umgesetzt: Als <term type="dh">Input</term> für die
+               Automatisierung der Analyse literarischer Texte werden sogenannte <term type="dh"
+                  >Golddaten</term> bzw. ein sogenannter Goldstandard erstellt. Dafür annotieren
+               mehrere Annotator:innen anhand von Annotationsrichtlinien dieselben Texte. Auf Basis
+               der so erstellten Daten – also der Texte und ihrer Annotationen – wird dann an der
+               Automatisierung der Erkennung der annotierten Phänomene gearbeitet. Diese Praxis ist
+               für die ansonsten mit exemplarischen Textstellen in Definitionen und Analysen
+               arbeitende Literaturwissenschaft ungewöhnlich. In der literaturwissenschaftlichen
+               Textanalyse werden traditionell nur einzelne Textstellen genutzt – um sie als
+               besonders typische Textpassagen zu analysieren oder um die Definition von Phänomenen
+               an ihnen zu veranschaulichen. Dahinter steht zumindest implizit eine behauptete
+               Exemplarität und damit Repräsentativität der ausgewählten Beispiele.</p>
+            <p>Während in der Literaturwissenschaft also die Repräsentativität durch die
+               Feststellung von Expert:innen gewährleistet wird, nähert man sich in
+               Automatisierungszugängen einer Repräsentativität an, indem man mit einer großen
+               Anzahl an Beispielen arbeitet und außerdem Annotationen mehrfach anfertigt, welche
+               anschließend in eine konsolidierte Annotation im Sinne des Goldstandards überführt
+               werden. Im computationellen Zugang ist die Repräsentativität der genutzten
+               Textstellen fundamental, da aus diesen Textstellen zum Teil unüberwacht gelernt wird
+               und entsprechend nach der Annotation keine weiteren menschlichen Analysen in den
+               Prozess mit einfließen. Der literaturwissenschaftliche Umgang mit Beispielen und der
+               Zugang zu Annotationen im Bereich der computationellen Literaturwissenschaft
+               unterscheiden sich damit recht deutlich. Will man jedoch sicherstellen, dass ein
+               Annotationsverfahren im Kontext von Automatisierungsaufgaben auch
+               literaturwissenschaftlich adäquat ist, so muss man sich fragen, inwiefern ein
+               Goldstandard auch eine literaturwissenschaftlich gute Textanalyse abbildet bzw.
+               abbilden kann. </p>
+            <p>Eine naheliegende Begründung der Adäquatheit ist, dass in den Annotationen, die zur
+               Erstellung des Goldstandards genutzt werden, intersubjektiv gültige Analysen der
+               entsprechenden Textpassagen abgebildet werden. In der Literaturwissenschaft wird
+               nämlich Intersubjektivität, also die Übereinstimmung mehrerer Subjekte in Bezug auf
+               Urteile über literarische Texte, als geeignete Alternative zu einer – als nicht
+               vorhanden bzw. zugänglich angenommenen – Realität oder objektiven Wahrheit
+               betrachtet. Um wissenschaftlich zu sein, müssen literaturwissenschaftliche Befunde
+               demnach eine <quote>prinzipielle intersubjektive Vermittelbarkeit – einen <hi
+                     rend="italic">›sensus communis‹</hi> [als von Kant für Geschmacksurteile
+                  angenommene Basis]</quote> aufweisen.<note type="footnote"> Vgl. 
+                     <ref type="bibliography" target="#stoeckmann_aesthetik_2013">Stöckmann 2013</ref>,
+                  S.&#x00A0;475.</note> Literaturwissenschaftliche Analyse hat die Aufgabe, vorerst ohne
+               Wertung <quote>die Feststellung von allgemein beobachtbaren und intersubjektiv
+                  anerkennbaren Eigenheiten bestimmter Texte zu fixieren</quote><note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>, S.&#x00A0;447.</note>, wobei
+               Ansätze wie die systemtheoretische oder die strukturalistische Literaturwissenschaft
+                  <quote>die Möglichkeit rationaler, intersubjektiver Analysierbarkeit und
+                  Theoriebildung auch gegenüber Objekten wie der Literatur</quote> postulieren.<note
+                     type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>, S.&#x00A0;535.</note> Das bedeutet
+               insbesondere, dass sie <quote>prinzipiell explizierbare, rationale, intersubjektiv
+                  diskutierbare Methodologien und Theoriebildungen für den Objektbereich der
+                  Literaturwissenschaft</quote> anstreben.<note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al.
+                  (Hg.) 1997–2003</ref>, S.&#x00A0;536.</note>
+            </p>
+            <p>Vor diesem Hintergrund erscheinen <term type="dh"
+                  >Inter-Annotator-Agreement-Maße</term> (IAA-Maße), die den Grad der
+               Übereinstimmung zwischen Annotationen angeben, als Möglichkeit, um
+               Intersubjektivität zu messen. Die Tatsache, dass bei typischen Annotationsaufgaben
+               der Sprachverarbeitung wie etwa der <term type="dh">Part-of-Speech-Bestimmung</term>
+               Übereinstimmungen von über 95 % durchaus möglich sind, eine solche hohe
+               Übereinstimmung bei komplexeren Textphänomenen aber nicht erreicht werden kann,
+               spricht ebenfalls dafür, dass IAA-Maße Intersubjektivität abbilden können.</p>
+            <p>Nun war es aber so, dass im ›Szenen-Projekt‹ Szenengrenzen aus
+               literaturwissenschaftlicher Sicht erstaunlich übereinstimmend annotiert wurden,
+               dieser Umstand sich aber nicht in einem entsprechend hohen IAA-Maß niederschlug.
+               Damit scheint der angenommene Zusammenhang zwischen dem Maß der Übereinstimmung
+               zwischen zwei Annotator:innen und dem Grad der intersubjektiven Gültigkeit ihrer
+               Analysen fraglich. Dies könnte auch daran liegen, dass IAA-Maße für sehr
+               unterschiedliche Zwecke genutzt werden und diese nicht immer einen Bezug zu
+               Intersubjektivität haben – etwa wenn sie eingesetzt werden, um die Konsistenz von
+               Annotationen einzelner Annotator:innen zu überprüfen, die Qualität von Guidelines zu
+               evaluieren oder Automatisierungsverfahren zu bewerten.<note type="footnote"> Vgl.
+                  dazu auch <ref type="bibliography" target="#gius_agreement_2022">Gius / Vauth 2022</ref>.</note>
+               <note type="footnote"> In der Computerlinguistik wird zum Teil auch keine
+                  Unterscheidung zwischen Intersubjektivität und Objektivität gemacht. So wird bei
+                  der Anwendung von IAA-Maßen für die Evaluation von Algorithmen nicht
+                  problematisiert, dass auch ein Goldstandard keine objektive Tatsache ist, sondern
+                  eben intersubjektiv erstellt. Pevzner und Hearst weisen zum Beispiel zwar auf das
+                  Problem der Bestimmung von Segmentgrenzen bzw. der Referenz für die Bewertung von
+                  Segmentierungsalgorithmen hin – <quote>human judges do not always agree where
+                     boundaries should be placed and how fine-grained an analysis should be</quote>.
+                  Der folgende Verweis auf eine der praktizierten Lösungen – <quote>others have
+                     several human judges make ratings to produce a ›gold standard‹</quote> wird
+                  dann gemacht, ohne zu thematisieren, dass diese gegebenenfalls anhand derselben
+                  Maße gemessen wird (vgl. <ref type="bibliography" target="#pevzner_critique_2002">Pevzner / Hearst 2002</ref>, S.&#x00A0;2).</note> Konzentriert man
+               sich aber auf die Messung von Übereinstimmung verschiedener Annotator:innen, also auf
+               den Aspekt, der literaturwissenschaftlich als Intersubjektivität gefasst werden kann,
+               müssen für die Erklärung der schlechten IAA-Werte im ›Szenen-Projekt‹ die in den
+               IAA-Metriken abgebildeten Prinzipien betrachtet werden. IAA-Metriken beinhalten sehr
+               differenzierte Berechnungen, die für eine gewisse Vergleichbarkeit der berechneten
+               Werte sorgen sollen. Diese Berechnung im Hinblick auf Vergleichbarkeit kann man
+               entsprechend als eine Operationalisierung von Intersubjektivität auffassen, anhand
+               derer man die oben geforderte literaturwissenschaftlich adäquate Umsetzung von
+               Annotationsverfahren bzw. des Goldstandards erreichen könnte. Für die Wahl einer
+               geeigneten IAA-Metrik muss deshalb die jeweilige Operationalisierung von
+               Vergleichbarkeit oder Übereinstimmung der IAA-Metrik – in Form von (Nicht-)Einbezug
+               der erwarteten Übereinstimmung, Gewichtung der Nicht-Übereinstimmung in Abhängigkeit
+               der betroffenen Kategorien usw. – berücksichtigt und gegebenenfalls geeignete
+               Einstellungen der zur Verfügung gestellten Parameter gefunden werden.<note
+                  type="footnote"> Für eine zusammenfassende Darstellung der gängigen
+                  Koeffizienten-Berechnungen vgl. <ref type="bibliography" target="#artstein_agreement_2008">Artstein / Poesio 2008</ref>, S.&#x00A0;560–570, sowie den
+                  aktuellen Überblick von <ref type="bibliography" target="#reiter_messverfahren_2022">Reiter / Konle 2022</ref>.</note> Im Fall des ›Szenen-Projekts‹
+               hat sich bei der Beschäftigung mit der Vergleichbarkeit von IAA-Werten und
+               Wahrnehmung der intersubjektiven Übereinstimmung neben dem Testen verschiedener
+               Parametrisierungen schnell herausgestellt, dass die gewählte IAA-Metrik
+               berücksichtigen muss, dass es sich um eine sogenannte Segmentierungsaufgabe handelt.
+               Während etwa eine Part-of-Speech-Annotation auf vorausgewählten Segmenten (nämlich
+               Wörtern) stattfindet, müssen Annotator:innen bei Segmentannotationen wie den oben
+               beschriebenen Textpraktiken<note type="footnote"> Vgl. <ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>; <ref type="bibliography" target="#teufel_zoning_1999">Teufel
+                  1999</ref>.</note> die zu annotierende Textspanne selbst auswählen. Nutzt man für die
+               Evaluation der manuellen Annotationen klassische IAA-Metriken wie Fleiss’ <term
+                  type="dh">π</term>,<note type="footnote"> Vgl. <ref type="bibliography" target="#fleiss_scale_1971">Fleiss 1971</ref>.</note> Cohens <term type="dh">κ</term><note type="footnote"> Vgl. <ref type="bibliography" target="#cohen_agreement_1960">Cohen 1960</ref>.</note> oder Krippendorffs <term type="dh"
+                  >α</term><note type="footnote">Vgl. <ref type="bibliography" target="#krippendorff_content_1980">Krippendorff 1980</ref>; <ref type="bibliography" target="#krippendorff_reliability_2004">Krippendorff 2004</ref>. </note>, so erhält man meist schlechte Werte, weil diese Metriken nicht
+               berücksichtigen, dass die zu annotierenden Texteinheiten nicht vorgegeben sind.
+               Deshalb wurden für die Annotation von Segmenten eigene Metriken entwickelt.<note
+                  type="footnote"> Gängige IAA-Metriken für Segmentierung sind Pk (<ref type="bibliography" target="#beeferman_text_1997">Beeferman et al.
+                     1997</ref>), WindowDiff (<ref type="bibliography" target="#pevzner_critique_2002">Pevzner / Hearst 2002</ref>; 
+                  <ref type="bibliography" target="#lamprier_evaluation_2007">Lamprier et al. 2007</ref>), GHD (<ref type="bibliography" target="#bestgen_indice_2009">Bestgen
+                     2009</ref>), Boundary Edit Distance (<ref type="bibliography" target="#fournier_segmentation_2012">Fournier / Inkpen 2012</ref>), Boundary Similarity (B)
+                  (<ref type="bibliography" target="#fournier_text_2013">Fournier 2013</ref>) und γ 
+                  (<ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>). Für eine Diskussion der Metriken bis
+                  2009 vgl. <ref type="bibliography" target="#fournier_text_2013">Fournier 2013</ref>; 
+                  <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>.</note> Mathet et al. geben einen
+               Überblick über einige Segmentierungsmetriken und schlagen für die Darstellung
+               bestehender Metriken und die Entwicklung ihres eigenen Vorschlags <term type="dh"
+                  >γ</term> sechs Parameter vor, die Segmentierungsmetriken berücksichtigen
+               sollten.<note type="footnote"> Vgl. <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>.</note> Diese
+               berücksichtigen, dass eine Annotationsaufgabe (i) die Zuweisung von Kategorien (<term
+                  type="dh">Categorization</term>) und / oder (ii) die Bestimmung von Texteinheiten
+                  (<term type="dh">Unitizing</term>) beinhalten kann, die zu annotierenden
+               Textphänomene im Text (iii) ineinander verschachtelt (<term type="dh"
+                  >Embedding</term>) oder (iv) sich anderweitig überlappend (<term type="dh">Free
+                  Overlap</term>) vorkommen können sowie (v) nicht durchgehend vorhanden sein müssen
+                  (<term type="dh">Sporadicity</term>) und außerdem (vi) zwei aufeinanderfolgende
+               Einheiten gegebenenfalls zu einer zusammengefasst werden können (<term type="dh"
+                  >Aggregatable</term>).<note type="footnote"> Vgl. <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>, S.
+                  440.</note> Damit wird deutlich, wie wichtig die Wahl einer zur Annotationsaufgabe
+               passenden IAA-Metrik ist – ein Umstand, der zumindest in der computationellen
+               Literaturwissenschaft nur selten reflektiert wird. Die sechs Kategorien von Mathet et
+               al. sind aber auch jenseits von Annotation und Automatisierung für die Arbeit mit
+               literaturwissenschaftlichen Phänomenen hilfreich, da sie die Schärfung der genutzten
+               Analysekonzepte unterstützen. Im Folgenden wird eine Auseinandersetzung mit diesen
+               Kategorien anhand des Szenenkonzepts und der dort bestehenden Rahmenbedingungen
+               skizziert.</p>
+               <p>Die <term type="dh">Categorization</term> ist grundlegend für jede Textanalyse: Man möchte dem Text bzw.
+               seinen Teilen Kategorien zuweisen, die die analysierten Phänomene benennen. Selbst in
+               dem diesbezüglich einfachen Fall im ›Szenen-Projekt‹, das nur auf einer Kategorie,
+               nämlich ›Szene‹, aufbaut, kann man von der Zuweisung von zwei Kategorien ausgehen, da
+               in der Annotation zwischen szenenhaften Passagen und nichtszenenhaften Textteilen
+               unterschieden wird. Problematisch ist in solchen Fällen aber fast immer das
+                  <term type="dh">Unitizing</term>, welches die Segmentierung des Textes betrifft
+               und das, wie bereits erläutert, in der Literaturwissenschaft nur bedingt
+               standardisiert ist. Im ›Szenen-Projekt‹ wurde diskutiert, ob die oben besprochene
+               grundlegende Diskurseinheit Satz als Basiseinheit gewählt werden soll oder eine
+               größere, wie etwa der Absatz. Aufgrund der absehbaren Probleme bei der Bestimmung von
+               Absätzen in Rohtexten wurde eine satzbasierte Annotation gewählt, wobei eine Szene
+               normalerweise eine ganze Reihe von Sätzen umfasst. Diese vermeintlich triviale, durch
+               technische Einschränkungen motivierte Entscheidung hat aber auch konzeptuelle
+               Konsequenzen, da sie die Granularität des Szenenbegriffs beeinflusst. Eine
+               zusätzliche Annäherung an Segmentgrößen in Form der Angabe des typischen Textumfangs,
+               den ein Phänomen umfasst, hat sich außerdem als hilfreiche Heuristik
+               herausgestellt.<note type="footnote"> Vgl. <ref type="bibliography" target="#gius_narration_2016">Gius 2016</ref>, S.&#x00A0;12.</note>
+            </p>
+            <table>
+               <row>
+                  <cell/>
+                  <cell>
+                     <hi rend="italic">Szene als Textphänomen</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="italic">Operationalisierung von Szene</hi>
+                  </cell>
+                  <cell>
+                     <hi rend="italic">Schwierigkeit</hi>
+                  </cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Categorization</hi>
+                  </cell>
+                  <cell>X</cell>
+                  <cell>X</cell>
+                  <cell>– (ist Voraussetzung für Textanalyse) </cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Unitizing</hi>
+                  </cell>
+                  <cell>X</cell>
+                  <cell>X</cell>
+                  <cell>literaturwissenschaftliche Grundlage fehlt</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Embedding</hi>
+                  </cell>
+                  <cell>X</cell>
+                  <cell>-</cell>
+                  <cell>zur Vereinfachung der Annotationsaufgabe nicht berücksichtigt</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Free Overlap</hi>
+                  </cell>
+                  <cell>-</cell>
+                  <cell>-</cell>
+                  <cell>–</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Sporadicity</hi>
+                  </cell>
+                  <cell>X</cell>
+                  <cell>X</cell>
+                  <cell>erschwert die Annotationsaufgabe</cell>
+               </row>
+               <row>
+                  <cell>
+                     <hi rend="bold">Aggregatable</hi>
+                  </cell>
+                  <cell>x</cell>
+                  <cell>?</cell>
+                  <cell>nicht generalisierbar</cell>
+               </row>
+               <trailer xml:id="tab04">
+                  <ref type="intern" target="#tab4">Tab. 4</ref>: Parameter von <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref> angewendet auf Szenen (Phänomen
+                  und Operationalisierung in den Guidelines).<ref type="graphic" target="#segment_t4"/>
+               </trailer>
+            </table>
+            
+               <p>Die Frage, ob Phänomene verschachtelt (<term type="dh">Embedding</term>) oder sich anderweitig überlappend
+                  (<term type="dh">Free Overlap</term>) auftreten können, ist wiederum verbunden mit
+               ihrer Definition. Können die Phänomene in eine Begriffstaxonomie eingeordnet werden,
+               die hierarchisch organisiert ist oder auch darüber hinausgehende, nicht hierarchische
+               Verbindungen zwischen den Kategorien aufweist? Dazu gehört auch die Frage
+               von über- und untergeordneten Phänomen, in die die Untersuchungsbegriffe
+               gegebenenfalls aufgeteilt werden können. Für Szenen kann man annehmen, dass sie
+               verschachtelt auftreten können, da sie – ähnlich wie Erzählebenen – von anderen
+               Szenen unterbrochen und anschließend weitergeführt werden können. Nicht zuletzt
+               aufgrund der relativ wenig komplexen Handlungsabläufe in den untersuchten Heftromanen
+               haben wir auf Verschachtelungen verzichtet. Diese Entscheidung war zusätzlich dadurch
+               motiviert, dass eine hierarchische Szenenstruktur für das maschinelle Lernen eine
+               ungleich größere Herausforderung bedeutet. Unabhängig von der Entscheidung für oder
+               gegen Verschachtelung und Überschneidung muss geprüft werden, welche Konsequenzen die
+               jeweilige Ausprägung für die Analysekonzepte hat. Die daraus resultierende Taxonomie
+               führt nämlich dazu, dass die genutzten Phänomene sich gegenseitig ausschließen, über-
+               oder unterordnen etc. – oder eben nicht. </p>
+               <p>Die Frage nach der durchgehenden Präsenz von Phänomenen im Text (<term type="dh">Sporadicity</term>)
+               betrifft u. a. das Textkonzept. Ausschlaggebend ist hier, inwiefern die untersuchten
+               Phänomene als für Texte konstitutiv und ob Texte gegebenenfalls als noch aus weiteren
+               Phänomenen zusammengesetzt gesehen werden. Für die Szenenanalyse kann man davon
+               ausgehen, dass es Textabschnitte gibt, die nicht als Szenen gelten sollten. Dies
+               liegt daran, dass das Zeitkriterium – im Gegensatz zu den Kriterien Wechsel von Raum,
+               Figuren oder Handlung – nicht für einen Wechsel, sondern für die Szenenhaftigkeit an
+               sich steht und entsprechend Abschnitte, die es nicht erfüllen, nicht szenenhaft sind.
+               Im Gegensatz dazu gehen etwa die meisten Konzepte von Erzählebenen davon aus, dass
+               jeder Abschnitt eines Textes (mindestens) einer Erzählebene zugeordnet werden kann.
+               Dies ist in der Analysepraxis der einfachere Fall. Das Erkennen von Nicht-Szenen hat
+               sich nämlich als durchaus problematisch erwiesen, da das zugrunde liegende Kriterium,
+               wie in der Textanalyse häufig, graduell ist.</p>
+               <p>Schließlich ist die Frage der Aggregierbarkeit (<term type="dh">Aggregatable</term>) im Falle der Szenen
+               problematisch. Während direkt aufeinanderfolgende Szenen potenziell zu einer
+               einzelnen Szene zusammengefasst werden können, wenn man die Szenen als kleinere
+               Unterteilungen einer großen Szene interpretieren kann, sollten aufeinanderfolgende
+               Szenen, die sich sehr deutlich in Raum, Zeit, Figuren oder Handlung unterscheiden,
+               nicht zu einer längeren Szene zusammengefasst werden. An dieser Stelle wird
+               offensichtlich, dass die aufgrund der damit verbundenen Probleme nicht vorgenommene
+               Vorsegmentierung der Texte nun ihrerseits zu Problemen führt. </p>
+            <p>Auch wenn die sechs vorgestellten Parameter für Analysen der Übereinstimmung von
+               Annotationen auf der Textoberfläche vorgeschlagen werden, soll die Darstellung der
+               einzelnen Punkte zeigen, dass sie eine darüber hinausgehende Relevanz für die
+               literaturwissenschaftliche Beschreibung und Definition von Textphänomenen haben. Ihre
+               Explizierung kann erheblich zur intersubjektiven Verständlichkeit von Phänomenen und
+               ihren Definitionen beitragen. Auch die aufgezeigten Zusammenhänge zwischen den
+               Parametern können bei der Entwicklung intersubjektiv besser nachvollziehbarer und
+               damit stabilerer Definitionen nützlich sein. </p>
+            </div>
+            </div>
+            <div type="chapter">
+               <head>4. Sinn und Segment</head>
+            <p>Die in diesem Beitrag diskutierten Aspekte von Segmentierung reichen von der
+               Layoutanalyse über die Identifizierung lexikalischer Mehrwortausdrücke, die
+               Auseinandersetzung mit heuristischen Textpraktiken und die Frage nach der
+               Sequenzierbarkeit von Novellen bis hin zu Segmenten als intersubjektiv
+               identifizierbare Einheiten in Prosatexten. Segmentierung wurde also im Kontext
+               (zumindest scheinbar) standardisierter Segmentierungspraktiken wie dem <term type="dh">Unitizing</term>, der
+               Tokenisierung oder der Bestimmung von Diskurs- und Layouteinheiten, aber auch iin Bezug auf den Zugang zu nicht ohne Weiteres linguistisch und / oder am Schriftbild bzw. Layout bestimmbaren Segmentkonzepten diskutiert. Die Bandbreite der Ansätze deckt
+               damit weite Teile der philologischen Analysepraxis ab und verdeutlicht, dass
+               Segmentierung im philologischen Kontext wesentliche Konsequenzen hat. Das gilt
+               unabhängig davon, ob im Forschungszugang die Bestimmung der Segmente im Zentrum steht
+               oder auf Segmentierung aufbauende Forschung betrieben wird. Für alle Zugänge lässt
+               sich beobachten: Für eine geeignete Segmentierung des Untersuchungsgegenstands muss
+               das relevante Wissen zu theoretischen Konzepten mit der Gestaltung des
+               Analyseprozesses und Eigenschaften des untersuchten Mediums in Einklang gebracht
+               werden. Segmentierung kann man entsprechend als eine Art Vorverarbeitung des zu
+               analysierenden Textmaterials sehen, während erst das Ergebnis der darauf aufbauenden
+               Analyse und Interpretation als die anvisierte Erkenntnis betrachtet werden kann.
+               Aufgrund der skizzierten Zusammenhänge besteht allerdings eine Interaktion von
+               Vorverarbeitung und Analyse, die zu einer Kreisbewegung führt. Entsprechend fehlt der
+               gesamten Tätigkeit ein offensichtlicher Anfangspunkt. Die epistemische – oder auch
+               hermeneutische – Zwickmühle wird hier schnell offensichtlich: Vorverarbeitung und
+               Analyse sollten getrennt stattfinden, aber wir können nicht interpretieren, ohne zu
+               segmentieren, und wir können nicht segmentieren, ohne zu interpretieren.
+               Wünschenswert ist daher in erster Linie die Transparenz der Methoden und ihres
+               Ineinandergreifens bzw. die konsequente Reflexion und Explizierung des
+               Forschungsprozesses. </p>
+            <p>Dies gilt für Segmentierung unabhängig vom digitalen Zugang. Wie jede
+               Textanalyseaufgabe ist auch Segmentierung nicht trivial oder zumindest ist die
+               Aufgabe in vielen Fällen nicht eindeutig lösbar. Im analogen Analysemodus können und
+               werden diese Unbestimmtheiten allerdings regelmäßig nicht expliziert, jedenfalls aber
+               häufig hingenommen. Der digitale Zugang wirkt hingegen – wie bei jeder anderen
+               Textanalyseaufgabe – problemverstärkend. Die Bestimmung von für eine Analyse
+               adäquaten Textsegmenten wird in digitalen Zugängen dadurch erschwert, dass diese den
+               Zwang des Diskreten mit sich bringen. Die Operationalisierung der Segmentierung
+               resultiert in binären Entscheidungen – etwas ist ein Segment oder nicht. Hier liegt
+               der wesentliche Unterschied zwischen digitalen und analogen Zugängen: Der digitale
+               Zugang erzwingt gewissermaßen die Offenlegung von Segmentierungsentscheidungen und
+               fördert stark die Festlegung und Explizierung von Kriterien für diese Entscheidungen.
+               Die algorithmische Formulierung sowie deren Implementierung als eindeutige und
+               diskrete Segmentierungsentscheidung schärft damit unsere Begriffe.</p>
+            <p>Die diskutierten Segmentierungsprobleme verdeutlichen außerdem, dass
+               Segmentierungsentscheidungen den Forschungsprozess wesentlich beeinflussen. Dieser
+               Zusammenhang ist ebenfalls unabhängig vom digitalen Zugang, allerdings wird er durch
+               diesen leichter offensichtlich. So wird die Menge der Untersuchungseinheiten sowie
+               deren Granularität durch die Segmentierungsentscheidungen bestimmt. Man kann auch
+               sagen: Nur was als Segment einer Analyseebene identifiziert und segmentiert wird,
+               wird auch analysiert; aber auch: Was analysiert werden soll, also Gegenstand der
+               Untersuchung sein soll, muss auch segmentiert, also als diskrete Einheit
+               identifiziert werden (können). Hinzu kommt: Aufgrund der beschriebenen Interaktion
+               von Segmentierung und Interpretation werden – unabhängig vom digitalen Zugang –
+               bereits im Korpusaufbau Segmentierungsentscheidungen getroffen, die sich auf die
+               späteren Ergebnisse auswirken. Im automatisierten Zugang wird es insbesondere dann
+               problematisch, wenn die für die ursprüngliche Segmentbestimmung relevanten
+               Unsicherheiten und Entscheidungen nicht mehr ohne Weiteres zugänglich oder aufgrund
+               ihrer schieren Menge nicht mehr erfassbar sind.</p>
+               </div>
+               <div type="bibliography">
+                  <head>Bibliografische Angaben</head>
+                  <listBibl>
+            <bibl xml:id="adler_philologie_2020">Marc Adler / Sabine Bartsch / Maria Becker / Michael Bender / Luise Borek / Cindy
+               Brinkmann / Friedrich Michael Dimpel / Rotraut Fischer / Anastasia Glawion / Svenja
+               A. Gülden / Canan Hastik / Philipp Hegel / Katharina Herget / Franziska Horn / Celia
+               Krause / Marcus Müller / Alexandra Núñez / Andrea Rapp / Lisa Scharrer / Oliver
+               Schmid / Jörn Stegmeier / Beate Thull / Thomas Weitin: Digitale Philologie: Das
+               Darmstädter Modell. 
+               Darmstadt 2020. (=&#x00A0;Digital Philology. Working Papers in Digital Philology, 1). DOI: <ref target="https://doi.org/10.25534/tuprints-00012476"
+                  >10.25534/tuprints-00012476</ref></bibl>
+                     <bibl xml:id="angehrn_sinn_2010">Emil Angehrn: Sinn und Nicht-Sinn. Das Verstehen des Menschen. Tübingen 2010. (=&#x00A0;Philosophische
+                        Untersuchungen, 25). <ptr type="gbv" cRef="618811168"/></bibl>
+            <bibl xml:id="anz_textwelten_2013">Thomas Anz: Textwelten. In: Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3
+               Bde. Stuttgart 2013. Bd. 1: Gegenstände und Grundbegriffe, S.&#x00A0;111–130. <ptr type="gbv" cRef="766534278"/></bibl>
+            <bibl xml:id="artstein_agreement_2008">Ron Artstein / Massimo Poesio: Inter-Coder Agreement for Computational
+               Linguistics. In: Computational Linguistics 34 (2008), H. 4, S.&#x00A0;555–596. DOI: <ref
+                  target="http://dx.doi.org/10.1162/coli.07-034-R2">10.1162/coli.07-034-R2</ref> <ptr type="gbv" cRef="130396419"/></bibl>
+            <bibl xml:id="barthes_sequences_1971">Roland Barthes: Action Sequences. In: Patterns of Literary Style. Hg. von Joseph
+               Strelka. University Park, PA u. a. 1971, S.&#x00A0;5–14. (=&#x00A0;Yearbook of Comparative Criticism, 3). <ptr type="gbv" cRef="1601196733"/></bibl>
+            <bibl xml:id="batty_slugune_2014">Craig Batty: ›Show Me Your Slugune and I'll Let You Have the Firstlook‹: Some
+               Thoughts on Today’s Digital Screenwriting Tools and Aprs. In: Media International
+               Australia 153 (2014), H. 1, S.&#x00A0;118–127. DOI: 10.1177/1329878X1415300114 <ptr type="gbv" cRef="191054135"/></bibl>
+            <bibl xml:id="bartsch_properties_2004">Sabine Bartsch: Structural and Functional Properties of Collocations in English. A
+               Corpus Study of Lexical and Pragmatic Constraints in Lexical Co-occurrence. Tübingen
+               2004. <ptr type="gbv" cRef="361068964"/></bibl>
+            <bibl xml:id="bartsch_notion_2014">Sabine Bartsch / Stefan Evert: Towards a Firthian Notion of Collocation. In:
+               Vernetzungsstrategien, Zugriffsstrukturen und automatisch ermittelte Angaben in
+               Internetwörterbüchern. Hg. von Andrea Abel / Lothar Lemnitzer. Mannheim 2014, S.&#x00A0;48–61. (=&#x00A0;OPAL - Online
+               publizierte Arbeiten zur Linguistik, 2014.2). URN: <ref
+                  target="https://nbn-resolving.org/urn:nbn:de:bsz:mh39-24029"
+                  >urn:nbn:de:bsz:mh39-24029</ref>
+            </bibl>
+            <bibl xml:id="becker_heuristic_2020">Maria Becker / Michael Bender / Marcus Müller: Classifying Heuristic Textual
+               Practices in Academic Discourse. A Deep Learning Approach to Pragmatics. In:
+               International Journal of Corpus Linguistics 25 (2020), H. 4, S.&#x00A0;426–460. 11.11.2020.
+               DOI: 10.1075/ijcl.19097.bec <ptr type="gbv" cRef="215035194"/></bibl>
+            <bibl xml:id="beeferman_text_1997">Doug Beeferman / Adam Berger / John Lafferty: Text Segmentation Using Exponential
+               Models. In: Proceedings of the 2nd Conference on Empirical Methods in Natural
+               Language Processing. (EMNLP: 2, Providence, 01.–02.08.1997). Somerset, NJ u. a. 1997,
+               S.&#x00A0;35–46. [<ref target="https://aclanthology.org/W97-0304">online</ref>] <ptr type="gbv" cRef="1162143851"/></bibl>
+            <bibl xml:id="beisswenger_empirist_2016">Michael Beißwenger / Sabine Bartsch / Stefan Evert / Kay-Michael Würzner: EmpiriST
+               2015: A Shared Task on the Automatic Linguistic Annotation of Computer-mediated
+               Communication and Web Corpora. In: Proceedings of the 10th Web as Corpus Workshop and
+               the EmpiriST Shared Task. Hg. von Association for Computational Linguistics. (WAC-X:
+               10, Berlin, 12.08.2016). Stroudsburg, PA 2016, S.&#x00A0;44–56. DOI: <ref
+                  target="https://doi.org/10.18653/v1/W16-2606">10.18653/v1/W16-2606</ref>
+            </bibl>
+            <bibl xml:id="bender_textpraktiken_2020">Michael Bender / Marcus Müller: Heuristische Textpraktiken. Eine kollaborative
+               Annotationsstudie zum akademischen Diskurs. In: Zeitschrift für Germanistische
+               Linguistik 48 (2020), H. 1, S.&#x00A0;1–46. DOI: <ref
+                  target="https://doi.org/10.1515/zgl-2020-0001">10.1515/zgl-2020-0001</ref>
+               <ptr type="gbv" cRef="129095605"/></bibl>
+            <bibl xml:id="bestgen_indice_2009">Yves Bestgen: Quel indice pour mesurer l’efficacité en segmentation de textes? In:
+               Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles.
+               Articles longs. Hg. von Adeline Nazarenko / Thierry Poibeau. Senlis 2009, S.&#x00A0;171–180.
+                  [<ref target="https://aclanthology.org/2009.jeptalnrecital-long.18"
+               >online</ref>]</bibl>
+            <bibl xml:id="bullin_bildsuche_2020">Martin Bullin / Andreas Henrich: Die inhaltsbasierte Bildsuche und
+               Bilderschließung. Ansätze und Problemfelder. In: Bilddaten in den digitalen
+                  Geisteswissenschaften<hi rend="italic">.</hi> Hg. von Canan Hastik / Philipp
+               Hegel. Wiesbaden 2020, S.&#x00A0;11–33 (=&#x00A0;Episteme in Bewegung, 16). DOI: <ref
+                  target="https://www.doi.org/10.13173/9783447114608">10.13173/9783447114608</ref>
+               <ptr type="gbv" cRef="1734711329"/></bibl>
+            <bibl xml:id="cohen_agreement_1960">Jacob Cohen: A Coefficient of Agreement for Nominal Scales. In: Educational and
+               Psychological Measurement 20 (1960), H. 1, S.&#x00A0;37–46. DOI: <ref
+                  target="https://doi.org/10.1177/001316446002000104"
+                  >10.1177/001316446002000104</ref> <ptr type="gbv" cRef="129492906"/></bibl>
+            <bibl xml:id="dieleman_hinweise_2016">Owen Dieleman: Hinweise für die Entwicklung von Verfahren zur
+               maßnahmenartübergreifenden Dringlichkeitsbewertung von Straßenbaumaßnahmen. Darmstadt 2016. (=&#x00A0;Schriftenreihe des Instituts für Verkehr, Darmstadt, Technische Universität
+               Darmstadt, 34). [<ref
+                  target="https://tuprints.ulb.tu-darmstadt.de/id/eprint/5570">online</ref>]
+               <ptr type="gbv" cRef="483304484"/></bibl>
+            <bibl xml:id="evert_corpora_2008">Stefan Evert: Corpora and Collocations. In: Corpus Linguistics: An International
+               Handbook. Hg. von Anke Lüdeling / Merja Kytö. 2. Bde. Berlin u. a. 2008. Bd. 2, S.&#x00A0;1212-1248. (=&#x00A0;Handbooks of Linguistics and
+               Communication Science, 29). DOI:
+               10.1515/9783110213881.2.1212</bibl>
+            <bibl xml:id="firth_papers_1964">John Rupert Firth: Papers in Linguistics 1934–1951. London u. a. 1964 [1957]. URN:
+               <ref target="https://archive.org/search.php?query=external-identifier%3A%22urn%3Aoclc%3Arecord%3A1150956406%22">urn:oclc:record:1150956406</ref> <ptr type="gbv" cRef="253298466"/></bibl>
+                     <bibl xml:id="firth_selected_1968">John Rupert Firth: Selected Papers of J. R. Firth. 1952–59. Hg. von Frank Robert Palmer. London 1968. <ptr type="gbv" cRef="196465206"/></bibl>
+            <bibl xml:id="fleiss_scale_1971">Joseph L. Fleiss: Measuring Nominal Scale Agreement among Many Raters. In:
+               Psychological Bulletin 76 (1971), H. 5, S.&#x00A0;378–382. DOI: 10.1037/h0031619 <ptr type="gbv" cRef="129067016"/></bibl>
+            <bibl xml:id="fournier_text_2013">Chris Fournier: Evaluating Text Segmentation Using Boundary Edit Distance. In:
+               Proceedings of the 51st Annual Meeting of the Association for Computational
+               Linguistics. Long Papers. Hg. von Hinrich Schuetze / Pascale Fung / Massimo Poesio.
+               (ACL 51: Sofia, 04.–09.08.2013). Stroudsburg, PA 2013, S.&#x00A0;1702–1712. PDF. [<ref
+                  target="https://www.aclweb.org/anthology/P13-1167">online</ref>] 
+            </bibl>
+            <bibl xml:id="fournier_segmentation_2012">Chris Fournier / Diana Inkpen: Segmentation Similarity and Agreement. In:
+               Proceedings of the 2012 Conference of the North American Chapter of the Association
+               for Computational Linguistics: Human Language Technologies. Hg. von Eric
+               Fosler-Lussier / Ellen Riloff / Srinivas Bangalore. (NAACL: Montréal,
+               03.–08.06.2012). Stroudsburg, PA 2012, S.&#x00A0;152–161. [<ref
+                  target="https://www.aclweb.org/anthology/N12-1016">online</ref>] <ptr type="gbv" cRef="736086943"/></bibl>
+            <bibl xml:id="fricke_reallexikon_1997">Reallexikon der deutschen Literaturwissenschaft. Neubearbeitung des Reallexikons
+               der deutschen Literaturgeschichte. Hg. von Harald Fricke / Klaus Grubmüller /
+               Jan-Dirk Müller / Klaus Weimar. 3 Bde. Berlin 1997–2003. <ptr type="gbv" cRef="224594834"/></bibl>
+            <bibl xml:id="gabler_primacy_2007">Hans-Walter Gabler: The Primacy of the Document in Editing. In: Ecdotica 4 (2007),
+               S.&#x00A0;197–207. <ptr type="gbv" cRef="590955543"/></bibl>
+            <bibl xml:id="gius_narration_2016">Evelyn Gius: Narration and Escalation. An Empirical Study of Conflict Narratives.
+               In: Diegesis 5 (2016), H. 1, S.&#x00A0;4–25. [<ref
+                  target="https://www.diegesis.uni-wuppertal.de/index.php/diegesis/article/view/222"
+                  >online</ref>] <ptr type="gbv" cRef="799341215"/></bibl>
+            <bibl xml:id="gius_detection_2019">Evelyn Gius / Fotis Jannidis / Markus Krug / Albin Zehe / Andreas Hotho / Frank
+               Puppe / Jonathan Krebs / Nils Reiter / Natalie Wiedmer / Leonard Konle: Detection of
+               Scenes in Fiction. In: Digital Humanities 2019 Conference papers. Book of Abstracts.
+               (DH 2019: Utrecht, 09.–12.07.2019). Utrecht 2019. </bibl>
+            <bibl xml:id="gius_agreement_2022">Evelyn Gius / Michael Vauth: Inter Annotator Agreement und Intersubjektivität. In:
+               DHd2022: Kulturen des digitalen Gedächtnisses. Konferenzabstracts. (DHd 8: Potsdam,
+               07.–11.03.2022). Potsdam 2022. DOI: <ref
+                  target="https://doi.org/10.5281/zenodo.6328208">10.5281/zenodo.6328208</ref>
+            </bibl>
+            <bibl xml:id="halliday_cohesion_1976">Michael Alexander Kirkwood Halliday / Ruqaiya Hasan: Cohesion in English. London
+               1976. <ptr type="gbv" cRef="1604473088"/></bibl>
+            <bibl xml:id="anz_handbuch_2013">Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3 Bde. Stuttgart 2013.
+               <ptr type="gbv" cRef="766534278"/></bibl>
+            <bibl xml:id="herzog_ansatz_2018">Rainer Herzog: Ein generischer Ansatz zur digitalen Layoutanalyse von
+               Manuskripten. Hamburg 2018. PDF. [<ref
+                  target="https://ediss.sub.uni-hamburg.de/volltexte/2019/10058/pdf/Dissertation.pdf"
+                  >online</ref>] <ptr type="gbv" cRef="168069748X"/></bibl>
+            <bibl xml:id="heyse_einleitung_1871">Paul Heyse / Hermann Kurz: Einleitung. In: Deutscher Novellenschatz. Hg. von Paul
+               Heyse / Hermann Kurz. 24 Bde. München 1871–1876, Bd. 1 (1871), S.&#x00A0;V–XXIV. <ptr type="gbv" cRef="167398210"/></bibl>
+            <bibl xml:id="iser_akt_1976">Wolfgang Iser: Der Akt des Lesens. Theorie ästhetischer Wirkung. München 1976.
+               <ptr type="gbv" cRef="025607464"/></bibl>
+                     <bibl xml:id="katz_sense_2004">Jerrold Jacob Katz: Sense, Reference, and Philosophy. Oxford u. a. 2004. <ptr type="gbv" cRef="349705259"/></bibl>
+                     <bibl xml:id="keller_diskurs_2015">Diskurs – Interpretation – Hermeneutik. Hg. von Reiner Keller. Weinheim 2015. (=&#x00A0;Zeitschrift für
+                        Diskursforschung / Beihefte, 1). <ptr type="gbv" cRef="1615247599"/></bibl>
+            <bibl xml:id="koeppe_theorien_2013">Tilmann Köppe / Simone Winko: Theorien und Methoden der Literaturwissenschaft. In:
+               Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3 Bde. Stuttgart 2013. Bd. 2:
+               Methoden und Theorien, S.&#x00A0;285–371. <ptr type="gbv" cRef="766534278"/></bibl>
+            <bibl xml:id="krewet_wissenstransfer_2015">Michael Krewet: Wissenstransfer in Scholien. Zur Präsenz Platons in den
+               Marginalien von de interpretatione‐Handschriften. Berlin 2015. (=&#x00A0;Working Paper des SFB 980
+               Episteme in Bewegung, 6). PDF. [<ref
+                  target="https://www.sfb-episteme.de/Listen_Read_Watch/Working-Papers/No_6_Krewet_Scholien/Working-Paper-Nr-6_Krewet.pdf"
+                  >online</ref>] <ptr type="gbv" cRef=""/></bibl>
+            <bibl xml:id="krewet_aristoteles_2019">Michael Krewet / Philipp Hegel / Germaine Götzelmann / Sybille Söring / Danah
+               Tonne: Aristoteles auf Reisen: Handschriftenforschung in der digitalen Infrastruktur
+               des SFBs 980 ›Episteme in Bewegung‹. In: Forschungsinfrastrukturen in den digitalen
+               Geisteswissenschaften. Hg. von Martin Huber / Sybille Krämer / Claus Pias:
+               Fachinformationsdienst Allgemeine und Vergleichende Literaturwissenschaft.
+               (DFG-Symposienreihe Digitalität in den Geisteswissenschaften, Bayreuth,
+               26.–28.09.2018). Frankfurt / Main 2019, S.&#x00A0;77–87. PDF. [<ref
+                  target="https://d-nb.info/1201549485/34">online</ref>] <ptr type="gbv" cRef=""/></bibl>
+            <bibl xml:id="krewet_diagramme_2020">Michael Krewet / Philipp Hegel: Diagramme in Bewegung: Scholien und Glossen zu ›de
+               interpretatione‹. In: Bilddaten in den digitalen Geisteswissenschaften. Hg. von Canan
+               Hastik / Philipp Hegel. Wiesbaden 2020, S.&#x00A0;199–216. (=&#x00A0;Episteme in Bewegung, 16). <ptr type="gbv" cRef="1734711329"/></bibl>
+                     <bibl xml:id="krippendorff_content_1980">Klaus Krippendorff: Content Analysis: an Introduction to Its Methodology. Beverly Hills, CA 1980.(=&#x00A0;The
+                        Sage Commtext Series, 5). <ptr type="gbv" cRef="130556084"/></bibl>
+                     <bibl xml:id="krippendorff_reliability_2004">Klaus Krippendorff: Reliability in Content Analysis: Some Common Misconceptions
+               and Recommendations. In: Human Communication Research 30 (2004), H. 3, S.&#x00A0;411–433.
+               <ptr type="gbv" cRef="129567736"/></bibl>
+            <bibl xml:id="lamprier_evaluation_2007">Sylvain Lamprier / Tassadit Amghar / Bernard Levrat / Frederic Saubion: On
+               Evaluation Methodologies for Text Segmentation Algorithms. In: Proceedings of the
+               19th IEEE International Conference on Tools with Artificial Intelligence. (ICTAI 19:
+               Patras, 29.–31.10.2007). Los Alamitos, CA 2007, S.&#x00A0;19–26. DOI: 10.1109/ICTAI.2007.142 <ptr type="gbv" cRef="581958004"/></bibl>
+            <bibl xml:id="levenshtein_codes_1966">Vladimir I. Levenshtein: Binary Codes Capable of Correcting Deletions, Insertions,
+               and Reversals. In: Soviet Physics Doklady 10 (1966) [1965], H. 8, S.&#x00A0;707–710.
+               <ptr type="gbv" cRef="129482234"/></bibl>
+                     <bibl xml:id="schubert_materialitaet_2010">Materialität in der Editionswissenschaft. Hg. von Martin Schubert. Berlin 2010. (=&#x00A0;Editio / Beihefte, 32). DOI: 10.1515/9783110231311</bibl>
+            <bibl xml:id="mathet_method_2015">Yann Mathet / Antoine Widlöcher / Jean-Philippe Métivier: The Unified and Holistic
+               Method Gamma (γ) for Inter-Annotator Agreement Measure and Alignment. In:
+               Computational Linguistics 41 (2015), H. 3, S.&#x00A0;437–479. DOI: 10.1162/COLI_a_00227
+               <ptr type="gbv" cRef="320641066"/></bibl>
+            <bibl xml:id="glueck_lexikon_2016">Metzler Lexikon Sprache. Hg. von Helmut Glück / Michael Rödel. 5. aktualisierte
+               und überarbeitete Auflage. Stuttgart 2016. <ptr type="gbv" cRef="859110699"/></bibl>
+            <bibl xml:id="ortmann_tools_2019">Katrin Ortmann / Adam Roussel / Stefanie Dipper: Evaluating Off-the-Shelf NLP
+               Tools for German. In Proceedings of the 15th Conference on Natural Language
+               Processing. Hg. von German Society for Computational Linguistics &amp; Language
+               Technology. (KONVENS 15: Erlangen, 09.–11.10.2019). 2019, S.&#x00A0;212–222.
+               <ptr type="gbv" cRef="1690535733"/></bibl>
+            <bibl xml:id="pevzner_critique_2002">Lev Pevzner / Marti Alice Hearst: A Critique and Improvement of an Evaluation Metric
+               for Text Segmentation. In: Computational Linguistics 28 (2002), H. 1, S.&#x00A0;19–36.
+               <ptr type="gbv" cRef="320641066"/></bibl>
+            <bibl xml:id="pfeifer_woerterbuch_1993">Wolfgang Pfeifer et al.: Etymologisches Wörterbuch des Deutschen,
+               digitalisierte und von Wolfgang Pfeifer überarbeitete Version im Digitalen Wörterbuch
+               der deutschen Sprache. Berlin 1993. HTML. [<ref
+                  target="https://www.dwds.de/d/wb-etymwb">online</ref>]</bibl>
+                     <bibl xml:id="propp_morphologie_1975">Vladimir Propp: Morphologie des Märchens. Frankfurt / Main 1975. <ptr type="gbv" cRef="198411758"/></bibl>
+            <bibl xml:id="reiter_messverfahren_2022">Nils Reiter / Leonard Konle: Messverfahren zum Inter-annotator-agreement (IAA):
+               Eine Übersicht. Göttingen 2022. (=&#x00A0;DARIAH-DE Working Papers, 44). PDF. DOI: <ref
+                  target="https://doi.org/10.47952/gro-publ-103">10.47952/gro-publ-103</ref>
+            </bibl>
+            <bibl xml:id="saussure_cours_1916">Ferdinand de Saussure: Cours de linguistique générale. Hg. von Charles Bally /
+               Albert Sechehaye. Lausanne u. a. 1916. <ptr type="gbv" cRef="136041396"/></bibl>
+            <bibl xml:id="schmid_part_1994">Helmut Schmid: Probabilistic Part-of-Speech Tagging Using Decision Trees. (International Conference on New Methods in Language Processing, Manchester, 06.07–08.07.1994).
+               Manchester 1994.  PDF. [<ref target="https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf">online</ref>]</bibl>
+            <bibl xml:id="schmid_improvements_1995">Helmut Schmid: Improvements in Part-of-Speech Tagging with an Application to
+               German. (ACL SIGDAT-Workshop, Dublin 1995, 27.03.1995). PDF. [<ref target="https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf">online</ref>]</bibl>
+            <bibl xml:id="schmid_erzaehltextanalyse_2013">Wolf Schmid: Erzähltextanalyse. In: Handbuch Literaturwissenschaft. Hg. von Thomas
+               Anz. 3 Bde. Stuttgart 2013. Bd. 2: Methoden und Theorien, S.&#x00A0;98–120.
+               <ptr type="gbv" cRef="766534278"/></bibl>
+            <bibl xml:id="siegel_hang_2002">Monika Siegel: Ich hatte einen Hang zur Schwaermerey ... Das Leben der
+               Schriftstellerin und Übersetzerin Meta Forkel-Liebeskind im Spiegel ihrer Zeit.
+               Darmstadt 2002. PDF. [<ref target="https://tuprints.ulb.tu-darmstadt.de/epda/000222/"
+                  >online</ref>] </bibl>
+                     <bibl xml:id="sinclair_corpus_1991">John Sinclair: Corpus, Concordance, Collocation. Oxford 1991. (=&#x00A0;Describing
+               English Language). <ptr type="gbv" cRef="276280504"/></bibl>
+            <bibl xml:id="stoeckmann_aesthetik_2013">Ingo Stöckmann: Ästhetik. In: Handbuch Literaturwissenschaft. Hg. von Thomas Anz.
+               3 Bde., Stuttgart 2013. Bd. 1: Gegenstände und Grundbegriffe, S.&#x00A0;465–491.
+               <ptr type="gbv" cRef="766534278"/></bibl>
+            <bibl xml:id="teufel_zoning_1999">Simone Teufel: Argumentative Zoning: Information Extraction from Scientific Text.
+               Dissertation, University of Edinburgh. 1999. PDF. [<ref
+                  target="https://www.cl.cam.ac.uk/~sht25/thesis/t1.pdf">online</ref>]</bibl>
+            <bibl xml:id="thuemmel_segmentierung_2016">Wolf Thümmel: Segmentierung. In: Metzler Lexikon Sprache. Hg. von Helmut Glück /
+               Michael Rödel. 5. aktualisierte und überarbeitete Auflage. Stuttgart 2016, S.&#x00A0;602.
+               <ptr type="gbv" cRef="859110699"/></bibl>
+            <bibl xml:id="thuernau_sinn_2017">Donatus Thürnau: Sinn/Bedeutung. In: Historisches Wörterbuch der Philosophie.
+               Onlineversion. Hg. von Joachim Ritter, Karlfried Gründer und Gottfried Gabriel. 2017. DOI: 10.24894/HWPh.3901
+              </bibl>
+            <bibl xml:id="toutanova_enriching_2000">Kristina Toutanova / Christopher David Manning: Enriching the Knowledge Sources Used
+               in a Maximum Entropy Part-of-Speech Tagger. In: Proceedings of the Joint SIGDAT
+               Conference on Empirical Methods in Natural Language Processing and Very Large
+               Corpora. (EMNLP/VLC-2000: Hong Kong, Oktober 2000) S.&#x00A0;63–70. PDF. DOI: <ref
+                  target="https://doi.org/10.3115/1117794.1117802">10.3115/1117794.1117802</ref>
+            </bibl>
+            <bibl xml:id="zehe_scenes_2021">Albin Zehe / Leonard Konle / Lea Katharina Dümpelmann / Evelyn Gius / Andreas
+               Hotho / Fotis Jannidis / Lucas Kaufmann / Markus Krug / Frank Puppe / Nils Reiter /
+               Annekea Schreiber / Natalie Widmer: Detecting Scenes in Fiction. A New Segmentation
+               Task. In: Proceedings of the 16th Conference of the European Chapter of the
+               Association for Computational Linguistics: Main Volume. Hg. von Association for
+               Computational Linguistics. (EACL 16: online, 19.–23.04.2021) 2021, S.&#x00A0;3167–3177. PDF.
+               DOI: <ref target="https://doi.org/10.18653/v1/2021.eacl-main.276"
+                  >10.18653/v1/2021.eacl-main.276</ref>
+          </bibl>            
+               </listBibl>
+               </div>
+            <div type="abbildungsnachweis">
+               <head>Abbildungs- und Tabellenverzeichnis</head>
+               <desc type="table" xml:id="tab1"><ref target="#tab01" type="intern">Tab. 1</ref>: Linguistische Einheiten der Segmentierung.<ref type="graphic" target="#segment_t1"/></desc>
+               <desc type="table" xml:id="tab2"><ref target="#tab02" type="intern">Tab. 2</ref>: Beispiele lexikalischer Mehrwortausdrücke.<ref type="graphic" target="#segment_t2"/></desc>
+               <desc type="graphic" xml:id="abb1">Das taxonomische Annotationsschema HeuTex. [<ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>, S.
+                  23]<ref type="graphic" target="#segment_001"/></desc>
+                     <desc type="table" xml:id="tab3"><ref target="#tab03" type="intern">Tab. 3</ref>: Ergebnis der RNN-Klassifizierung auf verschiedenen Ebenen. [Aus: 
+                        <ref type="bibliography" target="#becker_heuristic_2020">Becker et
+                        al. 2020</ref>]<ref type="graphic" target="#segment_t3"/></desc>
+               <desc type="graphic" xml:id="abb2">Dimensionen der Segmentierung. [Eigene Darstellung]<ref type="graphic" target="#segment_002"/></desc>
+               <desc type="table" xml:id="tab4"><ref target="#tab04" type="intern">Tab. 4</ref>: Parameter von <ref type="bibliography" target="#mathet_method_2015">Mathet et al. (2015)</ref> angewendet auf Szenen (Phänomen und
+                           Operationalisierung in den Guidelines).<ref type="graphic" target="#segment_t4"/></desc>
+            </div>
+            </div>
+      </body>
+   </text>
+</TEI>
diff --git a/2023_002_bartsch_et_al/segment_2023_001.png b/2023_002_bartsch_et_al/segment_2023_001.png
new file mode 100644
index 0000000000000000000000000000000000000000..f3e9202204e4ac9dc1478710aeca6d46e7ac523d
Binary files /dev/null and b/2023_002_bartsch_et_al/segment_2023_001.png differ
diff --git a/2023_002_bartsch_et_al/segment_2023_002.png b/2023_002_bartsch_et_al/segment_2023_002.png
new file mode 100644
index 0000000000000000000000000000000000000000..78284cff6c28f0ebc3b124ab5d26babf21aba56d
Binary files /dev/null and b/2023_002_bartsch_et_al/segment_2023_002.png differ
diff --git a/2023_003_lang/Lang_2023_v1_0.pdf b/2023_003_lang/Lang_2023_v1_0.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..6539d47753fac0f4ca3bc7e408630bd4359b8e68
Binary files /dev/null and b/2023_003_lang/Lang_2023_v1_0.pdf differ
diff --git a/2023_003_lang/Lang_2023_v1_0.xml b/2023_003_lang/Lang_2023_v1_0.xml
new file mode 100644
index 0000000000000000000000000000000000000000..63aff014000998d7a025bd30bf3dae28e254b829
--- /dev/null
+++ b/2023_003_lang/Lang_2023_v1_0.xml
@@ -0,0 +1,2118 @@
+<?xml version="1.0" encoding="utf-8"?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html"
+   xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink"
+   xmlns:xhtml="http://www.w3.org/1999/xhtml">
+   <teiHeader>
+      <fileDesc>
+         <titleStmt>
+            <title>
+               <biblStruct>
+                  <analytic>
+                     <title level="a">»[…] nicht die Ausnahme, sondern der Normalfall [!]« Die
+                        digitale Lücke in der Kunstgeschichte und Provenienzforschung</title>
+                     <respStmt>
+                        <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp>
+                        <persName>
+                              <forename>Sabine</forename>
+                              <surname>Lang</surname>
+                              <email>sab.lang@fau.de</email>
+                              <idno type="gnd">1100083812</idno>
+                           <idno type="orcid">0000-0003-2543-0085</idno>
+                        <affiliation>Friedrich-Alexander-Universität Erlangen-Nürnberg, Department
+                           Digital Humanities and Social Studies</affiliation>
+                        </persName>
+                     </respStmt>
+                     <idno type="doi">10.17175/2023_002</idno>
+                     <idno type="ppn">184313442X</idno>
+                     <idno type="zfdg">2023.002</idno>
+                     <idno type="url">https://www.zfdg.de/node/438</idno>
+                     <date when="2023-05-15">11.05.2023</date>
+                  </analytic>
+                  <monogr>
+                     <title level="j">Zeitschrift für digitale Geisteswissenschaften</title>
+                     <respStmt>
+                        <resp>Publiziert von</resp>
+                        <orgName role="marc_pbl">Herzog August Bibliothek</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>Transformation der Word Vorlage nach TEI</resp>
+                        <persName/>
+                        <name role="marc_trc">
+                           <surname>Baumgarten</surname>
+                           <forename>Marcus</forename>
+                           <idno type="gnd">1192832655</idno>
+                        </name>
+                     </respStmt>
+                     <availability status="free">
+                        <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref>
+                        </p>
+                     </availability>
+                     <imprint>
+                        <biblScope unit="year">2023</biblScope>
+                        <biblScope unit="artikel">02</biblScope>
+                     </imprint>
+                  </monogr>
+               </biblStruct>
+            </title>
+         </titleStmt>
+         <editionStmt>
+            <edition>Elektronische Ausgabe nach TEI P5</edition>
+         </editionStmt>
+         <publicationStmt>
+            <distributor>
+               <name>
+                  <orgName>Herzog August Bibliothek Wolfenbüttel</orgName>
+               </name>
+            </distributor>
+            <idno type="doi">10.17175/zfdg.01</idno>
+            <idno type="ppn">819494402</idno>
+            <authority>
+               <name>Herzog August Bibliothek</name>
+               <address>
+                  <addrLine>Lessingplatz 1</addrLine>
+                  <addrLine>38304 Wolfenbüttel</addrLine>
+               </address>
+            </authority>
+            <authority>
+               <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name>
+               <address>
+                  <addrLine>Burgplatz 4</addrLine>
+                  <addrLine>99423 Weimar </addrLine>
+               </address>
+            </authority>
+            <availability status="free">
+               <p> Sofern nicht anders angegeben </p>
+               <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence>
+            </availability>
+            <availability status="free">
+               <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund
+                     MWW</ref>
+               </p>
+            </availability>
+         </publicationStmt>
+         <sourceDesc>
+            <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p>
+         </sourceDesc>
+      </fileDesc>
+      <encodingDesc>
+         <editorialDecl>
+            <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und
+               XSLT-Skripten</p>
+         </editorialDecl>
+         <editorialDecl>
+            <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von
+                  <persName>Caroline Jansky</persName>.</p>
+         </editorialDecl>
+         <editorialDecl>
+            <p>Medienrechte liegen bei den Autor*innen</p>
+         </editorialDecl>
+         <editorialDecl>
+
+            <p>All links checked<date when="2023-05-03">03.05.2023</date>
+            </p>
+         </editorialDecl>
+      </encodingDesc>
+      <profileDesc>
+         <creation>Einreichung als Artikel der Zeitschrift für digitale
+            Geisteswissenschaften</creation>
+         <langUsage>
+            <language ident="de">Text in Deutsch</language>
+            <language ident="de">Abstract in Deutsch</language>
+            <language ident="en">Abstract in Englisch</language>
+         </langUsage>
+         <textClass>
+            <keywords scheme="gnd">
+
+               <term>Auslassung<ref target="4359960-6"/></term>
+               <term>Datenbank<ref target="4011119-2"/></term>
+               <term>Kunstgeschichte<ref target="4138803-3"/></term>
+               <term>Provenienzforschung<ref target="7697228-8"/></term>
+
+            </keywords>
+         </textClass>
+      </profileDesc>
+      <revisionDesc>
+         <change/>
+      </revisionDesc>
+   </teiHeader>
+   <text>
+      <body>
+         <div>
+            <div type="abstract">
+               <argument xml:lang="de">
+                  <p>Die Arbeit mit Datenbanken ist Teil des Alltags vieler Kunsthistoriker*innen
+                     und Provenienzforscher*innen. Dabei werden sie nicht nur mit dem Anwesenden,
+                     sondern auch mit dem Abwesenden konfrontiert. Der folgende Beitrag widmet sich
+                     der digitalen Lücke im Kontext der Kunstgeschichte und Provenienzforschung und
+                     fragt nach Arten und Ursachen. Auf Basis einer Studie verschiedener Datenbanken
+                     und einer digitalen Methode werden Arten digitaler Lücken identifiziert und in
+                     einer (erweiterbaren) Typologie festgehalten. Im Anschluss werden die Ursachen
+                     problematisiert, wobei festgestellt werden soll, ob die Lücken auf bereits
+                     lückenhafte analoge Bestände oder tatsächlich auf digitale Methoden oder andere
+                     Faktoren zurückzuführen sind. Eine wesentliche Erkenntnis besteht darin, dass
+                     vor allem fehlende Ressourcen digitale Lücken generieren. Abschließende
+                     Gedanken greifen die Fragen auf, warum eine Auseinandersetzung mit Lücken vor
+                     allem im Digitalen wichtig ist und ob die Lücke auch positive Qualitäten hat.
+                  </p>
+               </argument>
+            </div>
+            <div type="abstract">
+               <argument xml:lang="de">
+                  <p>Art historians and provenance researchers use databases almost daily. By doing
+                     so, they are not only confronted with what is present but also with what is
+                     missing. The following article studies digital gaps in the context of art
+                     history and provenance research and specifically asks for types and causes.
+                     Based on a study of various databases and a digital method, types of digital
+                     gaps are identified and recorded in an (expandable) typology. In the following
+                     section, the article addresses causes for gaps to determine if they are a
+                     result of already incomplete analog sources, digital methods or other factors.
+                     A key finding is that missing resources generate gaps. The article concludes
+                     with a discussion of the importance of gaps in the digital space, and whether
+                     gaps can have positive qualities as well. </p>
+               </argument>
+            </div>
+            <div type="chapter">
+               <head>1. Einführung in die ›digitale Lücke‹</head>
+               <p>Um mehr über die Geschichte eines Gegenstandes zu erfahren, bedient sich die
+                     Provenienzforschung<note type="footnote">Provenienzforschung zielt auf die
+                     Klärung der Herkunft eines Objekts und dessen Besitzverhältnisse ab und
+                     untersucht zudem, unter welchen Bedingungen ein Besitzwechsel stattgefunden
+                     hat. Sie findet in verschiedenen Kontexten statt, dazu gehört der NS-Kunstraub,
+                     aber auch Kulturgutentziehungen in der Sowjetischen Besatzungszone (SBZ) und
+                     DDR oder Sammlungsgut aus kolonialen Kontexten (vgl. <ref type="bibliography"
+                        target="#kulturgutverluste_2022">Deutsches Zentrum Kulturgutverluste et al.
+                        2019</ref>, S. 6; <ref type="bibliography" target="#haase_einfuehrung_2022"
+                        >Haase / Hopp 2022</ref>, S. 6). </note> unterschiedlicher Methoden, dazu
+                  gehören die Untersuchung des Objektes oder Recherchen in Datenbanken. Da
+                  Institutionen wie Museen, Bibliotheken oder Archive ihre Bestände und
+                  weiterführende Informationen zunehmend online stellen und diese somit schnell und
+                  ortsunabhängig zugänglich sind, besitzen Datenbanken eine enorme Relevanz für die
+                  Provenienzforschung. Eine wichtige Quelle ist die <bibl>
+                     <title type="desc">Datenbank ›Entartete Kunst‹</title>
+                  </bibl>, die all diejenigen Werke verzeichnet, die von den Nationalsozialisten
+                  vorwiegend in den Jahren 1937 / 1938 in deutschen Museen beschlagnahmt
+                     wurden.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#fek_datenbank_2010">Forschungsstelle ›Entartete Kunst‹ (Hg.)
+                        2010</ref>. </note> Wer die Provenienz eines Werkes von Max Beckmann
+                  (1884–1950) prüft, wird auch diese Quelle konsultieren, da seine Werke von den
+                  Nationalsozialisten als <quote>entartet</quote> diffamiert wurden.<note
+                     type="footnote">Zehn Gemälde Beckmanns waren im Juli 1937 in der Ausstellung <bibl>
+                        <title type="desc">Entartete Kunst</title>
+                     </bibl> in München zu sehen (vgl. <ref type="bibliography"
+                        target="#schmeisser_beckmann_2021">Schmeisser 2021</ref>). </note> Eine
+                  Suche im Künstlerfeld nach »Max Beckmann« liefert 685 Treffer. Auf den ersten
+                  Blick ist sichtbar, dass für einige Werke keine Abbildungen vorhanden sind;
+                  stattdessen treten Platzhalter mit den Vermerken <quote>Keine Abbildung</quote>
+                  und <quote>Abbildung in der Forschungsstelle vorhanden</quote>.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#fek_datenbank_2010"
+                        >Forschungsstelle ›Entartete Kunst‹ (Hg.) 2010</ref>. Die Anzahl der Treffer
+                     entspricht dem Stand am 27. Oktober 2022. </note> Abbildungslücken, wie die
+                  hier beschriebenen, sind im Netz zahlreich und äußerst problematisch für die
+                  Provenienzforschung. Sie erschweren das Studium der Objekte und behindern eine
+                  eindeutige Objektidentifikation, die eine wesentliche Voraussetzung für eine
+                  erfolgreiche Recherche ist.</p>
+               <p>Das Beispiel Beckmann benennt eine Art der Lücke im Digitalen und zeigt, dass
+                  diese entweder nur hier (Datenbank) auftritt oder auch im Analogen existiert. Es
+                  verdeutlicht zudem, wie problematisch die digitale Lücke für die Forschung sein
+                  kann und weshalb das Thema eine große Relevanz hat. Der folgende Beitrag geht
+                  deshalb der Frage nach, welche Arten digitaler Lücken es im Kontext der
+                  Kunstgeschichte und Provenienzforschung gibt.<note type="footnote">Gründe für den
+                     Fokus: Zunächst besteht hierin der Forschungsschwerpunkt der Autorin. Zudem
+                     greifen Forschende beider Disziplinen für ihre Arbeit auf Datenbanken zurück,
+                     die Lücken beinhalten, z. B. in Form von Abbildungslücken. Letztlich ist eine
+                     Thematisierung der Lücke vor allem in der Provenienzforschung unbedingt
+                     notwendig (vgl. <ref type="bibliography" target="#dzk_leitfaden_2019">Deutsches
+                        Zentrum Kulturgutverluste et al. 2019</ref>, S. 83–84). </note> Der Beitrag
+                  zeigt auf, dass das Digitale unterschiedliche Lücken bereithält, die viele
+                  Ursachen haben. Ich argumentiere, dass digitale Lücken nicht nur auf
+                  unvollständige analoge Bestände zurückzuführen sind, sondern auch aufgrund
+                  digitaler Methoden und anderer Faktoren entstehen. Nach der Beschreibung der
+                  Methodik folgt zunächst die Darlegung des Forschungsstandes und die Einordnung des
+                  Beitrags (vgl. <ref type="intern" target="#hd2">Kapitel 2</ref>). Der
+                  anschließende Teil widmet sich den Arten digitaler Lücken in der Kunstgeschichte
+                  und Provenienzforschung mit dem Ziel der Entwicklung einer Typologie (vgl. <ref
+                     type="intern" target="#hd3">Kapitel 3</ref>). Im Anschluss erfolgt eine
+                  Auseinandersetzung mit den Ursachen der Lücken; hier wird im Besonderen gefragt,
+                  ob die Fehlstelle auf die analogen Bestände oder auf andere Ursachen
+                  zurückzuführen ist (vgl. <ref type="intern" target="#hd12">Kapitel 4</ref>). Daran
+                  anschließend erfolgt die Darlegung einer Definition der digitalen Lücke (vgl. <ref
+                     type="intern" target="#hd13">Kapitel 5</ref>). Im folgenden Teil werden daran
+                  anschließende Gedanken erörtert: Warum ist eine Auseinandersetzung mit Lücken vor
+                  allem im Digitalen wichtig (vgl. <ref type="intern" target="#hd15">Kapitel
+                     6.1</ref>)? Und kann die Lücke auch positive Qualitäten haben (vgl. <ref
+                     type="intern" target="#hd16">Kapitel 6.2</ref>)? Der Schluss enthält eine
+                  Zusammenfassung der Ergebnisse und benennt Folgeforschung (vgl. <ref type="intern"
+                     target="#hd17">Kapitel 7</ref>).</p>
+               <p>Kunsthistoriker*innen und Provenienzforscher*innen arbeiten zunehmend mit
+                  digitalen Daten, Datenbanken, Methoden und Werkzeugen und sind an deren
+                  Entwicklung beteiligt. Da das Digitale zahlreiche Lücken in unterschiedlicher
+                  Gestalt bereithält – wie nachfolgende Ausführungen zeigen werden –, sind
+                  Forschende in gesteigertem Maße mit digitalen Lücken konfrontiert. Diese zu
+                  identifizieren, einzuordnen, zu bewerten und zu vermitteln sind deshalb wichtige
+                  Fähigkeiten des Forschenden. Mit der Bearbeitung des Themas ›digitale Lücke‹
+                  möchte der Beitrag für die Präsenz von Lücken im digitalen Raum sensibilisieren
+                  und eine weitere wissenschaftliche Bearbeitung anstoßen, die über die
+                  Kunstgeschichte und Provenienzforschung hinausgeht. Eine Auseinandersetzung mit
+                  der digitalen Lücke und ihren Ursachen ist gerade jetzt wichtig, da die Produktion
+                  digitaler Daten und die Entwicklung digitaler Methoden konstant voranschreitet und
+                  zudem verschiedene Initiativen wie NFDI4Memory<note type="footnote">NFDI4Memory
+                     ist eines von mehreren Konsortien innerhalb der Nationalen
+                     Forschungsdateninfrastruktur (NFDI), die <quote>[…] wertvolle Datenbestände von
+                        Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem
+                        systematisch [erschließt], vernetzt und nachhaltig sowie qualitativ nutzbar
+                        [macht]</quote> (Nationale Forschungsdateninfrastruktur (NFDI); vgl. <ref
+                        type="bibliography" target="#nfdifm_2022">NFDI for Memory</ref>
+                     (NFDI4Memory)). </note> Standards für historische Forschungsdaten definieren
+                  und etablieren. </p>
+               <p>Die Festlegung von Arten und Ursachen digitaler Lücken erfolgt durch die Studie
+                  verschiedener Datenbanken und einer digitalen Methode. Hierbei kann nur eine
+                  Auswahl untersucht werden, die allerdings wesentliche und übergreifende Muster
+                  aufzeigt und deshalb repräsentativ für andere stehen kann. Die Auswahl erfolgt mit
+                  Blick auf die für den Beitrag gewählten fachlichen Schwerpunkte, nämlich
+                  Kunstgeschichte und Provenienzforschung, und favorisiert demnach Datenbanken und
+                  Methoden, mit denen in der Community bevorzugt gearbeitet wird. Im folgenden Teil
+                     <ref type="intern" target="#hd3">Was ist die ›digitale Lücke‹?</ref> wird die
+                  Auswahl gelistet und erläutert. </p>
+            </div>
+            <div type="chapter">
+               <head>2. Forschungsstand</head>
+               <p>Eine initiale Literaturrecherche verdeutlicht die interdisziplinäre Bearbeitung
+                  des Themas ›Lücke‹ sowie ihre unterschiedlichen Erscheinungsformen: In Romanen
+                  tritt sie in Form von Leerstellen auf und markiert dort z. B. etwas
+                  Unausgesprochenes, das von Lesenden antizipiert werden muss und diese deshalb zur
+                  Mitarbeit auffordert.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 153–156.</note>
+                  Die Mediävistik verwendet den Begriff <term type="dh">Deperdita</term> für nicht
+                  (mehr) überlieferte Dokumente, <quote>[…] deren Inhalt aber aus anderen Quellen
+                     oder Kontexten rekonstruierbar ist.</quote>
+                  <note type="footnote">Vgl. <ref type="bibliography"
+                        target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note>
+                  Nennenswert ist zudem die vielfältige Auseinandersetzung mit dem Thema der Lücke
+                  in den Archivwissenschaften, z. B. in Bezug auf den Vorgang der Kassation.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#farrenkopf_logik_2021"
+                        >Farrenkopf et al. 2021</ref>, S. 11; <ref type="bibliography"
+                        target="#schenk_aufheben_2013">Schenk 2013</ref>; <ref type="bibliography"
+                        target="#schaeffler_networks_2022">Schäffler et al. 2022</ref>; <ref
+                        type="bibliography" target="#ul_kassation_2023">Was ist eigentlich
+                        ›Kassation‹? 2023</ref>.</note> Schließlich wird die Lücke auch in den
+                  Naturwissenschaften behandelt, in der Statistik z. B. in Form fehlender
+                     Daten.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#little_analysis_2019">Little / Rubin 2020</ref>.</note> Der nun
+                  folgende Überblick über den Forschungsstand konzentriert sich auf ausgewählte, für
+                  den Beitrag relevante thematische Schwerpunkte.</p>
+               <p>Lücken in der Kunstgeschichte und Provenienzforschung: Das an- und abwesende
+                  Objekt ist ein wichtiges Forschungsthema in der Kunstgeschichte. Die 2012
+                  erschienene Konferenzschrift The Challenge of the Object widmet sich dem Objekt
+                  ganzheitlich. Die Beiträge befassen sich u. a. mit Begriffen wie Kopie, Original
+                  und Aura; auch der Abwesenheit des Objekts und der Leere wird ein Kapitel
+                     gewidmet.<note type="footnote"> Vgl. <ref type="bibliography"
+                        target="#grossmann_challenge_2012">Großmann / Krutisch 2012 / 2013</ref>.
+                  </note> Das abwesende Objekt ist unweigerlich mit Verlustgeschichten verbunden: Im
+                  Kontext der Provenienzforschung sind deshalb Beiträge zu nennen, die sich explizit
+                  mit Kulturgutverlusten als Resultat von Enteignungen, Beschlagnahmungen, Raub oder
+                  Kriegen befassen.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#deinert_enteignet_2022">Deinert et al. 2022</ref>; <ref
+                        type="bibliography" target="#kaiser_gedaechtnis_2021">Kaiser-Schuster
+                        2021</ref>; <ref type="bibliography" target="#schawe_verluste_2019">Schawe
+                        2019</ref>.</note> Zudem wird vor allem der Umgang und die Bewertung von
+                     Lücken<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#geldmacher_luecken_2022">Geldmacher / Kulbe 2022</ref>. </note>
+                  oder die Vermittlung von Provenienzinformationen und Forschungsergebnissen im
+                  Digitalen thematisiert.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#tuernich_provenienzforschung_2019">Türnich 2019</ref>.</note>
+                  Dorothee Haffner hat sich außerdem intensiv mit Webseiten von Museen, musealen
+                  online Sammlungen und der Abbildung von Provenienzen beschäftigt.<note
+                     type="footnote">Vgl. <ref type="bibliography"
+                        target="#haffner_provenienzen_2020">Haffner 2020</ref>; <ref
+                        type="bibliography" target="#haffner_provenienzforschung_2019">Haffner
+                        2019</ref>.</note> Auch das Fragment, als besondere Art der Lücke in der
+                  Kunst oder Architektur, wird in der kunsthistorischen Forschung bearbeitet.<note
+                     type="footnote"> Vgl. <ref type="bibliography" target="#daraban_figuren_2017"
+                        >Daraban 2017</ref>. </note> Aktuelle Beiträge befassen sich auch mit dem
+                  Mehrwert digitaler Technologien für die Rekonstruktion, Präsentation und
+                  Restaurierung des fragmentarischen Objekts.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#schaedler_fragment_2021">Schädler-Saub
+                        2021</ref>.</note> Eine weitere besondere Art der Lücke sind Kunstwerke, die
+                  nie fertiggestellt wurden. Auch diese unvollendeten künstlerischen Zeugnisse
+                  stehen im Fokus des kunsthistorischen Interesses.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#steinaecker_ende_2021">Steinaecker 2021</ref>.
+                  </note> Daran anschließend beschäftigen sich aktuelle Publikationen und Projekte
+                  auch mit der Frage, was es bedeutet, über Objekte zu schreiben, die nicht mehr
+                     existieren.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#fricke_destroyed_2022">Fricke / Kumler 2022</ref>; <ref
+                        type="bibliography" target="#mpi_decay_2022">Decay, Loss, and Conservation
+                        in Art History 2022</ref>. </note> Der Umgang mit beschädigten, verlorenen
+                  oder nicht archivierbaren Objekten spielt hierbei eine Rolle, wobei im Besonderen
+                  auf Potenziale und Herausforderungen digitaler Technologien eingegangen wird.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#mww_verschwinden_2022"
+                        >Forschungsverbund Marbach Weimar Wolfenbüttel 2022</ref>. </note> Im
+                  musealen Kontext tritt die Lücke in Form von Leerstellen in Ausstellungsräumen in
+                  Erscheinung; Fragen nach dem, was nicht gezeigt wird oder generell fehlt, werden
+                  aufgegriffen und beziehen sich auch auf fehlende (Ausstellungs-) Narrative,
+                  Methoden und Akteur*innen.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#edenheiser_missing_2021">Edenheiser et al. 2021</ref>.</note>
+               </p>
+               <p>Unsicherheit und Unschärfe: Eine Beschäftigung mit der Lücke führt unweigerlich zu
+                  den Begriffen Unsicherheit und Unschärfe. Beide können im Rahmen des Beitrags
+                  nicht berücksichtigt werden; die in der Fußnote genannte Literatur gibt aber einen
+                  Überblick über Beiträge aus unterschiedlichen Disziplinen, die sich mit beiden
+                  Begriffen beschäftigen.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#ullrich_geschichte_2009">Ullrich 2009</ref> ; <ref
+                        type="bibliography" target="#freitag_unschaerfe_2018">Freitag et al.
+                        2018</ref>; <ref type="bibliography" target="#syropoulos_vagueness_2021"
+                        >Syropoulos / Papadopoulos 2021</ref> ; <ref type="bibliography"
+                        target="#bacon_vagueness_2018">Bacon 2018</ref>; <ref type="bibliography"
+                        target="#syropoulos_introduction_2020">Syropoulos / Grammenos 2020</ref>;
+                        <ref type="bibliography" target="#hannemann_beruecksichtigung_2010"
+                        >Hannemann 2010</ref>.</note>
+               </p>
+               <p>Objekte und Lücken im Digitalen: Das Thema der Lücke spielt in den <term type="dh"
+                     >Digital Humanities</term> z. B. in Form von Datenlücken und Datenbias eine
+                     Rolle.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#criado_frauen_2020">Criado-Perez / Singh 2020</ref>; <ref
+                        type="bibliography" target="#ntoutsi_bias_2020">Ntoutsi et al.
+                     2020</ref>.</note> In der digitalen Provenienzforschung wird die Lücke auch im
+                  Hinblick auf fehlende oder äußerst rudimentäre Provenienzinformationen in online
+                  Sammlungen deutscher Museen behandelt.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#haffner_provenienzforschung_2019">Haffner
+                        2019</ref>, S. 93.</note> Ein Bereich, der für diesen Beitrag zudem relevant
+                  ist, sind Arbeiten, die sich mit der Dokumentation und Veröffentlichung von
+                  Objekten im digitalen Raum befassen. Der Sammelband Objekte im Netz widmet sich
+                  der Digitalisierung und Digitalität wissenschaftlicher Sammlungen. Beispiele aus
+                  der Praxis stellen die digitale Dokumentation, Darstellung und Visualisierung von
+                  Objektsammlungen vor und thematisieren rechtliche und ethische Probleme, die bei
+                  der Sammlungsdigitalisierung entstehen.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#andraschke_objekte_2020">Andraschke / Wagner
+                        2020</ref>, S. 9–12, sowie allgemein <ref type="bibliography" target="#andraschke_hg_objekte_2020">Andraschke / Wagner (Hg.)</ref> 2020.</note> Auch die
+                  Datenmodellierung spielt hierin eine Rolle<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#nasarek_forschungsumgebung_2020">Nasarek
+                        2020</ref>. </note>; dieser methodische Ansatz der Wissensstrukturierung
+                  wird neben einer grundsätzlichen Modellierung ausführlich in der Informatik
+                  besprochen und auch im Kontext historischer Forschung aufgegriffen.<note
+                     type="footnote">Vgl. <ref type="bibliography"
+                        target="#kastens_modellierung_2018">Kastens / Kleine Büning 2018</ref>; <ref
+                        type="bibliography" target="#staud_datenmodellierung_2005">Staud 2005</ref>;
+                        <ref type="bibliography" target="#wintergruen_netzwerkanalysen_2019"
+                        >Wintergrün 2019</ref>. </note>
+               </p>
+               <p>Eine Auseinandersetzung mit der Objektpräsentation im Netz ist eingebettet in eine
+                  grundsätzliche Debatte über die Bedeutung der Digitalisierung und digitaler
+                  Methoden für Kultureinrichtungen: In <bibl>
+                     <title type="desc">Museen digital</title>
+                  </bibl> zeigt Hubertus Kohle anhand ausgewählter Beispiele auf, wie Museen sich
+                  dem Digitalen nähern und digitale Möglichkeiten für z. B. die
+                  Informationsvermittlung oder Nutzer*innenbeteiligung verwenden.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#kohle_museen_2018">Kohle
+                        2018</ref>. </note> In den letzten Jahren wurden zudem zahlreiche Leitfäden
+                  und Handreichungen veröffentlicht, die Richtlinien für die standardisierte
+                  Objektdokumentation oder Erfassung und Veröffentlichung von Metadaten zu
+                  Kulturobjekten enthalten; hinzukommen praktische Empfehlungen für die Produktion
+                  und Verwendung von Daten in Museen.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#dmb_leitfaden_2011">Deutscher Museumsbund e. V.
+                        2011</ref>; <ref type="bibliography" target="#knaus_lido_2019">Knaus et al.
+                        2019</ref>; <ref type="bibliography" target="#knaus_lido_2022">Knaus et al.
+                        2022</ref>; <ref type="bibliography" target="#luther_digitization_2022"
+                        >Luther 2022</ref>.</note>
+               </p>
+               <p>Kategorisierung von Lücken: Der vorliegende Beitrag entwickelt anhand der
+                  abgeleiteten digitalen Lücken eine Typologie und kann dabei auf Arbeiten
+                  zurückgreifen, die bereits Kategorisierungen für verwandte Begriffe vorgeschlagen
+                     haben.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#schneider_kriegsverluste_2013">Schneider 2013</ref>, S. 8.</note>
+                  Von besonderer Relevanz ist der 2019 erschienene Beitrag zu Quellenverlusten von
+                  Stefan Münnich, der u. a. eine Kategorisierung von Quellenverlusten enthält.<note
+                     type="footnote">Vgl. <ref type="bibliography"
+                        target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note> Münnichs
+                  Beitrag ist zudem wichtig, da er sich mit der Modellierung von Deperdita und
+                  Verneinungen auseinandersetzt und dabei die digitale Abbildung der Lücke in den
+                  Blick nimmt: </p>
+               <p>
+                  <quote type="grosszitat">Wie können nun aber nicht (mehr) vorhandene musikalische Quellen und
+                        Schriften so modelliert werden, dass sie im Zusammenhang digitaler
+                        Editionen, Kataloge oder Repertorien zugleich als Quelle, aber eben auch als
+                        Verlust greifbar und verarbeitbar sind? Wie kann ein digitales Objekt, das
+                        existiert, Instanz von etwas sein, dass [sic] nicht (mehr)
+                        existiert?</quote><note type="footnote"><ref type="bibliography"
+                           target="#muennich_quellenverluste_2019">Münnich 2019</ref>.</note>
+               </p>
+               <p>Der hier vorliegende Beitrag will durch die Studie verschiedener Datenbanken und
+                  einer Methode digitale Lücken identifizieren und Ursachen benennen. Er kann
+                  deshalb den Forschungsarbeiten zugeordnet werden, die sich mit möglichen analogen
+                  Lücken in der Kunstgeschichte und Provenienzforschung und der Veröffentlichung von
+                  Objekten im Netz befassen. Zudem bestehen direkte Verbindungen zu Arbeiten, die
+                  bereits Kategorien für Lücken oder verwandte Phänomene vorgeschlagen haben. Eine
+                  umfassende und explizite Auseinandersetzung mit der digitalen Lücke im Kontext der
+                  Kunstgeschichte und Provenienzforschung hat bisher aber nicht stattgefunden,
+                  vorhandene Beiträge beschränken sich zumeist auf den analogen Bereich oder
+                  spezifische Fälle.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#steinaecker_ende_2021">Steinaecker 2021</ref>; <ref
+                        type="bibliography" target="#edenheiser_missing_2021">Edenheiser et al.
+                        2021</ref>.</note> Auch die Frage nach der Ursache digitaler Lücken wurde
+                  bisher nicht in diesem Ausmaß gestellt und beantwortet. Einen wichtigen und
+                  genuinen Beitrag zum aktuellen Forschungsstand leistet der Beitrag durch die
+                  Entwicklung einer Typologie und einer tiefergehenden Auseinandersetzung mit der
+                  digitalen Lücke durch anschließende Fragestellungen. </p>
+            </div>
+            <div type="chapter">
+               <head>3. Was ist die ›digitale Lücke‹?</head>
+               <p>Das Ziel dieses Abschnitts ist die Entwicklung einer Typologie der digitalen
+                  Lücken (vgl. <ref type="graphic" target="#luecke_006">Abbildung 6</ref>). Dafür werden
+                  verschiedene Datenbanken und eine digitale Methode untersucht. Bei den Datenbanken
+                  handelt es sich um Bildarchive und andere Objektdatenbanken, die von Forschenden
+                  aus der Kunstgeschichte und Provenienzforschung verwendet werden. Hinzukommen
+                  online Sammlungen verschiedener deutscher Museen, die Abbildungen und
+                  weiterführende Informationen zu den Objekten bereithalten und eine gewisse Varianz
+                  hinsichtlich der Präsentation zeigen. Folgende Datenbanken wurden ausgewählt: <bibl>
+                     <title type="desc">Prometheus</title>
+                  </bibl>
+                  <note type="footnote">Vgl. <ref type="bibliography" target="#kik_prometheus_2022"
+                        >Kunsthistorisches Institut der Universität zu Köln (Hg.) 2022</ref>.
+                  </note>, der <bibl>
+                     <title type="desc">Bildindex der Kunst &amp; Architektur</title>
+                  </bibl> (<bibl>
+                     <title type="desc">Bildindex</title>
+                  </bibl>)<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#ddk_bildindex_2022">Deutsches Dokumentationszentrum für
+                        Kunstgeschichte (Hg.) 2022</ref>.</note>, <bibl>
+                     <title type="desc">Lost Art</title>
+                  </bibl>
+                  <note type="footnote">Vgl. <ref type="bibliography" target="#sdzk_art_2000"
+                        >Stiftung Deutsches Zentrum Kulturgutverluste (Hg.) 2000a</ref>.</note>, die <bibl>
+                     <title type="desc">Datenbank zum ›Central Collecting Point München‹</title>
+                  </bibl> (<bibl>
+                     <title type="desc">Datenbank CCP</title>
+                  </bibl>)<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#dhm_datenbank_2009">Deutsches Historisches Museum (Hg.) 2009</ref>.
+                  </note> und die Sammlungen des Frankfurter Städel Museums<note type="footnote"
+                     >Vgl. <ref type="bibliography" target="#staedel_digisammlung_2023">Städelsches
+                        Kunstinstitut (Hg.) 2023b</ref>.</note>, der Bayerischen
+                  Staatsgemäldesammlungen (BStGS)<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#bsgs_sammlung_2022">Bayerische Staatsgemäldesammlungen (Hg.)
+                        2022</ref>. </note>, des Germanischen Nationalmuseums<note type="footnote"
+                     >Vgl. <ref type="bibliography" target="#gnm_objektkatalog_2023">Germanisches
+                        Nationalmuseum (Hg.) 2023a</ref>.</note> in Nürnberg und der Staatlichen
+                  Kunstsammlungen Dresden (SKD)<hi rend="italic">.</hi>
+                  <note type="footnote">Vgl. <ref type="bibliography" target="#skd_online_2023"
+                        >Staatliche Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Im
+                  Hinblick auf digitale Methoden muss die Auswahl sehr lückenhaft bleiben; so
+                  konzentriert sich der Beitrag ausschließlich auf die Datenmodellierung und wird
+                  das lückengenerierende Potenzial anhand des sogenannten <bibl>
+                     <title type="desc">CIDOC Conceptual Reference Model</title>
+                  </bibl> (<bibl>
+                     <title type="desc">CIDOC CRM</title>
+                  </bibl>) aufzeigen. </p>
+               <div type="subchapter">
+                  <head>3.1 Digitale Lücken in Datenbanken</head>
+                  <p>Die Arbeit mit Datenbanken ist ein fester Bestandteil geisteswissenschaftlicher
+                     Arbeit; die Suche nach Abbildungen für die Illustration eigener Publikationen
+                     oder Präsentationen gehört ebenso dazu wie die Suche nach Informationen über
+                     das zu untersuchende Objekt. Dabei offenbaren sich digitale Lücken, die in den
+                     folgenden Abschnitten benannt werden. Die folgende Liste ist nicht vollständig,
+                     sondern soll als ›work in progress‹ zur Erweiterung auffordern. </p>
+                  <div type="subchapter">
+                     <head>3.1.1 Abbildungslücken</head>
+                     <p>Die meisten Datenbanken – nicht nur in der Kunstgeschichte und
+                        Provenienzforschung – enthalten Abbildungslücken: Die Suche nach »Max
+                        Beckmann« in der <bibl>
+                           <title type="desc">Datenbank ›Entartete Kunst‹ </title>
+                        </bibl>hat dies verdeutlicht und zwei Arten von Abbildungslücken aufgezeigt.
+                        Fehlende Abbildungen sind dabei nicht nur ein Resultat lückenhafter analoger
+                        Bestände, sondern können auch nur ein Phänomen des Digitalen sein. Die
+                        Visualisierung von fehlenden Objektabbildungen erfolgt (noch) nicht
+                        standardisiert. <ref type="graphic" target="#luecke_001">Abbildung 1</ref>
+                        und <ref type="graphic" target="#luecke_002">Abbildung 2</ref> zeigen
+                        beispielhaft, wie Abbildungslücken in Datenbanken dargestellt werden. Die
+                        Ursachen hierfür sind nicht sofort sichtbar: Die BStGS verweisen darauf,
+                        dass <quote>[d]ie digitale Darstellung […] aktuell nicht verfügbar
+                           [ist]</quote>, näheres erfährt man erst in der Objektansicht. Das
+                        Copyright-Symbol, das sich unter dem Platzhalter befindet, informiert über
+                        den rechtlichen Status. Eine Studie von Max Beckmann aus dem Jahr 1900
+                        unterliegt beispielsweise der Creative-Commons Lizenz 4.0, welche das Teilen
+                        und Adaptieren der Abbildung erlaubt.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#bsg_beckmann_2023">Beckmann,
+                              Bildnisstudie Martha Beckmann im Profil nach links</ref>; <ref
+                              type="bibliography" target="#cc_sa_2023">Creative-Commons,
+                              Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)</ref>.</note>
+                        Die Abbildungslücke muss deshalb einen anderen Grund haben. Die Abbildung
+                        der <bibl>
+                           <title type="desc">Max-Beckmann-Medaille</title>
+                        </bibl> des ungarischen Künstlers István Béla Farkas (1915–2005) fehlt
+                        hingegen, da die <quote>Bildrechte beim Rechteinhaber</quote>
+                        <note type="footnote">Vgl. <ref type="bibliography"
+                              target="#bsg_istvan_2023">Farkas, Max-Beckmann-Medaille</ref>.</note>
+                        liegen. Laut Gesetz erlischt das Urheberrecht erst siebzig Jahre nach dem
+                        Tod des Urhebers; da Farkas erst 2005 verstorben ist, bestehen an der Arbeit
+                        weiterhin urheberrechtliche Ansprüche (§ 64 UrhG). Die Abbildungslücken für
+                        die gezeigten Werke Beckmanns im Bildindex haben im Übrigen andere Gründe:
+                        Als die Objekte in der Datenbank erfasst wurden, standen keine Aufnahmen zur
+                           Verfügung.<note type="footnote">Vgl. Information entstammt einer E-Mail,
+                           die die Autorin am 23. Februar 2023 vom Bildindex auf eine Anfrage hin
+                           erhalten hat.</note>
+                     </p>
+                     <figure>
+                        <graphic xml:id="luecke_001" url=".../medien/luecke_001.png">
+                           <desc>
+                              <ref type="graphic" target="#abb1">Abb. 1</ref>: Abbildungslücken in
+                              der Online-Sammlung der BStGS. Ausschnitt aus der Ergebnisliste für
+                              die Suche mit ›Max Beckmann‹. [Quelle: <ref type="bibliography"
+                                 target="#bsgs_sammlung_2022">Bayerische Staatsgemäldesammlungen
+                                 (Hg.) 2022</ref>]<ref type="graphic" target="#luecke_001"/>
+                           </desc>
+                        </graphic>
+                     </figure>
+                     <figure>
+                        <graphic xml:id="luecke_002" url=".../medien/luecke_002.png">
+                           <desc>
+                              <ref type="graphic" target="#abb2">Abb. 2</ref>: Abbildungslücken im
+                              Bildindex. Ausschnitt aus der Ergebnisliste für die werkbezogene Suche
+                              mit ›Max Beckmann‹. [Quelle: <ref type="bibliography"
+                                 target="#ddk_bildindex_2022">Deutsches Dokumentationszentrum für
+                                 Kunstgeschichte (Hg.) 2022</ref>]<ref type="graphic"
+                                 target="#luecke_002"/>
+                           </desc>
+                        </graphic>
+                     </figure>
+                     <p>Die <bibl>
+                           <title type="desc">Datenbank zum ›Central Collecting Point
+                              München‹</title>
+                        </bibl> enthält Digitalisate verschiedener Karteikartenreihen, die im
+                        Münchner Collecting Point von den Alliierten nach dem Zweiten Weltkrieg
+                        angelegt wurden und die die Objekte aus den verschiedenen Sammeldepots der
+                        Nationalsozialist*innen dokumentieren und näher beschreiben.<note
+                           type="footnote">Vgl. <ref type="bibliography"
+                              target="#kocourek_leitfaden_2019">Kocourek et al.</ref>, S. 2.</note>
+                        Auch die <bibl>
+                           <title type="desc">Datenbank CCP München</title>
+                        </bibl> enthält Abbildungslücken, so z. B. in der Karteikartenreihe, die die
+                        Abgaben an die Jewish Restitution Successor Organization (JRSO) verzeichnet.
+                        Fehlende Scans von Karteikarten werden durch einen schwarzen Platzhalter mit
+                        dem Hinweis <quote>kein Bild</quote> ersetzt.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#dhm_datenbank_2009">Deutsches
+                              Historisches Museum (Hg.) 2009</ref><hi rend="italic">. </hi>Eine
+                           Suche mit der Münchner-Nummer 1780 in der Kartei JRSO zeigt eine solche
+                           Abbildungslücke. </note> Die Datenbank <bibl>
+                           <title type="desc">CCP</title>
+                        </bibl> enthält eine weitere Abbildungslücke; um Speicherkapazitäten
+                        einzusparen, wurden leere Rückseiten von Karteikarten aus dem Bundesarchiv
+                        nicht gescannt. Stattdessen wird der Vermerk <quote>keine
+                           Eintragungen</quote> verwendet.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#enderlein_datenbank_2023">Enderlein /
+                              Flacke</ref>.</note> Beispiele hierfür finden sich in der
+                        Kontrollnummernkartei, so etwa für die Münchner-Nummern 2/1-2 oder 48.<note
+                           type="footnote">Vgl. <ref type="bibliography"
+                              target="#dhm_datenbank_2009">Deutsches Historisches Museum (Hg.)
+                              2009</ref>.</note> Im Kontext dieser Datenbank mögen die fehlenden
+                        Rückseiten weniger problematisch sein, da sie keine weiteren
+                        Objektinformationen enthalten. Das Beispiel verdeutlicht aber, dass das
+                        Digitale oftmals nur eine Auswahl zeigt und fehlender Speicherplatz oder
+                        eben auch rechtliche Restriktionen Gründe dafür sein können. Aufnahmen von
+                        z. B. Gemälderückseiten fehlen tatsächlich in fast allen Datenbanken und
+                        können deshalb grundsätzlich als Abbildungslücken verstanden werden. Gründe
+                        hierfür sind zahlreich: Sie zeigen oftmals private Informationen und können
+                        aufgrund von datenschutzrechtlichen Bestimmungen nicht gezeigt werden.
+                        Weiter sind fehlender Speicherplatz oder fehlende Ressourcen für die
+                        Digitalisierung zu benennen. </p>
+                     <p>Für die Provenienzforschung sind fehlende Objektabbildungen besonders
+                        problematisch, da sie eine eindeutige Identifikation und damit eine
+                        (erfolgreiche) Recherche behindern. Die <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>-Datenbank, die Such- und Fundmeldungen von Kulturgütern verzeichnet,
+                        die im Zuge der NS-Diktatur oder des Zweiten Weltkriegs beschlagnahmt,
+                        enteignet oder verlagert wurden, verdeutlicht diese Problematik.<note
+                           type="footnote">Vgl. <ref type="bibliography" target="#sdzk_ueber_2000"
+                              >Stiftung Deutsches Zentrum Kulturgutverluste (Hg.)
+                           2000b</ref>.</note> Stand Januar 2023 verzeichnet die Datenbank 173.942
+                        Meldungen, wobei fast doppelt so viel Such- wie Fundmeldungen vorhanden
+                           sind.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste
+                              (Hg.) 2000a</ref>. </note> In der Datenbank befinden sich zahlreiche
+                        Abbildungslücken, die eine Objektidentifikation und damit die Feststellung
+                        eines unrechtmäßigen Entzugs behindern. Eine Suche mit ›Beckmann‹
+                        verdeutlicht diese Abbildungslücke in <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>: 53 Meldungen werden gelistet, wobei nur für 8 Objekte Abbildungen
+                        vorhanden sind.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste
+                              (Hg.) 2000a</ref>. Anzahl Treffer und Hinweise zu Abbildungen
+                           entsprechen dem Stand der Datenbank am 14. Januar 2023. </note> Das
+                        Beispiel <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> verdeutlicht, dass digitale Lücken eben auch auf bereits lückenhafte
+                        analoge Bestände zurückzuführen sind.</p>
+                     <p>Die Staatlichen Kunstsammlungen Dresden (SKD) haben sich dazu entschieden,
+                        einige Abbildungen aufgrund ethischer Bedenken nicht in ihrer <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> darzustellen. Hintergrundinformationen finden sich in den <bibl>
+                           <title type="desc">Ethischen Leitlinien der Online Collection</title>
+                        </bibl>:<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#skd_leitlinien_2023">Ethische Leitlinien der Online
+                              Collection 2023</ref>.</note>
+                     </p>
+                     <p>
+                        <quote type="grosszitat">Wir möchten die Benutzer*innen der Datenbank darauf
+                           hinweisen, dass einige Fotografien aus den Sammlungen der
+                           ethnographischen Museen Forschung an Personen und Kulturen mit
+                           wissenschaftlichen Methoden und Begrifflichkeiten des 19. und frühen 20.
+                           Jahrhunderts widerspiegeln und damit Menschen auf eine Weise dargestellt
+                           werden, die heute als verletzend angesehen werden kann. […] Wegen
+                           ethischer Bedenken erscheinen einige Datensätze mit einem Platzhalter
+                           anstelle einer Abbildung.</quote>
+                        <note type="footnote"><ref type="bibliography" target="#skd_leitlinien_2023"
+                              >Ethische Leitlinien der Online Collection 2023</ref>.</note>
+                     </p>
+                     <p>Auch in der Provenienzforschung werden Debatten über die Veröffentlichung
+                        von historischem Material mit problematischen oder sensiblen Inhalten
+                        geführt, vor allem in Bezug auf Kulturgüter aus kolonialen Kontexten oder
+                        NS-Raubkunst. Es ist deshalb anzunehmen, dass Abbildungslücken aufgrund
+                        ethischer Bedenken zukünftig noch zunehmen werden. Entscheidungen, bestimmte
+                        Inhalte nicht zu zeigen, stehen dabei immer im Zwiespalt zwischen einer
+                        moralischen Verantwortung und der Forderung nach Transparenz und
+                        Zugänglichkeit des Materials.</p>
+                  </div>
+                  <div type="subchapter">
+                     <head>3.1.2 Begriffslücken</head>
+                     <p>Die Veröffentlichung von historischen Begriffen im Netz hat nicht nur in der
+                        deutschen Forschungsgemeinschaft zu einer Debatte über die Reproduktion
+                        rassistischer und diskriminierender Begriffe im Digitalen geführt. In der
+                        Kunstgeschichte und Provenienzforschung geschieht dies z. B. in Hinblick auf
+                        Werktitel oder bestimmte historische Begrifflichkeiten. Im Kontext der
+                        NS-Raubkunst sind dies z. B. Begriffe, die Ausdruck nationalsozialistischer
+                        Ideologie sind und im heutigen Sprachgebrauch nicht mehr verwendet werden.
+                        Datenbankbetreibende, die das historische Material und die darin enthaltenen
+                        Begriffe veröffentlichen, müssen sich schließlich die Frage stellen, wie sie
+                        mit problematischen Begriffen umgehen. Die SKD haben sich für ihre <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> dafür entschieden, historische Werktitel mit Anführungszeichnen zu
+                        kennzeichnen und problematische Begriffe in Werktiteln oder Beschreibungen
+                        durch Sternchen (****) zu ersetzen. Durch letzteren Vorgang entsteht im
+                        Digitalen eine partielle Lücke. Der Forderung nach historischer Faktizität
+                        wird dadurch begegnet, dass der*die Nutzer*in die Möglichkeit hat, in der
+                        Objektansicht die Einblendung der Begriffe zu aktivieren.<note
+                           type="footnote">Vgl. <ref type="bibliography"
+                              target="#skd_leitlinien_2023">Ethische Leitlinien der Online
+                              Collection 2023</ref>.</note> Ein Beispiel hierfür ist das Objekt <bibl>
+                           <title type="desc">Taler</title>
+                        </bibl> (<bibl>
+                           <title type="desc">Speciestaler</title>
+                        </bibl>, sogenannter <bibl>
+                           <title type="desc">***kopftaler</title>
+                        </bibl>);<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#skd_studer_2023">Studer, Taler (Speciestaler, sogenannter
+                              ***kopftaler)</ref>.</note> nach dem Klick auf den Werktitel erscheint
+                        ein weiteres Feld, das es dem Nutzenden erlaubt, die Ansicht zu ändern und
+                        damit die digitale Lücke zu schließen (vgl. <ref type="graphic"
+                           target="#luecke_003">Abbildung 3</ref>).</p>
+
+                     <figure>
+                        <graphic xml:id="luecke_003" url=".../medien/luecke_003.png">
+                           <desc>
+                              <ref type="graphic" target="#abb3">Abb. 3</ref>: Anzeige des
+                              Disclaimers (nach Klick auf die Asterisken) auf einer Objektansicht
+                              innerhalb der Online Collection der SKD. [Quelle: Johann Gotthelf
+                              Studer (Münzmeister): Taler (Speciestaler, sogenannter ***kopftaler),
+                              1828, <ref type="bibliography" target="#skd_collection_2023"
+                                 >Staatliche Kunstsammlungen Dresden. Online Collection
+                                 2023</ref>]<ref type="graphic" target="#luecke_003"/>
+                           </desc>
+                        </graphic>
+                     </figure>
+                     <p>Auch <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> hat sich dazu entschieden, bestimmte problematische Begriffe
+                        auszublenden; zukünftig sollen weitere Begriffe – auch in anderen Sprachen –
+                           hinzukommen.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#kik_laura_2022">Laura 2023</ref>.</note>
+                     </p>
+                     <p>
+                        <quote type="grosszitat">[W]ir haben uns bei der Anzeige auf erster Ebene
+                           für eine Ausblendung in Form von anklickbaren Sternchen sowie für die
+                           Anzeige eines Hinweises entschieden. […] Sie als Nutzer*innen können sich
+                           jetzt auf der zweiten Ebene für eine Anzeige in diesem einen Fall oder
+                           für eine Anzeige aller Begriffe während Ihrer gesamten Session
+                           entscheiden. In diesem ersten Schritt werden automatisch vier
+                           deutschsprachige diskriminierende Begriffe (I***, M***, N***, Z***) in
+                           Titeln, Beschreibungen und bei den Schlagwörtern ausgeblendet.</quote>
+                        <note type="footnote"><ref type="bibliography" target="#kik_laura_2022"
+                              >Laura 2023</ref>. </note>
+                     </p>
+                     <p>Die SKD und <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> haben sich mit ihrer Entscheidung, problematische Begriffe
+                        auszublenden, bewusst für eine digitale Lücke entschieden und damit eine
+                        mögliche Umgangsart aufgezeigt. Die SKD verfolgen damit einen
+                           <quote>didaktischen Ansatz, der die Historie des Begriffs nicht
+                           ausblendet, sondern sie im Gegenteil sichtbar macht; da wird Bewusstsein
+                           geschaffen.</quote>
+                        <note type="footnote"><ref type="bibliography" target="#soltau_debatte_2021"
+                              >Soltau 2021</ref>.</note> Beide Datenbanken nehmen damit – zumindest
+                        in Deutschland – eine Vorreiterrolle ein. </p>
+                  </div>
+                  <div type="subchapter">
+                     <head>3.1.3 Informationslücken</head>
+                     <p>Trotz der Informationsflut im digitalen Raum sind auch hier
+                        Informationslücken zu finden.<note type="footnote">Die Ausführungen beziehen
+                           sich nur auf Informationslücken, die im Digitalen oder zum Teil auch nur
+                           an einer bestimmten Stelle im Digitalen vorkommen. Aufgrund des
+                           thematischen Schwerpunkts werden Informationslücken, die auf eine bereits
+                           fehlende Information im Analogen zurückgeführt werden können,
+                           ausgeklammert. </note> Das <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> Bildarchiv hat dies exemplarisch aufgezeigt, indem bei der
+                        Verwendung der Datenbank festgestellt wurde, dass nicht alle bekannten
+                        Informationen aus der Ursprungsdatenbank übernommen wurden. Am Beispiel von
+                        Ernst Ludwig Kirchners (1880–1938) <bibl>
+                           <title type="desc">Cyclamen</title>
+                        </bibl> (1918–1919) aus der Sammlung des Metropolitan Museum of Art (Met) in
+                        New York lässt sich dies exemplarisch zeigen. Während in <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> die wesentlichen Informationen aufgenommen wurden, enthält der
+                        entsprechende Objekteintrag in der <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> des Met weitere Informationen, die in <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> nicht abgebildet werden: eine Werkbeschreibung, Maßangaben, Hinweise
+                        auf Inschriften und andere Markierungen, ausführliche Provenienzangaben,
+                        Ausstellungsgeschichte oder Literaturangaben.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#kik_kirchner_2023">Kirchner, Cyclamen,
+                              Prometheus</ref>; <ref type="bibliography" target="#met_kirchner_2012"
+                              >Kirchner, Cyclamen, The Met Collection</ref>. </note> Damit spiegelt
+                        der Eintrag in <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> nicht den tatsächlichen Wissensstand wider und weist signifikante
+                        Informationslücken auf. Gründe können an dieser Stelle nur spekuliert
+                        werden: Das Met bietet für den Datenaustausch eine Schnittstelle an; aus der
+                        Auflistung der für ein Objekt verfügbaren Metadaten wird ersichtlich, dass
+                        zwar die Maßangaben, aber nicht die anderen identifizierten
+                        Informationslücken abgerufen werden können.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#met_collection_2020">The Metropolitan
+                              Museum of Art Collection API</ref>.</note> Warum die Maßangaben für
+                        Kirchners Gemälde aber in <bibl>
+                           <title type="desc">Prometheus</title>
+                        </bibl> fehlen, kann nicht geklärt werden. Möglich ist, dass die Datenfelder
+                        beider Datenbanken nicht deckungsgleich sind und deshalb einige
+                        Informationen nicht integriert werden können. </p>
+                     <p>Auch Entscheidungen hinsichtlich welche Informationen in eine Datenbank
+                        eingegeben werden sollen, können zu Informationslücken führen. So haben sich
+                        die Verantwortlichen der Datenbank <bibl>
+                           <title type="desc">CCP</title>
+                        </bibl> dafür entschieden, <quote>[…] die Informationen der Sog.
+                           Restitutionskartei nach Münchener Nummer […] für die Eingabe in die
+                           Datenbank [abzuschreiben] […], da sich dort die umfangreichsten Angaben
+                           zum jeweiligen Kunstwerk befinden. Über die Scans von den anderen
+                           Karteikartenreihen, die dem Datensatz angefügt sind, lassen sich die
+                           fehlenden Informationen […] ablesen.</quote>
+                        <note type="footnote"><ref type="bibliography"
+                              target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note>
+                        Damit sind in den Datenfeldern nicht alle bekannten Informationen zum Werk
+                        ersichtlich, wobei eine Differenz zwischen analogem und digitalem Wissen
+                        besteht. Eine weitere Informationslücke, die nicht nur in den hier
+                        vorgestellten Datenbanken zu beobachten ist, betrifft die (fehlenden)
+                        Angaben zur Provenienz der Objekte. Obwohl Informationen zu Eigentums- und
+                        Besitzverhältnissen oft auch im Analogen fehlen – also grundsätzlich
+                        unbekannt sind –, ist die Abwesenheit von Provenienzangaben ein häufig zu
+                        beobachtendes Phänomen im Digitalen. Gründe hierfür sind mannigfaltig und
+                        reichen von einer bewussten Zurückhaltung der besitzenden Institutionen bis
+                        hin zu technischen Limitationen der Datenbanksysteme.<note type="footnote"
+                           >Vgl. <ref type="bibliography" target="#haffner_provenienzforschung_2019"
+                              >Haffner 2019</ref>, S. 93, 95–96.</note>
+                     </p>
+                  </div>
+                  <div type="subchapter">
+                     <head>3.1.4 Übersetzungslücken</head>
+                     <p>Webseiten deutscher Museen und andere Datenbanken bieten Zugang zu Wissen
+                        über Sammlungsobjekte, Künstler*innen oder Ausstellungen, unabhängig vom
+                        Standort der Nutzenden. Bei der Verwendung verschiedener Seiten wird
+                        allerdings eine Lücke deutlich, die den Zugang wiederum erheblich
+                        einschränkt: Beim Wechsel von der deutschen in eine andere Sprachversion
+                        fallen einige Inhalte weg; dies betrifft sowohl die Hauptseite als auch die
+                        digitalen Objektsammlungen. Die SKD stellen neben Deutsch insgesamt zehn
+                        weitere Sprachversionen für ihre Webseite zur Auswahl. Die Sprache kann in
+                        einem Dropdown-Menü oben rechts verändert werden.<note type="footnote">Vgl.
+                              <ref type="bibliography" target="#skd_2023">Staatliche Kunstsammlungen
+                              Dresden</ref>. </note> Beim Wechsel in eine andere Sprache reduziert
+                        sich der Inhalt allerdings merklich. Auch für die englische Seite ist dies
+                        zu beobachten, wenn auch vergleichsmäßig wenig.<note type="footnote">Vgl.
+                              <ref type="bibliography" target="#skd_eng_2023">Staatliche
+                              Kunstsammlungen Dresden [englische Sprachversion] 2023</ref>.</note>
+                        Obwohl auf der englischen Hauptseite der Inhalt fast vollständig vorhanden
+                        ist, manifestiert sich eine signifikante Übersetzungslücke vor allem in
+                        Bezug auf die <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl>, die weiterhin auf Deutsch erscheint.<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#skd_online_2023">Staatliche
+                              Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Eine
+                        Möglichkeit ins Englische zu wechseln ist an dieser Stelle nicht
+                        ersichtlich. Das Fehlen der englischen Version ist besonders für nicht
+                        deutschsprachige Nutzer*innen problematisch, für welche die Inhalte
+                        schlichtweg unverständlich sind. </p>
+                     <p>Das Problem fehlender Übersetzungen betrifft fast alle deutschsprachigen
+                        Datenbanken, das Ausmaß der Lücke variiert allerdings, vor allem für die
+                        online Sammlungen der Museen. So existieren für einige Datenbanken überhaupt
+                        keine englischen Versionen, z. B. für die <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> der SKD oder den <bibl>
+                           <title type="desc">Objektkatalog</title>
+                        </bibl> des GNM, während in anderen Datenbanken ein Großteil der
+                        Informationen ins Englische übersetzt wird. Die Digitale Sammlung des
+                        Städels besticht im Vergleich zu anderen musealen Bestandskatalogen im Netz
+                        durch eine fast vollständige Übersetzung der Objektinformationen. Der
+                        Datensatz für Max Beckmanns <bibl>
+                           <title type="desc">Die Synagoge in Frankfurt am Main</title>
+                        </bibl> (1919) zeigt dies exemplarisch; er enthält eine englische
+                        Werkbeschreibung, Informationen zum Erwerb und weitere
+                           Objektinformationen.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#staedel_beckmann_2023">Beckmann, The Synagogue in Frankfurt
+                              am Main</ref>.</note> Eine Ausnahme bilden die Provenienzangaben, die
+                        weiterhin auf Deutsch erscheinen. Dies ist vor allem im Kontext der
+                        NS-Raubkunst äußerst problematisch, da Nachkommen der Opfer zumeist kein
+                        Deutsch sprechen. Dieselbe Problematik besteht auch für die <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>-Datenbank: Obwohl hier ein Wechsel in eine englische Sprachversion
+                        möglich ist<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste
+                              (Hg.) 2000a</ref>. </note>, werden bei einigen wenigen Meldungen die
+                        Objektangaben nicht vollständig übersetzt. Eine stichprobenartige Durchsicht
+                        zeigt zwar, dass dies auf die meisten Einträge nicht zutrifft, aber eben
+                        nicht auf alle.<note type="footnote"> Vgl. <ref type="bibliography"
+                              target="#art_beckmann_2011">Beckmann, Blumenstrauß in einer Vase;
+                              Kirchner, Umschlagzeichnung zu Boßharts </ref>
+                           <bibl>
+                              <title type="desc">Neben der Heerstraße</title>
+                           </bibl>.</note> Auf den ersten Blick ist nicht nachvollziehbar, warum
+                        einige Angaben weiterhin auf Deutsch erscheinen. Um mehr über die Ursachen
+                        der Lücken zu erfahren, wurde das Deutsche Zentrum Kulturgutverluste (DZK),
+                        Betreiber der Datenbank, kontaktiert. Die Rückmeldung gibt wertvolle
+                        Einblicke. Privatpersonen oder Institutionen werden zwar darum gebeten,
+                        Such- und Fundmeldungen auch auf Englisch abzugeben, eine Pflicht besteht
+                        allerdings nicht. Nur wenn die Melder*innen aus dem Ausland stammen, werden
+                        die Daten zumeist in englischer Sprache abgegeben. Die Datenbank enthält
+                        neben vorgegebenen Datenfeldern auch Freitextfelder<note type="footnote"
+                           >Vgl. <ref type="bibliography" target="#sdzk_art_2023">Stiftung Deutsches
+                              Zentrum Kulturgutverluste (Hg.) 2023</ref>.</note>, die aufgrund
+                        fehlender Normen nicht automatisch übersetzt werden; eine Übersetzung der
+                        Freitextfelder kann schließlich nur manuell erfolgen. Die Verwendung von
+                        kontrolliertem Vokabular könnte dabei helfen, diese digitalen Lücken zu
+                        schließen: Im Moment verwendet <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> für einige Datenfelder kontrolliertes Vokabular; im Rahmen eines
+                        geplanten <term type="dh">relaunch</term> der internen Datenbank soll dieses
+                        erweitert und sodann auch englische Begriffe integriert werden. Zudem wird
+                        von den Betreibern auf eine Lücke hingewiesen, die gegenwärtig nicht mehr
+                        sichtbar ist: Die <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>-Datenbank war auch in einer russischen Sprachversion verfügbar, die
+                        allerdings seit einigen Jahren nicht mehr online ist. Grund hierfür sind
+                        fehlende personelle und finanzielle Ressourcen für die Übersetzungsarbeit.
+                        Auch der Einsatz von KI-basierten Übersetzungswerkzeugen wie <bibl>
+                           <title type="desc">DeepL</title>
+                        </bibl> oder <bibl>
+                           <title type="desc">Google Translate</title>
+                        </bibl> könnte zur Schließung der Übersetzungslücken beitragen; doch obwohl
+                        diese sehr gute Ergebnisse produzieren, werden sie selten von
+                        Datenbankbetreibern verwendet. Auch hier werden Mitarbeitende mit
+                        entsprechendem Fachwissen benötigt, wofür wiederum Ressourcen fehlen.<note
+                           type="footnote">Die Ausführungen zur Lost Art-Datenbank sind einer E-Mail
+                           entnommen, die die Autorin am 20. Januar 2023 vom DZK auf eine Anfrage
+                           hin erhalten hat. </note>
+                     </p>
+                     <p>Eine fehlende oder lückenhafte Übersetzung der Datenbankinhalte ist ein
+                        Problem vieler deutschsprachiger Datenbanken – vor allem im Kulturbereich.
+                        Die Rückmeldung der Betreiber*innen der <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>-Datenbank erlaubt wertvolle Rückschlüsse auf die Gründe für fehlende
+                        Sprachversionen bzw. fehlende Übersetzungen von Objektinformationen. Eine
+                        Ursache ist die Verwendung von Freitextfeldern, die nicht automatisch
+                        übersetzt werden. Da Provenienzangaben häufig in diesen erfasst werden,
+                        fehlen Übersetzungen vor allem für diese Objektinformationen.<note
+                           type="footnote">Vgl. <ref type="bibliography"
+                              target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S.
+                           95–96; siehe Beispiel: <ref type="bibliography"
+                              target="#staedel_beckmann_2023">Beckmann, The Synagogue in Frankfurt
+                              am Main</ref>. </note> Schließlich ist deutlich geworden, dass vor
+                        allem fehlende Ressourcen problematisch sind, denn sie produzieren digitale
+                        Lücken und verhindern ihre Schließung, durch z. B. eine manuelle Übersetzung
+                        oder den Einsatz von KI-Technologien. </p>
+                  </div>
+                  <div type="subchapter">
+                     <head>3.1.5 Gelöschte Daten</head>
+                     <p>Das DZK veranstaltet in Kooperation mit dem Centre for Anthropological
+                        Research on Museums and Heritage (CARMAH) die Veranstaltungsreihe
+                        ›Kolloquium Provenienzforschung‹. Im Rahmen der Reihe fand am 27. Juni 2022
+                        ein Vortrag zu <bibl>
+                           <title type="desc"> Lost Art und Löschungen</title>
+                        </bibl> statt.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#kulturgutverluste_2022">Kulturgutverluste / German Lost Art
+                              Foundation 2022</ref>.</note> Anlass waren mehrere Gerichtsverfahren,
+                        in denen verschiedene Kläger*innen die Löschung von Meldungen gefordert
+                        hatten. Begründet wurde dies damit, dass eine Veröffentlichung in <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> den Eindruck erwecke, es handele sich erwiesenermaßen um
+                        NS-Raubkunst, und das Objekt dadurch schwer verkäuflich sei.<note
+                           type="footnote">Vgl. <ref type="bibliography"
+                              target="#kulturgutverluste_2022">Kulturgutverluste / German Lost Art
+                              Foundation 2022</ref>. Die Grundsätze zur Eintragung und Löschung von
+                           Meldungen in die Lost Art-Datenbank sagen dazu folgendes: <quote>Mit der
+                              Dokumentation eines Einzelobjekts oder einer Sammlung in der Lost
+                              Art-Datenbank ist nicht die Feststellung verbunden, dass es sich dabei
+                              tatsächlich um ein NS-verfolgungsbedingt entzogenes oder im
+                              Zusammenhang mit dem Zweiten Weltkrieg verbrachtes oder
+                              abhandengekommenes Kulturgut handelt.</quote> (<ref
+                              type="bibliography" target="#grundsaetze_2018">Lost Art-Datenbank,
+                              Grundsätze zur Eintragung und Löschung von Meldungen in die Lost
+                              Art-Datenbank 2018</ref>, S. 2.)</note> Im Moment können <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl>-Einträge entweder auf schriftlichen Antrag des*der Melder*in hin
+                        oder durch die Betreiber selbst gelöscht werden; im ersten Fall ist keine
+                        Begründung notwendig.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#grundsaetze_2018">Grundsätze zur Eintragung und Löschung von
+                              Meldungen in die Lost Art-Datenbank 2018</ref>, S. 4. Das DZK kann
+                           eine Meldung löschen, wenn z. B. unrichtige Angaben gemacht wurden oder
+                           neue Erkenntnisse die Plausibilität einer Meldung, die bereits
+                           eingetragen wurde, in Frage stellen (vgl. <ref type="bibliography"
+                              target="#grundsaetze_2018">Grundsätze zur Eintragung und Löschung von
+                              Meldungen in die Lost Art-Datenbank 2018</ref>, S. 4).</note> Der
+                        Vorgang der Löschung in <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> gestaltet sich also relativ einfach und die Löschungen selbst
+                        bleiben für den Nutzenden unsichtbar. Im Sinne einer vollständigen
+                        Objektbiografie ist eine Entfernung aus <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> aber zumindest aus Sicht der Provenienzforschung problematisch. Es
+                        wird deshalb von vielen gefordert, dass Löschungen markiert werden sollen,
+                        um nachvollziehbar zu sein. </p>
+                     <p>Es ist anzunehmen, dass die Datenlöschung eine gängige Praxis ist, wovon
+                        viele Datenbanken betroffen sind, wobei das digitale Format eine einfache
+                        und schnelle Löschung noch zusätzlich begünstigt. Nicht nur für <bibl>
+                           <title type="desc">Lost Art</title>
+                        </bibl> müssen deshalb Grundsatzfragen gestellt werden: Sollte man
+                        existierende Datensätze überhaupt löschen können und muss (und wenn ja, wie)
+                        man diese Vorgänge kennzeichnen? Für Nutzende von Datenbanken bleiben diese
+                        Vorgänge und die dadurch entstandenen Lücken zumeist unsichtbar. Dies gilt
+                        allerdings nicht für Datensätze, die über einen <term type="dh">Persistent
+                           Identifier</term> verfügen; werden Datensätze gelöscht, führt dieser Link
+                        ins Leere. An diesem Punkt wird die Löschung für den Nutzenden sichtbar.</p>
+                  </div>
+                  <div type="subchapter">
+                     <head>3.1.6 Digitale Bestandslücken</head>
+                     <p>Der digitale Raum erscheint unendlich; die enorme Menge der dort verfügbaren
+                        Daten lässt die Vermutung zu, dass dort alles zu finden sei. Tatsächlich
+                        aber bestehen im Digitalen signifikante Bestandslücken. Diese zeigen sich im
+                        Besonderen in den online Sammlungen der Museen, denn die dort verfügbaren
+                        Datenbestände entsprechen nicht den tatsächlichen Objektbeständen im
+                        Analogen. Zudem besteht in den meisten Fällen eine Diskrepanz zwischen den
+                        in den internen Museumsdatenbanken erfassten und im Netz veröffentlichten
+                        Beständen. Die digitalen Bestandslücken werden dabei erst im Vergleich zu
+                        den analogen Beständen oder eben den digitalen Beständen, die zwar erfasst,
+                        aber noch nicht veröffentlicht wurden, sichtbar. </p>
+
+                     <figure>
+                        <graphic xml:id="luecke_004" url=".../medien/luecke_004.png">
+                           <desc>
+                              <ref type="graphic" target="#abb4">Abb. 4</ref>: Tagesaktuelle
+                              Zahlenangaben zum Erfassungsstand auf der Startseite der Online
+                              Collection der SKD. Screenshot vom 23. Januar 2023. [Quelle: <ref
+                                 type="bibliography" target="#skd_online_2023">Online Collection,
+                                 Staatliche Kunstsammlungen Dresden</ref>]<ref type="graphic"
+                                 target="#luecke_004"/>
+                           </desc>
+                        </graphic>
+                     </figure>
+                     <p>Die Einstiegsseite der <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> der SKD gibt Auskunft über die Anzahl der Objekte, die sich derzeit
+                        in der online Sammlung befinden (vgl. <ref type="graphic"
+                           target="#luecke_004">Abbildung 4</ref>).<note type="footnote">Vgl. <ref
+                              type="bibliography" target="#skd_collection_2023">Staatliche
+                              Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Stand
+                        23. Januar 2023 sind dies 345.378 Objektdatensätze. Damit ist zumindest ein
+                        Teil der analogen Sammlung, die vermutlich mehr als drei Millionen Objekte
+                        und Archivalien umfasst, digital für jeden zugänglich. Ein Vergleich der
+                        beiden Zahlen lässt aber auch eine große Differenz zwischen dem analogen und
+                        digital zugänglichen Bestand erkennen. Eine weitere Lücke zeigt sich auch im
+                        Vergleich zwischen den digital veröffentlichten und digital ›nur‹ erfassten
+                        Datensätzen, worüber die SKD gleich auf der Einstiegsseite der <bibl>
+                           <title type="desc">Online Collection</title>
+                        </bibl> informieren (vgl. <ref type="graphic" target="#luecke_004">Abbildung
+                           4</ref>). So wurden zwar bereits mehr als 1,7 Millionen Objekte in der
+                        internen Museumsdatenbank <bibl>
+                           <title type="desc">Daphne</title>
+                        </bibl> erfasst, aber eben noch nicht alle veröffentlicht. Eine
+                        Veröffentlichung im Netz bedarf z. B. noch einer Klärung der Bildrechte oder
+                        wissenschaftlichen Kontextualisierung des Objekts.<note type="footnote">Vgl.
+                              <ref type="bibliography" target="#skd_online_2023">Was ist die Online
+                              Collection? 2023</ref>. Die Angaben zum Umfang des analogen Bestandes
+                           sowie zur Erfassung und Veröffentlichung der Objekte im Netz sind einer
+                           E-Mail vom 20. Februar 2023 entnommen, die die Autorin auf Anfrage hin
+                           von den SKD erhalten hat. </note>
+                     </p>
+                     <p>Eine Diskrepanz zwischen analogem und digitalem Bestand lässt sich für die
+                        meisten (deutschsprachigen) Museen manifestieren. Die Sammlung des Städel
+                        Museums <quote>[…] umfasst […] rund 3.100 Gemälde, 660 Skulpturen, über
+                           5.000 Fotografien und über 100.000 Zeichnungen und Grafiken.</quote>
+                        <note type="footnote"><ref type="bibliography" target="#staedel_museum_2023"
+                              >Städelsches Kunstinstitut (Hg.) 2023a</ref>. </note> Das sind
+                        insgesamt rund 108.760 Objekte aus dem frühen 14. Jahrhundert bis in die
+                           Gegenwart.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#staedel_museum_2023">Städelsches Kunstinstitut (Hg.)
+                              2023a</ref>.</note> Auch das Städel hat einen Teil seiner Sammlung ins
+                        Netz gestellt, im Moment sind 31.681 Objekte online zugänglich, davon 1.608
+                        sogenannte ›Hauptwerke‹.<note type="footnote">Vgl. <ref type="bibliography"
+                              target="#staedel_digisammlung_2023">Städelsches Kunstinstitut (Hg.)
+                              2023b</ref>. </note> Im Vergleich zum analogen Bestand wird auch hier
+                        eine signifikante digitale Lücke erkennbar, denn weniger als ein Drittel der
+                        Sammlung ist im Digitalen verfügbar. Eine noch größere Lücke zeigt sich im <bibl>
+                           <title type="desc">Objektkatalog</title>
+                        </bibl> des Germanischen Nationalmuseums in Nürnberg. Der Katalog beinhaltet
+                        im Moment 171.804 Objekte aus der analogen Sammlung, die mit 1.3 Millionen
+                        Objekten (dazu gehören auch die Graphische Sammlung und der
+                        Bibliotheksbestand) den digitalen Bestand bei Weitem übersteigen.<note
+                           type="footnote">Vgl. <ref type="bibliography" target="#gnm_fragen_2023"
+                              >Germanisches Nationalmuseum (Hg.) 2023b</ref>.</note>
+                     </p>
+                     <p>Die genannten Beispiele verdeutlichen, dass es einen erheblichen Unterschied
+                        zwischen analogem und digitalem Museumsbestand gibt. Die Angaben der SKD
+                        (vgl. <ref type="graphic" target="#luecke_004">Abbildung 4</ref>) haben
+                        zudem aufgezeigt, dass es zusätzlich eine Diskrepanz zwischen digital
+                        erfassten und tatsächlich veröffentlichten Objekten gibt. In allen genannten
+                        Fällen können die digitalen Lücken aber durch eine kontinuierliche
+                        Digitalisierung der Bestände geschlossen werden. So schreibt die SKD:
+                           <quote>Der Gesamtbestand der Museen der Staatlichen Kunstsammlungen
+                           Dresden wird in einer umfangreichen Datenbank inventarisiert und
+                           dokumentiert. Mehr als 1,2 Millionen Kunstwerke […] werden so mit den
+                           zugehörigen Daten abgebildet und wissenschaftlich ausgewertet.</quote>
+                        <note type="footnote">Vgl. <ref type="bibliography"
+                              target="#skd_online_2023">Was ist die Online Collection?
+                           2023</ref>.</note> So ist es zukünftig durchaus möglich, dass die
+                        digitalen Bestände den analogen entsprechen; dafür müssen allerdings erst
+                        einmal ausreichend finanzielle und personelle Ressourcen und
+                        Speicherkapazität zur Verfügung gestellt werden. </p>
+                     <p>Die Wahl, was im Digitalen erscheinen darf und was nicht, ist nicht
+                        willkürlich, sondern auf bestimmte Ursachen zurückzuführen. Fehlende
+                        Ressourcen und Speicherkapazitäten sind dabei sicherlich entscheidende
+                        Faktoren und führen dazu, dass bei der Digitalisierung erst einmal eine
+                        Priorisierung erfolgt. So werden Hauptwerke einer Institution bevorzugt
+                        digitalisiert; auch Werke, die unter Besuchenden populär oder von großem
+                        wissenschaftlichem Interesse sind, werden priorisiert. In gewisser Weise
+                        wird dem Objekt also im Vorfeld ein Wert zugesprochen, aufgrund dessen es
+                        digitalisiert wird. Doch auch weitaus praktischere Gründe, wie Größe und
+                        Material, spielen bei der Digitalisierung eine Rolle. Schließlich muss bei
+                        der Betrachtung von digitalen Sammlungen immer von Bestandslücken
+                        ausgegangen und Gründe hierfür hinterfragt werden. Dies ist vor allem dann
+                        notwendig, wenn allgemeine Schlüsse aus der Betrachtung der digitalen
+                        Sammlungen gezogen werden sollen. </p>
+                  </div>
+               </div>
+               <div type="subchapter">
+                  <head>3.2 Fehlende Merkmale in Datenmodellen</head>
+                  <p>Ontologien wie <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> ermöglichen die Modellierung von Daten anhand festgelegter formaler
+                        Begriffssysteme.<note type="footnote">Vgl. <ref type="bibliography"
+                           target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 162.
+                        CIDOC CRM wird im Zuge des Beitrags referenziert, da es ein geeignetes
+                        Begriffssystem für die Datenmodellierung im Bereich des Kulturerbes zur
+                        Verfügung stellt (vgl. <ref type="bibliography"
+                           target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 174;
+                           <ref type="bibliography" target="#cidoc_crm_2022">CIDOC CRM. Conceptual
+                           Reference Model 2022</ref>.</note>
+                     <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> stellt dafür Definitionen und eine formale Struktur zur Beschreibung
+                     von Konzepten in den Daten und Beziehungen untereinander zur Verfügung. Die
+                     Ontologie wird von der CIDOC CRM Special Interest Group, die unter der Obhut
+                     des International Council for Documentation (Komitee des International Council
+                     of Museums) steht, entwickelt und betreut. Zur Arbeitsgruppe gehören private
+                     und öffentliche Institutionen, die mit der Erforschung und Dokumentation der
+                     Menschheitsgeschichte betraut sind.<note type="footnote">Vgl. <ref
+                           type="bibliography" target="#cidoc_crm_2022">CIDOC CRM. Conceptual
+                           Reference Model 2022</ref>.</note>
+                     <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> besteht aus einem Basisstandard, der grundlegende Klassen und
+                     Verbindungen für die Modellierung von Daten aus dem Bereich Kulturerbe vorgibt.
+                     Hinzu kommen Spezialisierungsmodule, die den Ausbau des Standardmodells
+                     ermöglichen und in Zusammenarbeit mit der jeweiligen Fachgemeinschaft
+                     entwickelt werden.<note type="footnote">Vgl. <ref type="bibliography"
+                           target="#cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model
+                        2022</ref>.</note> Die im April 2021 veröffentlichte offizielle Version des <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> gibt einen Überblick über die in der Ontologie enthaltenen Klassen und
+                     Eigenschaften (vgl. <ref type="graphic" target="#luecke_005">Abbildung
+                        5</ref>).<note type="footnote">Vgl. <ref type="bibliography"
+                           target="#cidoc_definition_2021">CIDOC CRM Special Interest Group
+                           2021</ref>. </note> Der Einsatz von Ontologien für die Datenmodellierung
+                     führt dazu, dass </p>
+                  <p>
+                     <quote type="grosszitat">Informationen in ihrem Bedeutungskontext präzise erfasst und
+                           maschinell verarbeitbar gemacht werden […]. Damit sind Ontologien vor
+                           allem im Bereich der Integration heterogener Datenquellen, des Austauschs
+                           und der Wiederverwendung von Wissenselementen sowie der Ermöglichung
+                           logischer Schlussfolgerungen interessant […].</quote><note type="footnote"><ref type="bibliography"
+                              target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S.
+                           162.</note>
+                  </p>
+                  <p>Trotz dieser Chancen haben Datenmodelle im Allgemeinen und Ontologien im
+                     Speziellen einen Nachteil: </p>
+                  <p>
+                     <quote type="grosszitat">Ein Modell ist nicht das Original und auch keine Kopie des Originals.
+                           Anders als eine Kopie hat es nicht alle Merkmale des Originals, sondern
+                           nur ausgewählte. Die Auswahl beruht auf Annahmen des Modellierers,
+                           welche Merkmale für die intendierte Verwendung des Modells relevant
+                           sind.</quote><note type="footnote"><ref type="bibliography"
+                              target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 100.
+                        </note>
+                  </p>
+                  <p>Das Begriffssystem, das <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> zugrunde liegt, wurde innerhalb der CIDOC CRM Special Interest Group
+                     entwickelt und von verschiedenen Akteuren mitgestaltet; es stellt eine
+                     Schnittmenge der wichtigsten Konzepte aus dem Bereich des kulturellen Erbes
+                     dar. Das Modell bildet deshalb ›nur‹ eine Teilmenge aller realweltlichen
+                     Erscheinungen ab, die abhängig vom Anwendungskontext ist. Indem das Modell
+                     nicht alle Merkmale abbildet, entlarvt es sich als lückenhaft. Obwohl die
+                     Möglichkeit besteht, <bibl>
+                        <title type="desc">CIDOC CRM</title>
+                     </bibl> durch kompatible, externe Typenhierarchien zu erweitern<note
+                        type="footnote"> Vgl. <ref type="bibliography"
+                           target="#cidoc_definition_2021">CIDOC CRM Special Interest Group
+                           2021</ref>, S. 27. </note> und damit der Versuch unternommen wird, ein
+                     möglichst integratives Datenmodell zu schaffen, können auch hier zumeist nur
+                     übergreifende Konzepte und Eigenschaften aufgenommen werden. </p>
+
+                  <figure>
+                     <graphic xml:id="luecke_005" url=".../medien/luecke_005.png">
+                        <desc>
+                           <ref type="graphic" target="#abb5">Abb. 5</ref>: Die Abbildung zeigt
+                           beispielhaft die Kodierung für ›Johann Joachim Winkelmann sieht die
+                           Laokoon-Skulptur‹ mit CIDOC CRM. Zudem sind einige im Begriffssystem der
+                           Ontologie enthaltenen Klassen und Eigenschaften abgebildet. [Aus: <ref
+                              type="bibliography" target="#cidoc_definition_2021">CIDOC CRM Special
+                              Interest Group 2021</ref>, S. 36, fig. 2. CC BY 4.0]<ref
+                              type="graphic" target="#luecke_005"/>
+                        </desc>
+                     </graphic>
+                  </figure>
+               </div>
+            </div>
+            <div type="chapter">
+               <head>4. Die Ursachen der Lücke </head>
+               <p>
+                  <quote type="grosszitat">Soll auch ein ›digitales Gedächtnis‹ angeblich niemals vergessen, ist es
+                        doch vor Fehlstellen und ›Gedächtnislücken‹ genauso wenig gefeit wie sein
+                        rein ›analoges‹ Pendant: sei es durch unwiderrufliches Überschreiben, durch
+                        Abschaltung, durch veraltete Hardware oder schlichtweg Desinteresse. Zudem
+                        erbt es die ›analogen‹ Fehlstellen wie auch ›analogen‹ Vorurteile.</quote><note type="footnote"><ref type="bibliography"
+                           target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note>
+
+               </p>
+               <p>Die digitale Lücke findet häufig ihre Entsprechung im Analogen; vor allem
+                  kriegerische Konflikte tragen zur Entstehung von Lücken bei. In ihrer Folge werden
+                  Objekte oder Schriftgut zerstört, beschlagnahmt oder gestohlen. Die dadurch
+                  entstandenen Lücken sind auch im digitalen Raum sichtbar, wie die Sammlung der <bibl>
+                     <title type="desc">Vermissten Werke</title>
+                  </bibl> der SKD zeigt.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#skd_werke_2023">Vermisste Werke 2023</ref>.</note> Obige
+                  Ausführungen zu möglichen Arten digitaler Lücken haben aber auch aufgezeigt, dass
+                  die Ursachen digitaler Lücken nicht immer im Analogen zu suchen sind. Die
+                  folgenden Abschnitte bündeln diese Ursachen noch einmal. </p>
+               <p>Technische Gründe und dadurch bedingte Limitationen generieren Lücken im
+                  Digitalen. Fehlende Speicherkapazitäten können dazu führen, dass bei der
+                  Digitalisierung der analogen Sammlungsbestände eine Priorisierung erforderlich
+                  ist. So digitalisieren Museen z. B. Hauptwerke, um diese auf ihrer Webseite
+                  werbewirksam präsentieren zu können. Die Bearbeiter*innen der <bibl>
+                     <title type="desc">Datenbank CCP</title>
+                  </bibl> entschieden sich dafür, aufgrund eines nicht ausreichenden Speicherumfangs
+                  auf das Scannen von leeren Karteikartenrückseiten zu verzichten.<note
+                     type="footnote"> Vgl. <ref type="bibliography"
+                        target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note> Weitere
+                  technisch bedingte Ursachen beziehen sich auf die Verwendung von standardisierten
+                  Datenfeldern, die keine flexible Eingabe von Informationen erlauben und deshalb
+                  die Aufnahme und Integration von Wissen behindern. Wie die Ausführungen zu
+                  Übersetzungslücken gezeigt haben, produzieren im Umkehrschluss aber auch
+                  Freitextfelder Lücken, da sie aufgrund fehlender Normen nicht automatisch
+                  übersetzt werden. Der Wunsch nach einer Verknüpfung verschiedener Daten oder
+                  maschinellen Verarbeitung verlangt den Einsatz von Datenmodellen, die die Daten in
+                  eine eindeutige und explizite Form bringen.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#jannidis_humanities_2017">Jannidis et al.
+                        2017</ref>, S. 100. </note> Obige Ausführungen haben beispielhaft die im
+                  Bereich des kulturellen Erbes mehrheitlich eingesetzte Ontologie <bibl>
+                     <title type="desc">CIDOC CRM</title>
+                  </bibl> vorgestellt.<note type="footnote"><ref type="bibliography"
+                        target="#cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model
+                     2022</ref>.</note> Das der Ontologie zugrundeliegende Begriffssystem umfasst
+                  dabei <quote>[…] Begrifflichkeiten[, die] in dem Gegenstandsbereich der
+                     Museumssammlungen weiträumig geteilt [werden].</quote>
+                  <note type="footnote"><ref type="bibliography" target="#jannidis_humanities_2017"
+                        >Jannidis et al. 2017</ref>, S. 174.</note> Derzeit stellt <bibl>
+                     <title type="desc">CIDOC CRM</title>
+                  </bibl> eine Terminologie mit 99 Klassen und 198 Eigenschaften zur Verfügung, um
+                  das in den Daten vorhandene Wissen angemessen repräsentieren zu können.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#cidoc_definition_2021"
+                        >CIDOC CRM Special Interest Group 2021</ref>.</note> Obwohl damit ein
+                  Großteil der Dateninhalte und Merkmale erfasst werden können, beinhaltet das
+                  Modell eben ›nur‹ eine Auswahl an ›weiträumig‹ geteilten Begriffen, die sich u. a.
+                  an dem Verwendungszweck orientiert.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#jannidis_humanities_2017">Jannidis et al.
+                        2017</ref>, S. 100. </note> Indem das resultierende Datenmodell eben nicht
+                  alle Merkmale des Originals aufgreifen kann, offenbart es sich als lückenhaft und
+                  Lücken generierend. </p>
+               <p>Neben technisch bedingten Gründen konnten noch weitere Ursachen für die Entstehung
+                  von Lücken identifiziert werden. <quote>Publishing data online is also bound to
+                     certain licenses and copyrights that institutions have for their images and
+                     other digital materials.</quote>
+                  <note type="footnote"><ref type="bibliography" target="#luther_digitization_2022"
+                        >Luther 2022</ref>. </note> Rechtliche Restriktionen wie Lizenzen oder
+                  Urheberrechte zählen zu den Hauptverursachern digitaler Lücken. Im Kontext der
+                  Kunstgeschichte und Provenienzforschung sind dies häufig fehlende Abbildungen von
+                  Kunstwerken, die aufgrund bestehender urheberrechtlicher Ansprüche nicht gezeigt
+                  werden. In Deutschland besitzen Kunstschaffende sämtliche Rechte an ihren Werken
+                  und können entsprechend darüber bestimmen, wie diese von Dritten genutzt werden
+                     können.<note type="footnote">Vgl. <ref type="bibliography"
+                        target="#bvbk_urheberrecht_2023">Bundesverband Bildender Künstlerinnen und
+                        Künstler (Hg.) 2023</ref>.</note> Erst siebzig Jahre nach dem Tod des
+                  Künstlers / der Künstlerin erlischt das Urheberrecht und die geschützten Werke
+                  sind gemeinfrei (§ 64 UrhG). Die für diesen Beitrag betrachteten Datenbanken haben
+                  unterschiedliche visuelle Lösungen gefunden, um diese Lücken zu kennzeichnen (vgl.
+                     <ref type="graphic" target="#luecke_001">Abbildung 1</ref> und <ref
+                     type="graphic" target="#luecke_002">Abbildung 2</ref>). </p>
+               <p>Vor allem im Kontext der Provenienzforschung wird eine Debatte über den Umgang mit
+                  sensiblen Inhalten und im Besonderen mit rassistischen und diskriminierenden
+                  Begriffen geführt. Das Beispiel der SKD hat gezeigt, wie aufgrund ethischer
+                  Bedenken Lücken im Digitalen entstehen können. So werden problematische Begriffe
+                  in Werktiteln oder Beschreibungen in der Datenbank durch Sternchen (****) ersetzt.
+                  Der Nutzer / die Nutzerin kann schließlich selbst entscheiden, ob er / sie die
+                  ausgeblendeten Begriffe sehen möchte und muss entsprechend die Ansicht ändern.
+                  Damit haben die SKD demonstriert, welche digitalen Möglichkeiten für den Umgang
+                  mit problematischen Begriffen zur Verfügung stehen, ohne diese ›einfach‹ aus dem
+                  digitalen Raum zu verbannen. Nennenswert ist das Beispiel auch, da die digitale
+                  Lücke an dieser Stelle nicht endgültig ist, sondern durch die Interaktion mit dem
+                  Nutzenden geschlossen werden kann. Während Begriffe sichtbar gemacht werden
+                  können, hat man sich bei einigen Datensätzen dazu entschieden, aufgrund ethischer
+                  Bedenken einen Platzhalter anstatt einer Abbildung zu verwenden.<note
+                     type="footnote">Vgl. <ref type="bibliography" target="#skd_leitlinien_2023"
+                        >Ethische Leitlinien der Online Collection 2023</ref>.</note> Die dadurch
+                  entstandene digitale Lücke ist nicht durch die Nutzenden der Datenbank aufzuheben.
+                     <quote>Publishing data, images and digital materials online should also be
+                     placed under considerations of an ethical distribution of information. Can this
+                     data harm a community or people because it misrepresents information or leaves
+                     certain perspectives, languages and knowledges out.</quote>
+                  <note type="footnote"><ref type="bibliography" target="#luther_digitization_2022"
+                        >Luther 2022</ref>. </note> Überlegungen hinsichtlich der Veröffentlichung
+                  und Verbreitung von problematischen und sensiblen Inhalten – sei es in Bildern,
+                  Texten oder Werktiteln – müssen künftig noch verstärkter in den Blick genommen
+                  werden, vor allem im Kontext von Datenbanken. Obwohl auch im Analogen eine
+                  Relevanz besteht, ist diese im Digitalen aufgrund der enormen Reichweite und
+                  Geschwindigkeit, mit der Informationen reproduziert und verbreitet werden, um ein
+                  Vielfaches gesteigert. </p>
+               <p>Neben ethischen Bedenken können auch strategische Gründe für die Entstehung von
+                  digitalen Lücken verantwortlich sein: So haben sich die Verantwortlichen der <bibl>
+                     <title type="desc"> Datenbank CCP</title>
+                  </bibl> dafür entschieden, nur Informationen aus der <term type="dh"
+                     >Restitutionskartei nach Münchener Nummer</term> in die Datenbank einzutragen,
+                  weil diese die umfangreichsten Angaben zu den Kunstwerken enthält.<note
+                     type="footnote">Vgl. <ref type="bibliography"
+                        target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note> Auch
+                  fehlende Provenienzangaben in Objektdatenbanken sind zum Teil auf strategische
+                  Gründe zurückzuführen; so hat bereits Dorothee Haffner in <bibl>
+                     <title type="desc">Provenienzforschung digital vernetzt</title>
+                  </bibl> auf eine <quote>[…] [gewisse] Zögerlichkeit oder Besorgnis vieler
+                     Museumsdirektor*innen […]</quote>
+                  <note type="footnote"><ref type="bibliography"
+                        target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S. 93.</note>
+                  als Grund fehlender Provenienzen im Netz hingewiesen. Diese Zögerlichkeit mag
+                  verschiedene Gründe haben: So können Personendatenschutzgründe<note
+                     type="footnote">Vgl. <ref type="bibliography"
+                        target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S.
+                  93.</note>, eine allgemeine Unsicherheit in Bezug auf die Art und Weise der
+                  Darstellung von Provenienzinformationen oder eine Besorgnis um das eigene Image
+                  dafür verantwortlich sein. Schließlich haben die Ausführungen zu den möglichen
+                  Arten digitaler Lücken wiederholt auf einen Aspekt hingewiesen, der als eine
+                  Hauptursache genannt werden muss: fehlende personelle und finanzielle Ressourcen!
+                  Sie verhindern sowohl eine Anpassung überholter Datenbanksysteme, als auch den
+                  Einsatz von KI-Technologien für die Übersetzung von Webinhalten. Schließlich führt
+                  das Ressourcen-Problem auch dazu, dass viele Institutionen eine Entscheidung
+                  treffen müssen, was digitalisiert werden soll oder eben nicht und deshalb zur
+                  digitalen Lücke wird. </p>
+
+               <figure>
+                  <graphic xml:id="luecke_006" url=".../medien/luecke_006.png">
+                     <desc>
+                        <ref type="graphic" target="#abb6">Abb. 6</ref>: Eine Typologie der
+                        digitalen Lücke. Die Aufstellung listet die im Beitrag identifizierten
+                        Lücken, Ursachen und weitere Eigenschaften. [Sabine Lang Februar 2023]<ref
+                           type="graphic" target="#luecke_006"/>
+                     </desc>
+                  </graphic>
+               </figure>
+               <p>Die aus der Studie der Datenbanken und Datenmodellierung gewonnenen Erkenntnisse
+                  hinsichtlich der Arten und Ursachen digitaler Lücken sind in der beigefügten
+                  Typologie zusammengefasst (vgl. <ref type="graphic" target="#luecke_006">Abbildung
+                     6</ref>). Der entstandene Katalog ist dabei nicht als ein abgeschlossenes,
+                  sondern als ein dynamisches System zu verstehen, das von Forschenden erweitert
+                  werden soll.</p>
+            </div>
+            <div type="chapter">
+               <head>5. Die digitale Lücke: eine Definition</head>
+               <p>Eine einheitliche Definition der digitalen Lücke im Kontext der Kunstgeschichte
+                  und Provenienzforschung ist aufgrund der unterschiedlichen Arten und Ursachen
+                  nicht möglich. Vielmehr können bestimmende Auffälligkeiten und Eigenschaften
+                  aufgegriffen werden, die auch Bezug auf Definitionen der analogen Lücke nehmen. </p>
+               <p>Eine Lücke ist <quote>[…] eine Stelle, an der etwas fehlt, das dort sein sollte
+                     […].</quote>
+                  <note type="footnote"><ref type="bibliography" target="#goetz_luecke_2019">Götz in
+                        Zusammenarbeit mit der Langenscheidt-Redaktion 2019</ref>, S. 721.</note>
+                  Weiter markiert sie eine fehlende Sache, die eigentlich von Nutzen wäre; das
+                  Fehlen wird deshalb als Mangel empfunden.<note type="footnote">Vgl. <ref
+                        type="bibliography" target="#goetz_luecke_2019">Götz in Zusammenarbeit mit
+                        der Langenscheidt-Redaktion 2019</ref>, S. 721.</note> Das Wörterbuch <bibl>
+                     <title type="desc">Deutsch als Fremdsprache</title>
+                  </bibl> definiert die Lücke als<quote> […] ›(durch ein fehlendes Stück
+                     entstandener) Zwischenraum […] od. leere Stelle in einer Reihe […]‹
+                     […].</quote>
+                  <note type="footnote"><ref type="bibliography" target="#kempcke_luecke_2000"
+                        >Kempcke unter Mitarbeit von Barbara Seelig 2000</ref>, S. 639.</note> Zudem
+                  beziehe sich die Lücke auf <quote>[…] ›etw., was im Bereich sonst vorhandener
+                     Dinge fehlt und als Mangel angesehen wird‹ […].</quote>
+                  <note type="footnote"><ref type="bibliography" target="#kempcke_luecke_2000"
+                        >Kempcke unter Mitarbeit von Barbara Seelig 2000</ref>, S. 639.</note>
+                  Daraus lassen sich für die Lücke wichtige Eigenschaften ableiten: Indem sie mit
+                  einer ›Stelle‹ oder einem ›Zwischenraum‹ gleichgesetzt wird, erhält sie eine
+                  räumliche Dimension. Die Lücke ist Teil einer Einheit und das Fehlen einer Sache
+                  wird erst aufgrund dieser Zugehörigkeit sichtbar. Interessant ist, dass die Lücke
+                  nach diesem Verständnis erst durch einen vergleichenden Blick in Erscheinung tritt
+                  und deshalb immer auch ein Bezugsobjekt benötigt. Für eine Definition der
+                  digitalen Lücke lassen sich viele dieser Eigenschaften übernehmen, wobei an
+                  einigen Stellen Spezifizierungen notwendig sind. </p>
+               <p>Auch die digitale Lücke zeichnet sich durch eine Räumlichkeit aus; die Fehlstelle
+                  wird, zumindest in Bezug auf Abbildungslücken, durch Platzhalter explizit gemacht
+                  und beansprucht dadurch Platz im digitalen Raum. Zudem verlangt die Identifikation
+                  der digitalen Lücke häufig einen komparativen Blick. Am Beispiel von Kirchners <bibl>
+                     <title type="desc">Cyclamen</title>
+                  </bibl> (1918–1919) in der Datenbank <bibl>
+                     <title type="desc">Prometheus</title>
+                  </bibl> wurde dies deutlich. Eine Informationslücke wird erst im Vergleich mit der
+                  Ursprungsdatenbank (Bezugsobjekt) – in diesem Fall die digitale Sammlung des Met –
+                  sichtbar. Obwohl auch die digitale Lücke Teil eines ansonsten sichtbaren Ganzen
+                  ist (z. B. museale Sammlungsbestände), kann es vorkommen, dass Bezugsobjekte
+                  fehlen und digitale Lücken deshalb nicht sichtbar werden (z. B. Bestandslücken,
+                  Datenlöschung). Kann die digitale Lücke nicht identifiziert werden, so kann das
+                  Fehlen einer Sache auch nicht als Mangel empfunden werden. </p>
+               <p>Das Studium verschiedener Datenbanken und der Datenmodellierung als standardisierter
+                  Methode hat zudem weitere Erkenntnisse über die digitale Lücke identifiziert, die
+                  im Folgenden festgehalten werden. Die analoge Lücke ist nicht gleich die digitale
+                  Lücke: Analoge Lücken werden im Digitalen, durch z. B. die Zusammenführung
+                  eigentlich entfernter Bestände oder die Kopie eines Datensatzes, behoben oder es
+                  entstehen durch rechtliche Restriktionen oder den Einsatz von Datenmodellen
+                  weitere Lücken im digitalen Raum. Im Unterschied zur analogen Lücke muss die
+                  digitale Lücke nicht permanent sein und kann durch einfache Funktionalitäten vom
+                  Betrachter / der Betrachterin behoben werden (vgl. <ref type="intern"
+                     target="#hd6">Begriffslücken</ref>). Die Studie hat zudem verdeutlicht, dass
+                  die digitale Lücke ein Resultat bewusster Entscheidungen ist. Was wird digital
+                  erfasst und veröffentlicht und was nicht? Was wird entsprechend als wertvoll und
+                  deshalb digitalisierungswürdig erachtet und was eben nicht?
+                  Digitalisierungsprozesse sind – auch aufgrund fehlender personeller und
+                  finanzieller Ressourcen – (immer auch) wertende Prozesse. </p>
+            </div>
+            <div type="chapter">
+               <head>6. Abschließende Gedanken</head>
+               <p>Das Verfassen des Beitrags und die dafür notwendige intensive Auseinandersetzung
+                  mit digitalen Lücken haben Fragen und daran anschließende Gedanken aufgeworfen,
+                  die nun im abschließenden Teil des Beitrags aufgegriffen werden. </p>
+               <div type="subchapter">
+                  <head>6.1 Warum ist eine Auseinandersetzung mit Lücken vor allem im Digitalen
+                     wichtig? </head>
+                  <p>Eine Auseinandersetzung mit Lücken im Digitalen ist wichtig, da sie im
+                     digitalen Raum oft unsichtbar sind. Die Ausführungen zu den einzelnen Typen
+                     digitaler Lücken haben gezeigt, dass einige für die Nutzenden der Datenbank
+                     unsichtbar sind oder zumindest erst im direkten Vergleich oder mit
+                     entsprechendem Vorwissen über den ursprünglichen Zustand erkannt werden können.
+                     Digitale Bestandslücken werden erst ersichtlich, wenn Nutzende Wissen über den
+                     tatsächlichen analogen Bestand haben. Auch gelöschte Daten sind für Nutzende
+                     zumeist unsichtbar, da sie durch keinen Platzhalter oder Hinweis markiert
+                     werden. Schließlich sind auch die durch den Einsatz von Datenmodellen
+                     entstandenen Lücken unsichtbar, da uns in den meisten Fällen ein Einblick in
+                     den Modellierungsprozess fehlt. </p>
+                  <p>
+                     <bibl>
+                        <title type="desc">Der Geograf</title>
+                     </bibl> (1669) von Johannes Vermeer (1632–1675) ist eines der Hauptwerke der
+                     Städelschen Sammlung und wird entsprechend in der <bibl>
+                        <title type="desc">Digitalen Sammlung</title>
+                     </bibl> des Museums präsentiert: Etliche Audio- und Videobeiträge und
+                     ausführliche Metainformationen stehen Nutzenden der Datenbank zur Verfügung,
+                     zudem werden durch Hinweise auf andere Werke oder in die Seite eingebettete
+                     Verlinkungen Verweise und Verknüpfungen zu externen Inhalten hergestellt.<note
+                        type="footnote">Vgl. <ref type="bibliography" target="#staedel_vermeer_2023"
+                           >Vermeer, Der Geograf.</ref></note> Die Informationsfülle im Digitalen
+                     erschwert die Sichtbarkeit der digitalen Lücke und damit ihre Identifikation
+                     und Reflexion zusätzlich. Dies geschieht vor allem dadurch, dass der Blick
+                     des*der Nutzenden ständig durch neue Inhalte und Angebote abgelenkt wird. Die
+                     Möglichkeit, zwischen einzelnen Webseiten hin und her zu springen, verstärkt
+                     diesen Effekt zusätzlich. Schließlich entsteht durch diese Informationsfülle
+                     auch der Eindruck einer ›verführerischen Vollständigkeit‹.<note type="footnote"
+                        >Der Begriff der ›verführerischen Vollständigkeit‹ geht auf eine
+                        Beschäftigung mit digitalen Rekonstruktionen zurück: <quote>[D]igitale
+                           Modelle, die heutzutage immer häufiger in wissenschaftlichen
+                           Publikationen erscheinen, [vermitteln] oft eine verführerische
+                           Vollständigkeit ohne Nachvollziehbarkeit des spekulativen Anteils
+                           […].</quote> (<ref type="bibliography" target="#schaedler_fragment_2021"
+                           >Schädler-Saub 2021</ref>, S. 35–36). </note>
+                  </p>
+                  <p>Im Zuge des Essays <bibl>
+                        <title type="desc">Was warum bleibt</title>
+                     </bibl> hat sich Klaus Brinkbäumer damit auseinandergesetzt, warum gewisse
+                     Künstler*innen und Werke überdauern und andere nicht und was Voraussetzungen
+                     für Nachruhm sind. Er kommt schließlich zur Schlussfolgerung, dass die im
+                     Artikel aufgestellten Ruhmtheorien (Gefühl / Fantasie / Neugierde, Genialität /
+                     Originalität, Mythos, Vergessen werden und anschließendes Wiederentdecken)
+                     heute möglicherweise nicht mehr zutreffen.<note type="footnote">Vgl. <ref
+                           type="bibliography" target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer
+                           2013</ref>, S. 122–123.</note> Ein Hauptgrund dafür sei, dass <quote>[…]
+                        zu viel passiert, […] das Tempo unseres Lebens zu hoch für kollektive
+                        Erinnerung ist, weil zwar alles archiviert und nichts mehr gelöscht wird,
+                        aber trotzdem nichts bleibt.</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer 2013</ref>, S.
+                        123.</note> Damit beschreibt Brinkbäumer eine Eigenschaft, die sich auch im
+                     Digitalen manifestiert: die Flüchtigkeit. Sie wird zusätzlich durch das <term
+                        type="dh">Semantic Web</term>, die damit verbundene Verknüpfung der Inhalte
+                     und eine dadurch mögliche schnelle Navigation durchs Netz verstärkt. Die
+                     Flüchtigkeit trägt dazu bei – so das Argument – dass Lücken erst gar nicht in
+                     Erscheinung treten und wahrgenommen werden können. Brinkbäumer attestiert
+                     schließlich auch die Gefahr des Neuen; er tut dies im Kontext der Feststellung,
+                     dass es zukünftig noch schwieriger oder unmöglich sein wird, Ruhm zu erreichen:
+                        <quote>Wenn alles so schnell durch Neues ersetzt wird, wie es derzeit
+                        geschieht […], dann fehlt dem Publikum die Muße, Dinge wirken zu lassen,
+                        brennt sich nichts mehr ein, tauchen Kunstwerke auf, ab, und das nächste ist
+                        da.</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer 2013</ref>, S.
+                        123.</note>
+                  </p>
+                  <p>Neben der angesprochenen Flüchtigkeit besitzt das Netz weitere Eigenschaften,
+                     die eine Auseinandersetzung mit Lücken notwendig machen. So ist das Internet
+                     erst einmal endlos erweiterbar und zumindest in der Theorie von jedem oder
+                     jeder nutzbar. Dies führt unweigerlich zu einem Kontrollverlust, der es
+                     unmöglich macht zu überblicken, was mit der Lücke passiert und in welche neuen
+                     Kontexte sie eingebettet wird. Schließlich ist eine Beschäftigung mit der Lücke
+                     im digitalen Raum auch deshalb notwendig, weil sie durch digitale Verfahren
+                     reproduziert und vervielfältigt werden kann und sich dadurch der Empfänger- und
+                     damit verbunden der Wirkungskreis der Lücke erheblich vergrößert. </p>
+               </div>
+               <div type="subchapter">
+                  <head>6.2. Die Lücke als positives Phänomen?!</head>
+                  <p>Die abschließenden Gedanken zur Lücke als positives Phänomen müssen an dieser
+                     Stelle aus Platzgründen leider unvollständig bleiben. Sie sollen allerdings
+                     Denkanstöße geben und in zukünftigen Forschungsarbeiten aufgegriffen werden. In
+                     der 2021 erschienenen Publikation <bibl>
+                        <title type="desc">Literaturwissenschaft: Einführung in ein
+                           Sprachspiel</title>
+                     </bibl> schreibt Bernhard Dotzler über Leerstellen im Kontext von Goethes
+                     Briefroman <bibl>
+                        <title type="desc">Die Leiden des jungen Werthers</title>
+                     </bibl>.<note type="footnote">Vgl. <ref type="bibliography"
+                           target="#dotzler_leerstellen_2021">Dotzler 2021</ref>. </note>
+                     <quote>Eine Leerstelle lässt sich grob definieren als eine versteckt oder offen
+                        markierte Abwesenheit. Ein ›Zwischenraum‹, der ›ausgefüllt‹ werden kann oder
+                        muss. Eine Lücke, wo es gilt, ›einem Text das zu entnehmen, was dieser nicht
+                        sagt (aber voraussetzt, anspricht, beinhaltet und miteinbezieht)‹.</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 154.</note> Die
+                     Leerstelle in der Literatur fordert den Leser / die Leserin zur aktiven
+                     Mitarbeit auf, denn nur so kann das Geschriebene Sinn ergeben.<note
+                        type="footnote">Vgl. <ref type="bibliography"
+                           target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 154.</note> Die
+                     Lücke hat also das Potenzial, die Fantasie des*der Betrachtenden anzuregen und
+                     eine Interaktion anzustoßen, die den*die passive*n Betrachtenden zu einem /
+                     einer aktiven macht. Auch Lücken in digitalen Datenbanken können diese positive
+                     Qualität haben und Fragen wie, ›Welche Sache fehlt überhaupt?‹ und ›Was sagt
+                     uns die Lücke über bestehende gesellschaftliche Wert- oder Machtverhältnisse?‹
+                     aufwerfen. Auch die digitale Lücke hat somit das Potenzial, mit den
+                     Betrachtenden in den Dialog zu treten. </p>
+                  <p>Dotzler definiert auch die Vorgeschichte, die im Roman nicht ausgeführt wird,
+                     als mögliche Leerstelle. Die Unbestimmtheit des Anfangs (Vorgeschichte und
+                     ungeklärte Sprechsituation) weckt das Interesse des / der Lesenden und führt
+                     dazu, dass dieser / diese weiterlesen will.<note type="footnote">Vgl. <ref
+                           type="bibliography" target="#dotzler_leerstellen_2021">Dotzler
+                        2021</ref>, S. 153–154.</note> Damit hat die Leerstelle eine wichtige
+                     Funktion für den Roman. Indem auch die digitale Lücke eine gewisse
+                     Rätselhaftigkeit aufwirft, kann auch sie dazu beitragen, das Interesse des /
+                     der Schauenden zu gewinnen und eine Beschäftigung mit den Inhalten einer
+                     Datenbank anzustoßen. Dieses Potenzial meinen möglicherweise auch die SKD, wenn
+                     sie im Kontext der Veränderung einiger Werktitel oder Ausblendung
+                     diskriminierender Begriffe von einem <quote>[…] didaktischen Ansatz, der die
+                        Historie des Begriffs nicht ausblendet, sondern sie im Gegenteil sichtbar
+                        macht; da wird Bewusstsein geschaffen […</quote>]<note type="footnote"><ref
+                           type="bibliography" target="#soltau_debatte_2021">Soltau
+                        2021</ref>.</note> sprechen. Damit kann die Lücke nicht nur Dinge
+                     verschweigen, sondern, im Gegenteil, auf das Nichtexistierende aufmerksam
+                     machen. Im Falle der SKD könnte eine Ausblendung der Begriffe den / die
+                     Betrachtenden also erst auf deren Problematik hinweisen und eine Beschäftigung
+                     mit der Thematik fördern. Denn: <quote>Often, with loss comes a recognition of
+                        the significance and value of that which is absent or missing.</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#castriota_fragment_2021">Castriota / Marçal 2021</ref>, S. 74.
+                     </note>
+                  </p>
+                  <p>Während der Recherche sind weitere mögliche Anknüpfungspunkte sichtbar
+                     geworden, die in der poststrukturalistischen Sprachtheorie verankert sind. Im
+                     Rahmen dieses Beitrags können sie nur genannt werden, eine tiefergehende
+                     Auseinandersetzung muss Folgeforschung bleiben. Ein erster Anknüpfungspunkt
+                     besteht in Jacques Derridas (1930–2004) Konzept der <term type="dh"
+                        >différance</term>, das sich durch die Eigenschaft auszeichnet, <quote>[…]
+                        den Sinn immer aufzuschieben und seine Präsenz unmöglich zu machen […]. Da
+                        der Sinn niemals vollständig festgehalten werden kann, versucht das
+                        logozentrische Denken, den Aufschub dadurch ungeschehen zu machen, dass es
+                        die fehlende Präsenz ergänzt, in der Hoffnung, die Lücke, die der Aufschub
+                        hinterlassen hat, vollständig zu besetzen.</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#muenkner_poststrukturalismus_2012">Münker / Roesler 2012</ref>,
+                        S. 47. </note> Gilles Deleuze (1925–1995) thematisiert in seiner
+                     Sprachphilosophie das Verhältnis von Sinn und Unsinn, wobei er letzteres als
+                     ein ›leeres Feld‹ bezeichnet;<note type="footnote"> Vgl. <ref
+                           type="bibliography" target="#muenkner_poststrukturalismus_2012">Münker /
+                           Roesler 2012</ref>, S. 58.</note> auch dieses Verständnis könnte für eine
+                     Lücken-Debatte interessant sein. Schließlich findet sich auch in den Schriften
+                     von Jean-François Lyotard (1924–1998) ein möglicher Anknüpfungspunkt, nämlich
+                     wenn er sich mit dem Schweigen auseinandersetzt, das er als <quote>Substitut
+                        eines Satzes sieht[.]</quote>
+                     <note type="footnote"><ref type="bibliography"
+                           target="#muenkner_poststrukturalismus_2012">Münker / Roesler 2012</ref>,
+                        S. 61.</note>
+                  </p>
+               </div>
+            </div>
+            <div type="chapter">
+               <head>7. Schluss</head>
+               <p>Was ist die digitale Lücke? Und welche Arten gibt es im Kontext der
+                  Kunstgeschichte und Provenienzforschung? Basierend auf einer Studie verschiedener
+                  Datenbanken und mithilfe der Datenmodellierung wurden
+                  mögliche digitale Lücken identifiziert und auf Grundlage dieser eine Typologie
+                  erstellt. Zu den möglichen Arten gehören digitale Abbildungs-, Informations-, oder
+                  Bestandslücken. Dabei wurde bereits zu Beginn betont, dass ein vollständiger
+                  Lücken-Katalog nicht zu leisten ist, denn <quote>[… je genauer man hinsieht, umso
+                     deutlicher wird, dass Leerstellen nicht die Ausnahme, sondern der Normalfall
+                     sind.</quote>
+                  <note type="footnote"><ref type="bibliography" target="#dotzler_leerstellen_2021"
+                        >Dotzler 2021</ref>, S. 162. Dotzler schreibt dies im Kontext einer
+                     Untersuchung der Leerstelle in den Literaturwissenschaften, im Speziellen in
+                     Bezug auf Goethes Briefroman Die Leiden des jungen Werther (vgl. <ref
+                        type="bibliography" target="#dotzler_leerstellen_2021">Dotzler
+                     2021</ref>).</note> Eine Beschäftigung mit den Ursachen zeigte, dass neben
+                  lückenhaften analogen Beständen auch andere Gründe zu Lücken im Digitalen führen:
+                  dazu gehören u. a. rechtliche Restriktionen, ethische Bedenken oder fehlende
+                  finanzielle und personelle Ressourcen. Die enorme Bedeutung fehlender Ressourcen
+                  für die Entstehung von digitalen Lücken wurde im Vorfeld nicht vermutet und ist
+                  eine wichtige Erkenntnis des Beitrags. Indem mehr Ressourcen für die
+                  Digitalisierung, Aufbereitung der Daten, aber vor allem für die Pflege der
+                  Datenbanken zur Verfügung gestellt werden – und das nicht nur in Form von
+                  Drittmittelprojekten –, könnte die Anzahl der digitalen Lücken erheblich
+                  verringert werden. </p>
+               <p>Die Motivation, einen Beitrag über die Lücke im Digitalen zu verfassen, basiert
+                  auf einer Auseinandersetzung der Autorin mit der Abbildung von Provenienzangaben
+                  und darin enthaltenen Lücken in online Sammlungen deutscher Museen. Diese zeigte,
+                  dass Lücken nicht ausreichend markiert werden und keinem Standard folgen. Sodann
+                  kam die Frage auf, warum eine Auseinandersetzung mit Lücken und deren Sichtbarkeit
+                  besonders wichtig im Digitalen ist. Der Beitrag führt dafür mehrere Gründe an:
+                  Viele digitale Lücken sind unsichtbar; die Informationsfülle und die dadurch
+                  suggerierte ›verführerische Vollständigkeit‹ oder die Flüchtigkeit im Netz. Die
+                  Lücke ist zumeist negativ konnotiert. Auf Grundlage dessen wurde im letzten
+                  Abschnitt die daran anschließende Frage gestellt, ob die Lücke auch eine positive
+                  Qualität hat. Dabei wurde vor allem Bezug auf die Literaturwissenschaften
+                  genommen, wo die Lücke in Texten dazu dient, den Lesenden zur Mitarbeit
+                  aufzufordern und gleichzeitig dessen Interesse zu wecken. </p>
+               <p>Als Nutzende von Datenbanken sind wir aufgefordert, auch auf das Fehlende zu
+                  schauen und uns zu fragen, was fehlt und warum. Wer entscheidet, was zur digitalen
+                  Lücke wird und welche Absichten verbergen sich dahinter? Es ist utopisch
+                  anzunehmen, dass das Digitale in naher Zukunft lückenlos sein wird – und dieser
+                  Zustand ist vielleicht auch gar nicht erstrebenswert. Damit wir uns aber der
+                  digitalen Lücken bewusst werden und sie entsprechend bewerten können, müssen
+                  Lücken explizit markiert und im Idealfall sogar erklärt und bewertet werden. Indem
+                  der Beitrag Arten digitaler Lücken in der Kunstgeschichte und Provenienzforschung
+                  und deren Ursachen benennt, will er für die Präsenz von Lücken im Netz
+                  sensibilisieren und daran anschließend eine weitere disziplinübergreifende
+                  Bearbeitung des Themas anstoßen. Auf Grundlage des Beitrags ist folgende
+                  Folgeforschung denkbar: die Betrachtung weiterer Datenbanken außerhalb der
+                  Kunstgeschichte und Provenienzforschung, auch außerhalb Deutschlands und damit
+                  verbunden die Erweiterung der Typologie; eine Beschäftigung mit den Begriffen
+                  Unsicherheit und Unschärfe; eine eingehende Auseinandersetzung mit positiven
+                  Qualitäten der Lücke und den genannten möglichen Anknüpfungspunkten innerhalb der
+                  poststrukturalistischen Sprachtheorie; und schließlich die Modellierung der Lücke
+                  in der Informatik. </p>
+            </div>
+            <div type="bibliography">
+               <head>Bibliografische Angaben</head>
+               <listBibl>
+
+                  <bibl xml:id="andraschke_hg_objekte_2020">Objekte im Netz. Wissenschaftliche
+                     Sammlungen im digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner.
+                     Bielefeld 2020. (= Digitale Gesellschaft, 33). PDF. [<ref
+                        target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf"
+                        >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl>
+                  <bibl xml:id="andraschke_objekte_2020">Udo Andraschke / Sarah Wagner: Objekte im Netz. In: Objekte im Netz. Wissenschaftliche
+                     Sammlungen im digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner.
+                     Bielefeld 2020, S. 9–12. (= Digitale Gesellschaft, 33). PDF. [<ref
+                        target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf"
+                        >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl>
+                  <bibl xml:id="bacon_vagueness_2018">Andrew Bacon: Vagueness and Thought. Oxford
+                     2018. <ptr type="gbv" cRef="1012187241"/></bibl>
+                  <bibl xml:id="brinkbaeumer_kunstwerk_2013">Klaus Brinkbäumer: Was warum bleibt.
+                     Welches Kunstwerk, welche Leistung von heute wird in 100 Jahren noch
+                     unvergessen sein? In: Der Spiegel (2013), H. 1, S. 122–123. <ptr type="gbv"
+                        cRef="320524949"/></bibl>
+                  <bibl xml:id="castriota_fragment_2021">Brian Castriota / Hélia Marçal: Always
+                     Already Fragment: Integrity, Deferral, and Possibility in the Conservation of
+                     Cultural Heritage. In: Das Fragment im digitalen Zeitalter. Möglichkeiten und
+                     Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula Schädler-Saub /
+                     Angela Weyer. (Internationale Fachtagung ›Das Fragment im digitalen Zeitalter -
+                     Möglichkeiten und Grenzen neuer Techniken in der Restaurierung‹, Hildesheim,
+                     07.08.–08.08.2021) Berlin 2021, S. 63–79. <ptr type="gbv" cRef="1748027042"
+                     /></bibl>
+                  <bibl xml:id="cidoc_definition_2021">Definition of the CIDOC Conceptual Reference
+                     Model. Hg. von CIDOC CRM Special Interest Group. Version 7.1.1. Bd. 1. April
+                     2021. PDF. DOI: <ref target="https://doi.org/10.26225/FDZH-X261"
+                        >10.26225/FDZH-X261</ref>
+                  </bibl>
+                  <bibl xml:id="criado_frauen_2020">Caroline Criado-Perez / Stephanie Singh:
+                     Unsichtbare Frauen. Wie eine von Daten beherrschte Welt die Hälfte der
+                     Bevölkerung ignoriert. München 2020. (= btb, 71887). <ptr type="gbv"
+                        cRef="1665235292"/></bibl>
+                  <bibl xml:id="daraban_figuren_2017">Adria Daraban: Figuren des Fragmentarischen.
+                     Fragmentierung als ästhetisches Prinzip in der Architekturproduktion des 20.
+                     Jahrhunderts. In: Mimetische Praktiken in der neueren Architektur. Prozesse und
+                     Formen der Ähnlichkeitserzeugung. Hg. von Eva von Engelberg-Dočkal / Markus
+                     Krajewski / Frederike Lausch. Heidelberg 2017, S. 168–183. PDF. DOI: <ref
+                        target="https://doi.org/10.11588/arthistoricum.221.291"
+                        >10.11588/arthistoricum.221.291</ref>
+                  </bibl>
+                  <bibl xml:id="deinert_enteignet_2022">Enteignet, entzogen, verkauft. Zur
+                     Aufarbeitung der Kulturgutverluste in SBZ und DDR. Hg. von Mathias Deinert /
+                     Uwe Hartmann / Gilbert Lupfer. Berlin u. a. 2022. (= Provenire, 3) <ptr
+                        type="gbv" cRef="1784949450"/></bibl>
+                  <bibl xml:id="dmb_leitfaden_2011">Leitfaden für die Dokumentation von
+                     Museumsobjekten. Hg. vom Deutschen Museumsbund e. V. Berlin 2011. PDF. [<ref
+                        target="https://www.museumsbund.de/wp-content/uploads/2017/03/dmb-dokumentation.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="dzk_leitfaden_2019">Leitfaden Provenienzforschung. Zur
+                     Identifizierung von Kutlurgut, das während der nationalsozialistischen
+                     Herrschaft verfolgungsbedingt entzogen wurde. Hg. vom Deutschen Zentrum
+                     Kulturgutverluste / Arbeitskreis Provenienzforschung e.  V. / Arbeitskreis
+                     Provenienzforschung und Restitution – Bibliotheken Deutscher Bibliotheksverband
+                     e.  V. / Deutscher Museumsbund e.  V. / ICOM Deutschland e.  V. Berlin 2019.
+                     PDF. [<ref
+                        target="https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Download.pdf;jsessionid=AD3D42876F17B4B5C060A8A741861F66.m0?__blob=publicationFile&amp;v=3https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Download.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="dotzler_leerstellen_2021">Bernhard Dotzler: Leerstellen. In:
+                     Literaturwissenschaft. Einführung in ein Sprachspiel. Hg. von Heinrich Bosse /
+                     Ursula Renner. 3., aktualisierte Auflage. Baden-Baden 2021, S. 153–169. (=
+                     intro: Literaturwissenschaft) <ptr type="gbv" cRef="1765493773"/></bibl>
+                  <bibl xml:id="edenheiser_missing_2021">What’s Missing? Collecting and Exhibiting
+                     Europe. Hg. von Iris Edenheiser / Elisabeth Tietmeyer / Susanne Boersma. Berlin
+                     2021. (= Schriftenreihe / Museum Europäischer Kulturen, 24) <ptr type="gbv"
+                        cRef="1737792435"/></bibl>
+                  <bibl xml:id="farrenkopf_logik_2021">Logik und Lücke: die Konstruktion des
+                     Authentischen in Archiven und Sammlungen. Hg. von Michael Farrenkopf / Andreas
+                     Ludwig / Achim Saupe / Jürgen Bacia. (Logik und Lücke. Zur Konstruktion des
+                     Authentischen in Archiven und Sammlungen, München, 04.04.–05.04.2019).
+                     Göttingen 2021. (= Wert der Vergangenheit, 2) <ptr type="gbv" cRef="1698174861"
+                     /></bibl>
+                  <bibl xml:id="freitag_unschaerfe_2018">Unschärfe: der Umgang mit fehlender
+                     Eindeutigkeit. Hg. von Steffen Freitag / Michaela Geierhos / Rozbeh Asmani /
+                     Judit I. Haug. Paderborn 2018. (= Nordrhein-Westfälische Akademie der
+                     Wissenschaften und der Künste – Junges Kolleg) <ptr type="gbv"
+                        cRef="1010711717"/></bibl>
+                  <bibl xml:id="fricke_destroyed_2022">Destroyed – Disappeared – Lost – Never Were.
+                     Hg. von Beate Fricke / Aden Kumler. University Park, PA 2022. (= ICMA books –
+                     viewpoints) <ptr type="gbv" cRef="1789752264"/></bibl>
+                  <bibl xml:id="geldmacher_luecken_2022">Elisabeth Geldmacher / Nadine Kulbe:
+                     Unvermeidbar! Über Lücken in der NS-Raubgut-Forschung und Möglichkeiten, mit
+                     ihnen umzugehen. In: Archivar 75 (2022), H. 1, S. 31–34. PDF. [<ref
+                        target="https://www.archive.nrw.de/sites/default/files/media/files/Archivar_2022-1_Internet-NEU-28032022_Mod.pdf"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="goetz_luecke_2019">›Lücke‹. In: Langenscheidt Großwörterbuch:
+                     Deutsch als Fremdsprache. Das einsprachige Wörterbuch für alle, die Deutsch
+                     lernen. Hg. von Dieter Götz in Zusammenarbeit mit der Langenscheidt-Redaktion.
+                     München u. a. 2019, S. 721. <ptr type="gbv" cRef="1666222399"/></bibl>
+                  <bibl xml:id="grossmann_challenge_2012">The Challenge of the Object. Die
+                     Herausforderung des Objekts. Hg. von Georg Ulrich Großmann / Petra Krutisch.
+                     (33. Internationaler Kunsthistoriker-Kongress, Nürnberg, 15.07.–20.07.2012). 4
+                     Bde. Nürnberg 2012 / 2013. <ptr type="gbv" cRef="721978991"/></bibl>
+                  <bibl xml:id="haase_einfuehrung_2022">Sven Haase / Maike Hopp: Einführung in den
+                     Themenschwerpunkt. In: Archivar 75 (2022), H.1, S. 6–10. PDF. [<ref
+                        target="https://www.archive.nrw.de/sites/default/files/media/files/Archivar_2022-1_Internet-NEU-28032022_Mod.pdf"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="haffner_provenienzforschung_2019">Dorothee Haffner:
+                     Provenienzforschung digital vernetzt. Ergebnisse sichtbar machen. In:
+                     Museumskunde 84 (2019), S. 90–97. PDF. [<ref
+                        target="https://www.museumsbund.de/wp-content/uploads/2022/07/museumskunde-2019-1-online.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="haffner_provenienzen_2020">Dorothee Haffner: Provenienzen in
+                     Sammlungsdatenbanken. Digitale und virtuelle Chancen für die Vermittlung. In:
+                     Provenienz &amp; Forschung. Digitale Provenienzforschung. Hg. vom Deutschen
+                     Zentrum Kulturgutverluste. Magdeburg 2020, S. 36–41. (= Provenienz &amp;
+                     Forschung, 2020.1) <ptr type="gbv" cRef="1699332177"/></bibl>
+                  <bibl xml:id="hannemann_beruecksichtigung_2010">Jens Hannemann: Die
+                     Berücksichtigung inhaltlicher und räumlicher Unschärfe bei der GIS-gestützten
+                     Erstellung von Bodenkarten. Aachen 2010. <ptr type="gbv" cRef="1604658843"
+                     /></bibl>
+                  <bibl xml:id="jannidis_humanities_2017">Digital Humanities. Eine Einführung. Hg.
+                     von Fotis Jannidis / Hubertus Kohle / Malte Rehbein. Stuttgart 2017. DOI:
+                     10.1007/978-3-476-05446-3 </bibl>
+                  <bibl xml:id="kaiser_gedaechtnis_2021">Kulturelles Gedächtnis. Kriegsverluste
+                     deutscher Museen. Wege und Biografien. Hg. von Britta Kaiser-Schuster. Wien u.
+                     a. 2021. (= Studien zu kriegsbedingt verlagerten Kulturgütern, 3) <ptr
+                        type="gbv" cRef="175730102X"/></bibl>
+                  <bibl xml:id="kastens_modellierung_2018">Uwe Kastens / Hans Kleine Büning:
+                     Modellierung: Grundlagen und formale Methoden. 4., erweiterte Auflage. München
+                     2018. DOI: 10.3139/9783446455399</bibl>
+                  <bibl xml:id="kempcke_luecke_2000">›Lücke‹. In: Wörterbuch Deutsch als
+                     Fremdsprache. Hg. von Günter Kempcke. Berlin u. a. 2000, S. 639. (=
+                     De-Gruyter-Wörterbuch) <ptr type="gbv" cRef="306466562"/></bibl>
+                  <bibl xml:id="knaus_lido_2019">Gudrun Knaus / Angela Kailus / Regine Stein:
+                     LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen
+                     Objekten. Hg. vom Deutschen Dokumentationszentrum für Kunstgeschichte –
+                     Bildarchiv Foto Marburg / Christian Bracht. 2 Bde. Bd. 1: Graphik. Heidelberg
+                     2019. DOI: <ref target="https://doi.org/10.11588/arthistoricum.382.544"
+                        >10.11588/arthistoricum.382.544</ref>
+                  </bibl>
+                  <bibl xml:id="knaus_lido_2022">Gudrun Knaus / Angela Kailus / Regine Stein:
+                     LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen
+                     Objekten. Hg. vom Deutschen Dokumentationszentrum für Kunstgeschichte –
+                     Bildarchiv Foto Marburg / Christian Bracht. 2 Bde. Bd. 2: Malerei und Skulptur.
+                     Heidelberg 2022. PDF. DOI: <ref
+                        target="https://doi.org/10.11588/arthistoricum.1026"
+                        >10.11588/arthistoricum.1026</ref>
+                  </bibl>
+                  <bibl xml:id="kohle_museen_2018">Hubertus Kohle: Museen digital. Eine
+                     Gedächtnisinstitution sucht den Anschluss an die Zukunft. Heidelberg 2018. DOI:
+                        <ref target="https://doi.org/10.17885/heiup.365.515"
+                        >10.17885/heiup.365.515</ref>
+                     <ptr type="gbv" cRef="1030477159"/></bibl>
+                  <bibl xml:id="kocourek_leitfaden_2019">Jana Kocourek / Katja Lindenau / Ilse von
+                     zur Mühlen / Johanna Poltermann: Leitfaden Provenienzforschung. Anhang. Berlin
+                     2019. [<ref
+                        target="https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Anlage-Download.pdf?__blob=publicationFile&amp;v=3"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="little_analysis_2019">Roderick J. A. Little / Donald B. Rubin:
+                     Statistical Analysis with Missing Data. 3. Auflage. Hoboken, NJ 2019. DOI:
+                     10.1002/9781119482260</bibl>
+                  <bibl xml:id="muenkner_poststrukturalismus_2012">Stefan Münker / Alexander
+                     Roesler: Poststrukturalismus. 2., aktualisierte und erweiterte Auflage.
+                     Stuttgart u.a. 2012. (= Sammlung Metzler, 322) <ptr type="gbv" cRef="716804581"
+                     /></bibl>
+                  <bibl xml:id="muennich_quellenverluste_2019">Stefan Münnich: Quellenverluste
+                     (Deperdita) als methodologischer Unsicherheitsbereich für Editorik und
+                     Datenmodellierung am Beispiel von Anton Weberns George-Lied op. 4 Nr. 5. In:
+                     Die Modellierung des Zweifels – Schlüsselideen und -konzepte zur graphbasierten
+                     Modellierung von Unsicherheiten. Hg. von Andreas Kuczera / Thorsten Wübbena /
+                     Thomas Kollatz. Wolfenbüttel 2019. (= Zeitschrift für digitale
+                     Geisteswissenschaften / Sonderbände, 4) HTML. DOI: <ref
+                        target="https://doi.org/10.17175/sb004_005">10.17175/sb004_005</ref>
+                  </bibl>
+                  <bibl xml:id="nasarek_forschungsumgebung_2020">Robert Nasarek: Virtuelle
+                     Forschungsumgebungen und Sammlungsräume. Objekte digital modellieren und
+                     miteinander vernetzen. In: Objekte im Netz. Wissenschaftliche Sammlungen im
+                     digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner. Bielefeld 2020, S.
+                     131–147. (= Digitale Gesellschaft, 33) PDF. [<ref
+                        target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf"
+                        >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl>
+                  <bibl xml:id="ntoutsi_bias_2020">Eirini Ntoutsi / Pavlos Fafalios / Ujwal Gadiraju
+                     / Vasileios Iosifidis / Wolfgang Nejdl / Maria-Esther Vidal / Salvatore
+                     Ruggieri / Franco Turini / Symeon Papadopoulos / Emmanouil Krasanakis / Ioannis
+                     Kompatsiaris / Katharina Kinder-Kurlanda / Claudia Wagner / Fariba Karimi /
+                     Miriam Fernandez / Harith Alani / Bettina Berendt / Tina Kruegel / Christian
+                     Heinze / Klaus Broelemann / Gjergji Kasneci / Thanassis Tiropanis / Steffen
+                     Staab: Bias in Data-Driven Artificial Intelligence Systems. An Introductory
+                     Survey. In: WIREs. Data mining and knowledge discovery 10 (2020), H. 3.
+                     03.02.2020. HTML. DOI: <ref target="https://doi.org/10.1002/widm.1356"
+                        >10.1002/widm.1356</ref>
+                  </bibl>
+                  <bibl xml:id="fragment_zeitalter_2021">Das Fragment im digitalen Zeitalter.
+                     Möglichkeiten und Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula
+                     Schädler-Saub / Angela Weyer. (Internationale Fachtagung ›Das Fragment im
+                     digitalen Zeitalter - Möglichkeiten und Grenzen neuer Techniken in der
+                     Restaurierung‹, Hildesheim, 07.08.–08.08.2021) Berlin 2021. <ptr type="gbv"
+                        cRef="1748027042"/></bibl>
+                  <bibl xml:id="schaedler_fragment_2021">Ursula Schädler-Saub: Das Fragment zwischen
+                     realer und virtueller Ergänzung. In: Das Fragment im digitalen Zeitalter.
+                     Möglichkeiten und Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula
+                     Schädler-Saub / Angela Weyer. (Internationale Fachtagung ›Das Fragment im
+                     digitalen Zeitalter - Möglichkeiten und Grenzen neuer Techniken in der
+                     Restaurierung‹, Hildesheim, 07.08.–08.08.2021) Berlin 2021, S. 17–44. <ptr
+                        type="gbv" cRef="1748027042"/></bibl>
+                  <bibl xml:id="schaeffler_networks_2022">Networks of Care. Politiken des
+                     (Er)haltens und (Ent)sorgens. Hg. von Anna Schäffler / Friederike Schäfer /
+                     Nanne Buurman. Berlin 2022. <ptr type="gbv" cRef="1802544259"/></bibl>
+                  <bibl xml:id="schawe_verluste_2019">Martin Schawe: Die Verluste der Bayerischen
+                     Staatsgemäldesammlungen im Zweiten Weltkrieg. Wien u. a. 2019. (= Schriften der
+                     Bayerischen Staatsgemäldesammlungen, 3) <ptr type="gbv" cRef="1040598935"
+                     /></bibl>
+                  <bibl xml:id="schenk_aufheben_2013">Dietmar Schenk: ›Aufheben, was nicht vergessen
+                     werden darf‹. Archive vom alten Europa bis zur digitalen Welt. Stuttgart 2013.
+                     (= Wissenschaftsgeschichte) <ptr type="gbv" cRef="740804855"/></bibl>
+                  <bibl xml:id="schneider_kriegsverluste_2013">Nicole Schneider: Die Kriegsverluste
+                     der Musiksammlungen deutscher Bibliotheken 1942–1945. Dissertation, Universität
+                     Zürich. 2013. PDF. [<ref
+                        target="https://www.blb-karlsruhe.de/files/user_upload/PDF/7_Textarchiv/2013_Schneider_Kriegsverluste.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="soltau_debatte_2021">Hannes Soltau: Debatte um Umbenennung von
+                     Kunstwerken. In Dresdner Museen findet weder ein ›Bildersturm‹ noch ›Zensur‹
+                     statt. In: Tagesspiegel. Beitrag vom 15.09.2021. [<ref
+                        target="https://www.tagesspiegel.de/kultur/in-dresdner-museen-findet-weder-ein-bildersturm-noch-zensur-statt-4276738.html"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="staud_datenmodellierung_2005">Josef L. Staud: Datenmodellierung und
+                     Datenbankentwurf. Ein Vergleich aktueller Methoden. Berlin u.a. 2005. DOI:
+                     10.1007/b137949 <ptr type="gbv" cRef="524939284"/></bibl>
+                  <bibl xml:id="steinaecker_ende_2021">Thomas von Steinaecker: Ende offen. Das Buch
+                     der gescheiterten Kunstwerke. Frankfurt / Main 2021. <ptr type="gbv"
+                        cRef="1756520453"/></bibl>
+                  <bibl xml:id="syropoulos_vagueness_2021">Vagueness in the Exact Sciences. Impacts
+                     in Mathematics, Physics, Chemistry, Biology, Medicine, Engineering and
+                     Computing. Hg. von Apostolos Syropoulos / Basil K. Papadopoulos. Berlin 2021.
+                        <ptr type="gbv" cRef="1756534578"/></bibl>
+                  <bibl xml:id="syropoulos_introduction_2020">Apostolos Syropoulos / Theophanes
+                     Grammenos: A Modern Introduction to Fuzzy Mathematics. Hoboken, New Jersey
+                     2020. (= STEM) <ptr type="gbv" cRef="1690994339"/></bibl>
+                  <bibl xml:id="tuernich_provenienzforschung_2019">Ruth Türnich: Provenienzforschung
+                     weiterdenken. Vermittlung von Provenienzrecherchen und Forschungsergebnissen.
+                     In: rheinform. Information für die rheinischen Museen. Hg. vom LVR-Dezernat
+                     Kultur und Landschaftliche Kulturpflege, Landesschaftsverband Rheinland (2019),
+                     H. 2, S. 19–25. PDF. [<ref
+                        target="https://rheinform.lvr.de/media/medienrheinform/archiv/rheinform_2-2019.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="ullrich_geschichte_2009">Wolfgang Ullrich: Die Geschichte der
+                     Unschärfe. Veränderte und ergänzte Neuausgabe. Berlin 2009. (= Wagenbachs
+                     Taschenbuch, 626) <ptr type="gbv" cRef="602667321"/></bibl>
+                  <bibl xml:id="wintergruen_netzwerkanalysen_2019">Dirk Wintergrün: Netzwerkanalysen
+                     und semantische Datenmodellierung als heuristische Instrumente für die
+                     historische Forschung. Dissertation, Friedrich-Alexander-Universität
+                     Erlangen-Nürnberg. 2019. PDF. URN: <ref
+                        target="https://nbn-resolving.org/urn:nbn:de:bvb:29-opus4-111899"
+                        >urn:nbn:de:bvb:29-opus4-111899</ref>
+                  </bibl>
+               </listBibl>
+               <div type="subchapter">
+               <head>Internetquellen</head>
+            </div>
+               <div type="subchapter">
+               <head>Blogbeiträge</head>
+               <listBibl>
+                  <bibl xml:id="enderlein_datenbank_2023">Angelika Enderlein / Monika Flacke: Die
+                     Datenbank des ›Central Collecting Point München‹. Datenbank zum ›Central
+                     Collecting Point München‹, Deutsches Historisches Museum. Letzer Zugriff:
+                     13.01.2023. PDF. [<ref
+                        target="https://www.dhm.de/datenbank/ccp/prj_dhm_ccp/ccp_einleitung_de.pdf"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="luther_digitization_2022">Anne Luther: Digitization And Data
+                     Management in Museums. In: Anne Luther. Blogbeitrag vom 23.10.2022. [<ref
+                        target="http://anneluther.info/texts">online</ref>]</bibl>
+                  <bibl xml:id="schmeisser_beckmann_2021">Iris Schmeisser: Die Beckmann Sammlung im
+                     Städel. Eine wechselvolle Geschichte. In: Städelblog. Blogbeitrag vom
+                     05.02.2021. [<ref
+                        target="https://blog.staedelmuseum.de/max-beckmann-sammlung-im-staedel/"
+                        >online</ref>]</bibl>
+               </listBibl>
+            </div>
+               <div type="subchapter">
+               <head>Webseiten</head>
+               <listBibl>
+                  <bibl xml:id="bsgs_sammlung_2022">Sammlung. Hg. von den Bayerischen
+                     Staatsgemäldesammlungen. Letzter Zugriff: 02.11.2022. [<ref
+                        target="https://www.sammlung.pinakothek.de">online</ref>]</bibl>
+                  <bibl xml:id="bvbk_urheberrecht_2023">Urheberrecht. In: Bundesverband Bildender
+                     Künstlerinnen und Künstler. Hg. vom Bundesverband Bildender Künstlerinnen und
+                     Künstler. Letzter Zugriff: 10.02.2023. [<ref
+                        target="https://www.bbk-bundesverband.de/beruf-kunst/urheberrecht"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model. Letzter
+                     Zugriff: 10.11.2022. [<ref target="https://www.cidoc-crm.org">online</ref>] </bibl>
+                  <bibl xml:id="cc_sa_2023">Creative-Commons, Attribution-ShareAlike 4.0
+                     International (CC BY-SA 4.0). Letzter Zugriff: 13.01.2023. [<ref
+                        target="https://creativecommons.org/licenses/by-sa/4.0/"
+                     >online</ref>]</bibl>
+                  <bibl xml:id="dhm_datenbank_2009">Datenbank zum ›Central Collecting Point
+                     München‹. Hg. vom Deutschen Historischen Museum. Juni 2009. [<ref
+                        target="https://www.dhm.de/datenbank/ccp/">online</ref>] </bibl>
+                  <bibl xml:id="mpi_decay_2022">Decay, Loss, and Conservation in Art History. 2022.
+                     In: Bibliotheca Hertziana. Max-Planck-Institut für Kunstgeschichte. Letzter
+                     Zugriff: 11.11.2022. [<ref
+                        target="https://www.biblhertz.it/research-group-borgo">online</ref>] </bibl>
+                  <bibl xml:id="ddk_bildindex_2022">Bildindex der Kunst &amp; Architektur. Hg. vom
+                     Deutschen Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg,
+                     Philipps-Universität Marburg. Letzter Zugriff: 02.11.2022. [<ref
+                        target="https://www.bildindex.de">online</ref>]</bibl>
+                  <bibl xml:id="fek_datenbank_2010">Datenbank ›Entartete Kunst‹. Hg. von der
+                     Forschungsstelle ›Entartete Kunst‹. 2010. [<ref
+                        target="https://www.geschkult.fu-berlin.de/e/db_entart_kunst/datenbank"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="skd_leitlinien_2023">Ethische Leitlinien der Online Collection
+                     (Arbeitsprozess, diskriminierungsfreie Sprache, sensible Objekte). In:
+                     Staatliche Kunstsammlungen Dresden. Online Collection. Letzter Zugriff:
+                     13.01.2023. [<ref target="https://skd-online-collection.skd.museum"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="gnm_fragen_2023">Fragen und Antworten. In: Germanisches
+                     Nationalmuseum. Hg. vom Germanischen Nationalmuseum Nürnberg (2023b). Letzter
+                     Zugriff: 23.01.2023. [<ref
+                        target="https://www.gnm.de/services/haeufige-fragen/">online</ref>]</bibl>
+                  <bibl xml:id="gnm_objektkatalog_2023">Germanisches Nationalmuseum. Objektkatalog.
+                     Hg. vom Germanischen Nationalmuseum (2023a). Letzter Zugriff: 04.01.2023. [<ref
+                        target="https://objektkatalog.gnm.de">online</ref>]</bibl>
+                  <bibl xml:id="brd_gesetz_2023">Gesetz über Urheberrecht und verwandte Schutzrechte
+                     (Urheberrechtsgesetz). § 64 Allgemeines. Hg. von der Bundesrepublik
+                     Deutschland, vertreten durch den Bundesminister der Justiz. Letzter Zugriff:
+                     13.01.2023. [<ref target="https://www.gesetze-im-internet.de/urhg/__64.html"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="grundsaetze_2018">Grundsätze zur Eintragung und Löschung von
+                     Meldungen in die Lost Art-Datenbank. Stand Mai 2018. PDF. [<ref
+                        target="https://www.kulturgutverluste.de/Content/08_Downloads/DE/Grundsaetze-Eintragung-Loeschung-Lost-Art.pdf?__blob=publicationFile&amp;v=4"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="kulturgutverluste_2022">Kulturgutverluste / German Lost Art
+                     Foundation: Lost Art und Löschungen. Kolloquium Provenienzforschung. YouTube.
+                     04.07.2022. [<ref target="https://www.youtube.com/watch?v=GSNMdFhKvWc"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="kik_prometheus_2022">Prometheus. Das verteilte digitale Bildarchiv
+                     für Forschung &amp; Lehre. Hg. vom Kunsthistorischen Institut der Universität
+                     zu Köln. Letzter Zugriff: 02.11.2022. [<ref
+                        target="https://prometheus-bildarchiv.de">online</ref>] </bibl>
+                  <bibl xml:id="kik_laura_2022">Laura: Diskriminierende Begriffe im Bildarchiv. In:
+                     Prometheus. Das verteilte digitale Bildarchiv für Forschung &amp; Lehre. Hg.
+                     vom Kunsthistorischen Institut der Universität zu Köln. 23.09.2022. [<ref
+                        target="https://prometheus-bildarchiv.de/blog/diskriminierende-begriffe-im-bildarchiv"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="nfdi_2022">Nationale Forschungsdateninfrastruktur (NFDI). Letzter
+                     Zugriff: 27.10.2022. [<ref target="https://www.nfdi.de/">online</ref>]</bibl>
+                  <bibl xml:id="nfdifm_2022">NFDI for Memory (NFDI4Memory). 15.12.2022. [<ref
+                        target="https://4memory.de">online</ref>] </bibl>
+                  <bibl xml:id="skd_2023">Staatliche Kunstsammlungen Dresden. Letzter Zugriff:
+                     19.01.2023. [<ref target="https://www.skd.museum">online</ref>] </bibl>
+                  <bibl xml:id="skd_eng_2023">Staatliche Kunstsammlungen Dresden [englische
+                     Sprachversion]. Letzter Zugriff: 19.01.2023. [<ref
+                        target="https://www.skd.museum/en/">online</ref>]</bibl>
+                  <bibl xml:id="skd_collection_2023">Staatliche Kunstsammlungen Dresden. Online
+                     Collection. Letzter Zugriff: 04.01.2023. [<ref
+                        target="https://skd-online-collection.skd.museum">online</ref>]</bibl>
+                  <bibl xml:id="staedel_museum_2023">Das Städel Museum. In: Städel Museum Frankfurt.
+                     Hg. vom Städelschen Kunstinstitut (2023a). Letzter Zugriff: 23.01.2023. [<ref
+                        target="https://www.staedelmuseum.de/de/das-staedel-museum">online</ref>] </bibl>
+                  <bibl xml:id="staedel_digisammlung_2023">Digitale Sammlung. In: Städel Museum
+                     Frankfurt. Hg. vom Städelschen Kunstinstitut (2023b). Letzter Zugriff:
+                     23.01.2023. [<ref target="https://sammlung.staedelmuseum.de">online</ref>] </bibl>
+                  <bibl xml:id="sdzk_art_2000">Lost Art-Datenbank. Hg. von der Stiftung Deutsches
+                     Zentrum Kulturgutverluste (2000a). April 2000. [<ref
+                        target="https://www.lostart.de">online</ref>] </bibl>
+                  <bibl xml:id="sdzk_ueber_2000">Über die Lost Art-Datenbank. In: Lost
+                     Art-Datenbank. Hg. von der Stiftung Deutsches Zentrum Kulturgutverluste
+                     (2000b). April 2000. [<ref target="https://www.lostart.de">online</ref>] </bibl>
+                  <bibl xml:id="sdzk_art_2023">Lost Art-Datenbank. Anleitung für öffentliche
+                     Einrichtungen zur Publikation von Such- und Fundmeldungen in die Lost
+                     Art-Datenbank. Hg. von der Stiftung Zentrum Kulturgutverluste. Letzter Zugriff:
+                     19.01.2023. PDF. [<ref
+                        target="https://www.lostart.de/de/media/35058/download?attachment"
+                        >online</ref>]</bibl>
+                  <bibl xml:id="met_collection_2020">The Metropolitan Museum of Art Collection API.
+                     GitHub. Letzte Aktualisierung: 17.11.2020. [<ref
+                        target="https://metmuseum.github.io/#object">online</ref>] </bibl>
+                  <bibl xml:id="skd_werke_2023">Vermisste Werke. In: Staatliche Kunstsammlungen
+                     Dresden. Online Collection. Letzter Zugriff: 14.01.2023. [<ref
+                        target="https://skd-online-collection.skd.museum/Kollektion?id=965"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="mww_verschwinden_2022">›Verschwinden‹. Vom Umgang mit materialen
+                     &amp; medialen Verlusten in Archiv und Bibliothek. In: Forschungsverbund
+                     Marbach Weimar Wolfenbüttel. Letzter Zugriff: 14.11.2022. [<ref
+                        target="https://www.mww-forschung.de/midterm-tagung">online</ref>] </bibl>
+                  <bibl xml:id="skd_online_2023">Was ist die Online Collection? In: Staatliche
+                     Kunstsammlungen Dresden. Online Collection. Letzter Zugriff: 23.01.2023. [<ref
+                        target="https://skd-online-collection.skd.museum/Ueber">online</ref>]</bibl>
+                  <bibl xml:id="ul_kassation_2023">Was ist eigentlich ›Kassation‹? In:
+                     Universitätsarchiv Leipzig. Letzter Zugriff: 09.02.2023. [<ref
+                        target="https://service.archiv.uni-leipzig.de/was-ist-eigentlich-kassation/"
+                        >online</ref>] </bibl>
+               </listBibl>
+            </div>
+               <div type="subchapter">
+               <head>Datenbankobjekte</head>
+               <listBibl>
+                  <bibl xml:id="bsg_beckmann_2023">Max Beckmann, Bildnisstudie Martha Beckmann im
+                     Profil nach links, 1900. In: Sammlung. Hg. von den Bayerischen
+                     Staatsgemäldesammlungen. Sammlung Moderne Kunst in der Pinakothek der Moderne
+                     München. Inventarnummer: 16521. Letzter Zugriff: 13.01.2023. [<ref
+                        target="https://www.sammlung.pinakothek.de/de/artwork/ZMLJRNVLJv"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="art_beckmann_2011">Max Beckmann, Blumenstrauß in einer Vase. In:
+                     Lost Art-Datenbank. Hg. von der Stiftung Deutsches Zentrum Kulturgutverluste.
+                     Suchmeldung. Lost Art-ID: 437961. 28.06.2011. [<ref
+                        target="https://www.lostart.de/en/Verlust/437961">online</ref>] </bibl>
+                  <bibl xml:id="staedel_beckmann_2023">Max Beckmann, The Synagogue in Frankfurt am
+                     Main, 1919. In: Digitale Sammlung. Städel Museum Frankfurt. Hg. vom Städelschen
+                     Kunstinstitut. Inventarnummer: SG 1239. Letzter Zugriff: 17.01.2023. [<ref
+                        target="https://www.staedelmuseum.de/go/ds/sg1239">online</ref>] </bibl>
+                  <bibl xml:id="bsg_istvan_2023">István Béla Farkas, Max-Beckmann-Medaille, 1978.
+                     In: Sammlung. Hg. von den Bayerischen Staatsgemäldesammlungen. Inventarnummer:
+                     0. Letzter Zugriff: 13.01.2023. [<ref
+                        target="https://www.sammlung.pinakothek.de/de/artwork/7yxYrQ5LYm"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="art_kirchner_2007">Ernst Ludwig Kirchner, Umschlagzeichnung zu
+                     Boßharts ›Neben der Heerstraße‹. In: Lost Art-Datenbank. Hg. von der Stiftung
+                     Deutsches Zentrum Kulturgutverluste. Suchmeldung. Lost Art-ID: 397844. 2007.
+                        [<ref target="https://www.lostart.de/en/Verlust/397844">online</ref>] </bibl>
+                  <bibl xml:id="kik_kirchner_2023">Ernst Ludwig Kirchner, Cyclamen, 1918–1919. In:
+                     Prometheus. Das verteilte digitale Bildarchiv für Forschung &amp; Lehre. Hg.
+                     vom Kunsthistorischen Institut der Universität zu Köln. Letzter Zugriff:
+                     03.03.2023. [<ref target="https://prometheus-bildarchiv.de/de/">online</ref>] </bibl>
+                  <bibl xml:id="met_kirchner_2012">Ernst Ludwig Kirchner, Cyclamen, 1918–1919. In:
+                     The Met Collection. Modern and Contemporary Art. Zugangsnummer: 2018.212.
+                     Letzter Zugriff: 03.03.2023. [<ref
+                        target="https://www.metmuseum.org/art/collection/search/490131"
+                     >online</ref>] </bibl>
+                  <bibl xml:id="skd_studer_2023">Johann Gotthelf Studer (Münzmeister): Taler
+                     (Speciestaler, sogenannter ***kopftaler), 1828, Sachsen. In: Staatliche
+                     Kunstsammlungen Dresden. Online Collection. Inventarnummer: AGB12058. Letzter
+                     Zugriff: 24.02.2023. [<ref
+                        target="https://skd-online-collection.skd.museum/Details/Index/1466101"
+                        >online</ref>] </bibl>
+                  <bibl xml:id="staedel_vermeer_2023">Johannes Vermeer, Der Geograf, 1669. In:
+                     Digitale Sammlung. Städel Museum Frankfurt. Hg. vom Städelschen Kunstinstitut.
+                     Inventarnummer: 1149. Letzter Zugriff: 11.02.2023. [<ref
+                        target="https://www.staedelmuseum.de/go/ds/1149">online</ref>] </bibl>
+               </listBibl>
+            </div>
+               </div>
+            <div type="abbildungsnachweis">
+               <head>Abbildungsverzeichnis</head>
+               <desc type="graphic" xml:id="abb1"> Abbildungslücken in der Online-Sammlung der
+                  BStGS. Ausschnitt aus der Ergebnisliste für die Suche mit ›Max Beckmann‹. [Quelle:
+                     <ref type="bibliography" target="#bsgs_sammlung_2022">Bayerische
+                     Staatsgemäldesammlungen (Hg.) 2022</ref>]<ref type="graphic"
+                     target="#luecke_001"/></desc>
+               <desc type="graphic" xml:id="abb2">Abbildungslücken im Bildindex. Ausschnitt aus der
+                  Ergebnisliste für die werkbezogene Suche mit ›Max Beckmann‹. [Quelle: <ref
+                     type="bibliography" target="#ddk_bildindex_2022">Deutsches
+                     Dokumentationszentrum für Kunstgeschichte (Hg.) 2022</ref>]<ref type="graphic"
+                     target="#luecke_002"/></desc>
+               <desc type="graphic" xml:id="abb3">Anzeige des Disclaimers (nach Klick auf die
+                  Asterisken) auf einer Objektansicht innerhalb der Online Collection der SKD.
+                  [Quelle: Johann Gotthelf Studer (Münzmeister): Taler (Speciestaler, sogenannter
+                  ***kopftaler), 1828, <ref type="bibliography" target="#skd_collection_2023"
+                     >Staatliche Kunstsammlungen Dresden. Online Collection 2023</ref>]<ref
+                     type="graphic" target="#luecke_003"/></desc>
+               <desc type="graphic" xml:id="abb4">Tagesaktuelle Zahlenangaben zum Erfassungsstand
+                  auf der Startseite der Online Collection der SKD. Screenshot vom 23. Januar 2023.
+                  [Quelle: <ref type="bibliography" target="#skd_online_2023">Online Collection,
+                     Staatliche Kunstsammlungen Dresden</ref>]<ref type="graphic"
+                     target="#luecke_004"/></desc>
+               <desc type="graphic" xml:id="abb5">Die Abbildung zeigt beispielhaft die Kodierung für
+                  ›Johann Joachim Winkelmann sieht die Laokoon-Skulptur‹ mit CIDOC CRM. Zudem sind
+                  einige im Begriffssystem der Ontologie enthaltenen Klassen und Eigenschaften
+                  abgebildet. [Aus: <ref type="bibliography" target="#cidoc_definition_2021">CIDOC
+                     CRM Special Interest Group 2021</ref>, S. 36, fig. 2. CC BY 4.0]<ref
+                     type="graphic" target="#luecke_005"/></desc>
+               <desc type="graphic" xml:id="abb6">Eine Typologie der digitalen Lücke. Die
+                  Aufstellung listet die im Beitrag identifizierten Lücken, Ursachen und weitere
+                  Eigenschaften. [Sabine Lang Februar 2023]<ref type="graphic" target="#luecke_006"
+                  /></desc>
+
+            </div>
+         </div>
+      </body>
+   </text>
+</TEI>
diff --git a/2023_003_lang/luecke_2023_001.png b/2023_003_lang/luecke_2023_001.png
new file mode 100644
index 0000000000000000000000000000000000000000..8ce8929a5dbefa569eb961430aa8fa9d12c1b503
Binary files /dev/null and b/2023_003_lang/luecke_2023_001.png differ
diff --git a/2023_003_lang/luecke_2023_002.png b/2023_003_lang/luecke_2023_002.png
new file mode 100644
index 0000000000000000000000000000000000000000..c4ebb7373ff6e0fe0050ca66d23a70a1ab3f0750
Binary files /dev/null and b/2023_003_lang/luecke_2023_002.png differ
diff --git a/2023_003_lang/luecke_2023_003.png b/2023_003_lang/luecke_2023_003.png
new file mode 100644
index 0000000000000000000000000000000000000000..c31cb5b81d47407688962507209efaa2b276808e
Binary files /dev/null and b/2023_003_lang/luecke_2023_003.png differ
diff --git a/2023_003_lang/luecke_2023_004.png b/2023_003_lang/luecke_2023_004.png
new file mode 100644
index 0000000000000000000000000000000000000000..1086b84f00775438dcc831dbb0a2d1528d58c962
Binary files /dev/null and b/2023_003_lang/luecke_2023_004.png differ
diff --git a/2023_003_lang/luecke_2023_005.png b/2023_003_lang/luecke_2023_005.png
new file mode 100644
index 0000000000000000000000000000000000000000..f49d9d65b1dc5f0c3bc6c38abe8bb7b0ad63508f
Binary files /dev/null and b/2023_003_lang/luecke_2023_005.png differ
diff --git a/2023_003_lang/luecke_2023_006.png b/2023_003_lang/luecke_2023_006.png
new file mode 100644
index 0000000000000000000000000000000000000000..dc5cd873657e4e17500c2966d6907aea63703272
Binary files /dev/null and b/2023_003_lang/luecke_2023_006.png differ