diff --git a/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf b/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf new file mode 100644 index 0000000000000000000000000000000000000000..cbfab67a3f54191c3c3156e8700bf37137c91f8d Binary files /dev/null and b/2023_002_bartsch_et_al/bartsch_2023_v1_0.pdf differ diff --git a/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml b/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml new file mode 100644 index 0000000000000000000000000000000000000000..19788567193a01991df52d378f30cfd8ae831503 --- /dev/null +++ b/2023_002_bartsch_et_al/bartsch_2023_v1_0.xml @@ -0,0 +1,1753 @@ +<?xml version="1.0" encoding="utf-8"?> +<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html" + xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink" + xmlns:xhtml="http://www.w3.org/1999/xhtml"> + <teiHeader> + <fileDesc> + <titleStmt> + <title> + <biblStruct> + <analytic> + <title level="a">Sinn und Segment. Wie die digitale Analysepraxis unsere + Begriffe schärft</title> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Sabine</forename> + <surname>Bartsch</surname> + <email>sabine.bartsch@tu-darmstadt.de</email> + <idno type="gnd">122348839X</idno> + <idno type="orcid">0000-0001-7379-2158</idno> + <affiliation>Technische Universität Darmstadt</affiliation> + </persName> + </respStmt> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Evelyn</forename> + <surname>Gius</surname> + <email>evelyn.gius@tu-darmstadt.de</email> + <idno type="gnd">1084241307</idno> + <idno type="orcid">0000-0001-8888-8419</idno> + <affiliation>Technische Universität Darmstadt</affiliation> + </persName> + </respStmt> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Marcus</forename> + <surname>Müller</surname> + <email>marcus.mueller@tu-darmstadt.de</email> + <idno type="gnd">133933482</idno> + <idno type="orcid">0000-0003-4921-4512</idno> + <affiliation>Technische Universität Darmstadt</affiliation> + </persName> + </respStmt> + + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Andrea</forename> + <surname>Rapp</surname> + <email>andrea.rapp@tu-darmstadt.de</email> + <idno type="gnd">118015915</idno> + <idno type="orcid">0000-0003-4933-4397</idno> + <affiliation>Technische Universität Darmstadt</affiliation> + </persName> + </respStmt> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Thomas</forename> + <surname>Weitin</surname> + <email>thomas.weitin@tu-darmstadt.de</email> + <idno type="gnd">128442433</idno> + <idno type="orcid">0000-0002-9003-5746</idno> + <affiliation>Technische Universität Darmstadt</affiliation> + </persName> + </respStmt> + <idno type="doi">10.17175/2023_003</idno> + <idno type="ppn">1830041150</idno> + <idno type="zfdg">2023.003</idno> + <idno type="url">https://www.zfdg.de/node/406</idno> + <date when="2023-06-01">01.06.2023</date> + </analytic> + <monogr> + <title level="j">Zeitschrift für digitale Geisteswissenschaften</title> + <respStmt> + <resp>Publiziert von</resp> + <orgName role="marc_pbl">Herzog August Bibliothek</orgName> + </respStmt> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/dtm">Transformation der + Word Vorlage nach TEI</resp> + <persName/> + <name role="marc_trc"> + <surname>Baumgarten</surname> + <forename>Marcus</forename> + <idno type="gnd">1192832655</idno> + </name> + </respStmt> + <availability status="free"> + <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref> + </p> + </availability> + <imprint> + <biblScope unit="year">2023</biblScope> + <biblScope unit="artikel">03</biblScope> + </imprint> + </monogr> + </biblStruct> + </title> + </titleStmt> + <editionStmt> + <edition>Elektronische Ausgabe nach TEI P5</edition> + </editionStmt> + <publicationStmt> + <distributor> + <name> + <orgName>Herzog August Bibliothek Wolfenbüttel</orgName> + </name> + </distributor> + <idno type="doi">10.17175/zfdg.01</idno> + <idno type="ppn">819494402</idno> + <authority> + <name>Herzog August Bibliothek</name> + <address> + <addrLine>Lessingplatz 1</addrLine> + <addrLine>38304 Wolfenbüttel</addrLine> + </address> + </authority> + <authority> + <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name> + <address> + <addrLine>Burgplatz 4</addrLine> + <addrLine>99423 Weimar </addrLine> + </address> + </authority> + <availability status="free"> + <p> Sofern nicht anders angegeben </p> + <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence> + </availability> + <availability status="free"> + <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund + MWW</ref> + </p> + </availability> + </publicationStmt> + <sourceDesc> + <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p> + </sourceDesc> + </fileDesc> + <encodingDesc> + <editorialDecl> + <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und + XSLT-Skripten</p> + </editorialDecl> + <editorialDecl> + <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von <persName>Caroline Jansky</persName>.</p> + </editorialDecl> + <editorialDecl> + <p>Medienrechte liegen bei den Autor*innen</p> + </editorialDecl> + <editorialDecl> + <p>All links checked<date when="2023-05-16">16.05.2023</date> + </p> + </editorialDecl> + </encodingDesc> + <profileDesc> + <creation>Einreichung als Artikel der Zeitschrift für digitale + Geisteswissenschaften</creation> + <langUsage> + <language ident="de">Text auf Deutsch</language> + <language ident="de">Abstract auf Deutsch</language> + <language ident="en">Abstract auf Englisch</language> + </langUsage> + <textClass> + <keywords scheme="gnd"> + <term>Linguistik<ref target="4074250-7"/></term> + <term>Literaturwissenschaft<ref target="4036034-9"/></term> + <term>Philologie<ref target="4174271-0"/></term> + <term>Segmentierung<ref target="4180694-3"/></term> + <term>Textanalyse<ref target="4194196-2"/></term> + </keywords> + </textClass> + </profileDesc> + <revisionDesc> + <change/> + </revisionDesc> + </teiHeader> + <text> + <body> + <div> + <div type="abstract"> + <argument xml:lang="de"> + <p>Zu einer nachhaltigen Entwicklung der Digital Humanities (DH) gehören + Ergebnisse, die auch für Geisteswissenschaftler:innen jenseits der + DH-Communities relevant sind, weil sie auf existierende Forschungsfragen + Antworten geben. Als ein möglicher Weg, um in dieser Hinsicht ins Gespräch zu + kommen, erscheint uns das Nachdenken darüber, wie digitale Analysen + Grundbegriffe der Sprach- und Literaturwissenschaft problematisch und damit + deutlicher werden lassen. Wir zeigen das exemplarisch an der <term type="dh" + >Segmentierung</term> von Text, die für viele Analysen eine Basis darstellt, + die gleichermaßen, aber auf je unterschiedliche Art und Weise zum Lesen und zum + Rechnen im Sinne einer intellektuellen und computationellen Verarbeitung von + Text genutzt werden kann. Vor dem Hintergrund von konkreten Problemen aus der + sprach- und literaturwissenschaftlichen Segmentierungspraxis diskutieren wir + Ansätze aus den Teildisziplinen der Philologie. </p> + </argument> + </div> + <div type="abstract"> + <argument xml:lang="en"> + <p>Part of a sustainable development of the Digital Humanities (DH) are findings + whose relevance extends beyond DH communities because they are providing answers + to existing research questions. A possible way of entering into this + conversation seems to be a reflection on questions of how digital analyses + critically question basic concepts of linguistics and literary studies and thus + sharpen their definition. In this paper, we are going to address such questions + based on the example of <term type="dh">text segmentation</term> which forms + the basis for many analyses, and which can be used, albeit in different ways, as a foundation for both reading and computational processing of text. We are taking exemplary issues + from linguistic and literary segmentation practice as a vantage point for + discussion in this paper. </p> + </argument> + </div> + <div type="chapter"> + <head>1. Die epistemische Bedeutung digitaler Zugänge</head> + <p>Zu einer nachhaltigen Entwicklung der Digital Humanities gehören Erkenntnisse, die + auch für Geisteswissenschaftler:innen jenseits der DH-Communities relevant sind, weil + sie auf existierende Forschungsfragen Antworten geben oder auf neue, mit den + Forschungsfragen zusammenhängende Problemfelder verweisen.<note type="footnote"> + Dieser Beitrag basiert auf einem gleichnamigen Vortrag, den wir im Dezember 2019 + auf der Tagung ›Wozu Digitale Geisteswissenschaften? Innovationen, Revisionen, + Binnenkonflikte‹ an der Leuphana Universität Lüneburg gehalten haben.</note> + Entsprechend ist auch der an unserem Institut<note type="footnote"> Es handelt sich + um das Institut für Sprach- und Literaturwissenschaft an der Technischen + Universität Darmstadt.</note> praktizierte Zugang zur <term type="dh">Digital + Philology</term> so ausgerichtet, dass bestimmte Forschungsaspekte als gemeinsame + Herausforderung und als Diskussionsgegenstand zwischen den Teilfächern der Philologie + – Linguistik und Literaturwissenschaft (einschließlich der Mediävistik) – betrachtet + werden. Das Digitale wird im Kontext der Digital Philology nicht als vom + Nichtdigitalen abgesetzt, sondern als damit zusammenhängend betrachtet. Der digitale + Zugang zu philologischen Fragen wird entsprechend auch für eine Auseinandersetzung + über die philologischen Teilfächer hinweg genutzt, der sich häufig als + erkenntnisproduktiver erweist.<note type="footnote"> Vgl. + <ref type="bibliography" target="#adler_philologie_2020">Adler et al. 2020</ref>.</note> + </p> + <p>Das Nachdenken darüber, wie digitale Analysen Grundbegriffe in den Philologien + problematisch und damit deutlicher werden lassen, ist ein möglicher Weg, um in dieser + Hinsicht ins Gespräch zu kommen. Im Folgenden wollen wir anhand von + Forschungsproblemen aus der Linguistik und Literaturwissenschaft zeigen, wie eine + digitale Betrachtung von fachspezifischen Problemen übergeordnete Konzepte in den + Blick bringen und so zu einem produktiven Austausch zwischen den Disziplinen + beitragen kann. Dies geschieht exemplarisch anhand eines Verfahrens, das für viele + Textanalysen eine Basis darstellt: die <term type="dh">Segmentierung</term> von Text. + Denn jede Textanalyse bezieht sich auf bestimmte Textsegmente, welche wiederum auf je + unterschiedliche Art und Weise zum Lesen und auch zum Rechnen genutzt werden. In den + verschiedenen Zugängen unterscheidet sich nicht nur die Auffassung von Text als einer aus + Textsegmenten zusammengesetzte Einheit. Je nach disziplinärer Verortung und + theoretischem Hintergrund eines Forschungszugangs wird auch die Segmentierung als + Verfahren nicht immer explizit gemacht, genauso wenig wie die methodologischen + Konsequenzen des genutzten Konzepts von Segment bzw. des angewendeten Verfahrens der + Segmentierung thematisiert werden.</p> + <p>Das Konzept der Segmentierung, das alle in diesem Beitrag diskutierten Ansätze + verbindet, steht dabei im weitesten Sinne für eine Aufteilung des zu untersuchenden + Textmaterials. Während eine solche Aufteilung in der Linguistik selbstverständlich + ist – deren Grundvoraussetzung ist die Segmentierung des sprachlichen Kontinuums in + diskrete Einheiten wie Phonem, Morphem, Wort, Phrase oder Satz (siehe <ref + type="intern" target="#hd3">Kapitel 2.1</ref>) –, ist das Konzept in der + literaturwissenschaftlichen Terminologie wenig verankert. Mehr noch: Selbst die + Entwicklung von computationellen Zugängen im Kontext der literaturwissenschaftlichen + Digital Humanities, die häufig auf Textsegmenten basiert, führte bislang nicht zu + einer disziplinär begründeten Auseinandersetzung mit der Frage der + Textsegmentierung.</p> + <p>Trotz dieser unterschiedlichen Ausgangslage in den Teildisziplinen wird an den im + Folgenden diskutierten fünf Zugängen eine sie verbindende Herausforderung sichtbar. + Die Segmentierung von Texten ist eng verbunden mit der Kategorisierung von Phänomenen + und der Interpretation dieser Phänomene in den Texten, also der kontrollierten Praxis + der Herstellung von Sinn. Mit ›Sinn‹, dessen reiche Begriffsgeschichte in Linguistik, + Hermeneutik und Sprachphilosophie wir an dieser Stelle nicht diskutieren können,<note + type="footnote"> Für die hermeneutische Diskussion vgl. + <ref type="bibliography" target="#angehrn_sinn_2010">Angehrn 2010</ref>; für die + linguistische Semantik <ref type="bibliography" target="#katz_sense_2004">Katz 2004</ref>; für die Diskursforschung + <ref type="bibliography" target="#keller_diskurs_2015">Keller 2015</ref>.</note> + meinen wir hier die durch Interpretation hergestellte Situationsbedeutung einer + textuellen und diskursiven Einheit (im Gegensatz etwa zur Systembedeutung oder dem + referenziellen Potenzial sprachlicher Zeichen). Hilfreich mag es sein, darauf + hinzuweisen, dass ›Sinn‹ etymologisch auf die indogermanische Wurzel *sent- ›eine + Richtung nehmen, gehen‹ zurückführbar ist<note type="footnote"> Vgl. + <ref type="bibliography" target="#pfeifer_woerterbuch_1993">Pfeifer et al. + 1993</ref>. </note> und dem Begriff, wie Donatus Thürnau ausführt,<note type="footnote"><ref type="bibliography" target="#thuernau_sinn_2017">Donatus Thürnau 2017</ref>.</note> metaphorisch die Idee der Richtungsgebung + innewohnt. Bei der Herstellung von sprachlichem Sinn geht es darum, das + Sprachverstehen in eine von typischerweise mehreren möglichen Richtungen zu treiben. + Dazu braucht es Kontextsignale. Wir wollen in diesem Beitrag zeigen, dass dieser + Prozess der Kontextualisierung sprachlicher Bedeutung unmittelbar und ursächlich mit der Größe der dafür in Betracht gezogenen Textsegmente sowie den gewählten + Segmentierungsverfahren in Zusammenhang steht. Eine weitere Ebene ergibt sich, wenn + man auch den ›materiellen‹ Textträger in den Blick nimmt und dessen texttopografische + Einheiten analytisch segmentiert. Das Layout wird in diesem Verständnis als weiterer + Bedeutungsträger gesehen. </p> + </div> + <div type="chapter"> + <head>2. Segmentierung</head> + <div type="subchapter"> + <head>2.1 Segmentierung in der Linguistik</head> + <p>Das älteste Segmentierungsverfahren ist nach dem Artikel von Wolf Thümmel im <bibl> + <title type="desc">Metzler Lexikon Sprache</title> + </bibl><note type="footnote"> <ref type="bibliography" target="#thuemmel_segmentierung_2016">Thümmel 2016</ref>, S. 602.</note> die Schrift, da im Prozess der + Verschriftung das Lautkontinuum der mündlichen Sprache notwendigerweise in diskrete + Einheiten zerlegt und so der Kategorisierung und Reflexion zugänglich gemacht wird. + Auch Schriften und Texte können verschiedene Stufen von Segmentierung durchlaufen: + Das moderne Schrift- und Layoutbild mitteleuropäischer Schrift- und Textzeugen z. B. + entwickelt sich erst im Mittelalter nach einer Phase der <term type="dh">Scriptio + Continua</term> ohne Segmentierung der Wort- und Texteinheiten. Segmentierung + nennt man in der Linguistik die Zerlegung komplexer Einheiten in ihre Elemente zum + Zweck ihrer Klassifikation. Es geht also darum, in der <term type="dh">chaine + parlée</term><note type="footnote"> Vgl. <ref type="bibliography" target="#saussure_cours_1916">Saussure 1916</ref>, S. 16.</note> Einheiten voneinander + abzugrenzen und kategorial zu bestimmen, z. B. einen Laut (<term type="dh" + >Phon</term>) einer Lautklasse (<term type="dh">Phonem</term>) zuzuordnen. + Segmentierung hat sich im Paradigma der strukturalistischen Sprachbeschreibung zu + einem Standardverfahren entwickelt, das traditionellerweise auf die linguistischen + Einheiten unterhalb der Satzebene angewendet wird: Phonem (Lautklasse), Morphem, Wort + und Phrase. Auch außerhalb der Linguistik bekannte Segmentierungsverfahren sind + beispielsweise die im Schulunterricht eingeübten Praktiken zur Erkennung von + Satzgliedern wie die Umstell- und Ersetzungsprobe. </p> + <table> + <row> + <cell> + <hi rend="bold">Einheiten</hi> + </cell> + <cell> + <hi rend="bold">Beispiel</hi> + </cell> + <cell> + <hi rend="bold">Klasse</hi> + </cell> + <cell> + <hi rend="bold">Beispiel</hi> + </cell> + </row> + <row> + <cell> + Phon |<lb/> + Graph + </cell> + <cell> + [daχ] |<lb/> + Dach<lb/> + </cell> + <cell>Phonem | Graphem</cell> + <cell> + /d/ – /a/ – /x/ |<lb/> + <D> – <a> – <ch> + </cell> + </row> + <row> + <cell>Morph</cell> + <cell> + Bett – <hi rend="italic">en</hi><lb/> + Kind – <hi rend="italic">er</hi><lb/> + </cell> + <cell>Morphem</cell> + <cell>Flexionsmorphem, Nominativ Plural</cell> + </row> + <row> + <cell>Wort / Token</cell> + <cell> + Klang<lb/> + Wunder<lb/> + </cell> + <cell>Wortart</cell> + <cell>Nomen appellativum</cell> + </row> + <row> + <cell>Phrase</cell> + <cell> + die kleine Biene<lb/> + unser schöner Garten<lb/> + </cell> + <cell>Phrasentyp</cell> + <cell>Nominalphrase</cell> + </row> + <row> + <cell>Satz</cell> + <cell> + Der Klügere gibt nach.<lb/> + Gertrud, deren Nachbarin Kakteen züchtet, steht am Fenster. + </cell> + <cell>Satztyp</cell> + <cell>Aussagesatz</cell> + </row> + <row> + <cell> + Text + </cell> + <cell> + Liebe Heidrun,<lb/> + mir geht es gut.<lb/> + Dein Volker<lb/> + </cell> + <cell>Textsorte</cell> + <cell>Brief</cell> + </row> + <trailer xml:id="tab01"> + <ref type="intern" target="#tab1">Tab. 1</ref>: Linguistische Einheiten der Segmentierung.<ref type="graphic" target="#segment_t1"/> + </trailer> + </table> + + <p>Seit die Linguistik sich der Einheit <term type="dh">Text</term> zugewandt hat, + werden Segmentierungsverfahren auch oberhalb der Satzebene, etwa zur Erkennung von + Layout- und Textstrukturen oberhalb des Satzes, also Absätzen, Kapiteln etc., + angewendet. Solche Verfahren der Textsegmentierung spielen insbesondere bei der + Arbeit mit digitalen Korpora eine große Rolle. In der digitalen Linguistik bezeichnet + man Segmentierungsverfahren auf Wort- und Satzebene als <term type="dh" + >Tokenisierung</term>. Das beinhaltet die Identifikation von Satzgrenzen + (Satztokenisierung oder <term type="dh">sentence splitting</term>) und die Bestimmung + von Datumsangaben (z. B. <term type="figure">9. Nov. 1989</term>) und sogenannten Alphabetismen + (z. B. <term type="figure">U.S.A</term>.) ebenso wie die Tokenisierung der Einheiten + auf der Ebene des Wortes (z. B. die Identifikation von einfachen <term type="dh" + >Lexemen</term> wie <term type="figure">Haus</term> sowie von Komposita wie <term + type="figure">Hausboot</term> oder <term type="figure">Vitamin-B-haltig</term> als + Tokens). Segmentierungsentscheidungen im Sinne der Tokenisierung werden zumeist in + unmittelbarer Abhängigkeit der Identifizierbarkeit von Zeichenketten als Einheiten + implementiert. So wird als einfachste Annahme beispielsweise das Leerzeichen als + Tokengrenze angenommen und durch das verbundene Auftreten von Interpunktionszeichen + als Tokengrenze ergänzt. Ein Komma oder Punkt am Ende einer Sequenz alphabetischer + Zeichen, die ein linguistisches Wort konstituieren, sind also ebenso wie ein + Leerzeichen als Tokenisierungsgrenze definiert. Ausnahmen zu dieser Regel, wie im + Falle von Abkürzungswörtern, Titeln, wie <term type="figure">Dr.</term>, oder + Alphabetismen, wie <term type="figure">R.E.M.</term>, werden anhand von + Regelerweiterungen definiert. Computationell implementiert werden + Tokenisierungsalgorithmen beispielsweise auf der Grundlage sogenannter regulärer + Ausdrücke und durch Regeln für spezifische Anwendungsszenarien ergänzt. Ein Beispiel + hierfür ist die Tokenisierung von Diskursen mit Elementen konzeptioneller + Mündlichkeit, wie <term type="dh">Social-Media-Kommunikate</term> (z. B. Bildungen + aus Vollverb + Personalpronomen wie <term type="figure">schreibste</term> und sogenannter Aktionswörter wie + <term type="figure">*grins*</term> oder <term type="figure">beidirseinwill</term> sowie Bildungen mit Sonderzeichen als Wortbestandteil, + wie Formen mit Hashtags <term type="figure">#Urlaub</term> oder E-Mail-Adressen und URLs). Die automatische + Implementierung solcher Tokenisierungsalgorithmen wird häufig in regelbasierten + Tokensierungsprozessen eingesetzt und durch Verfahren des maschinellen Lernens + ergänzt und kann im Fall einer sehr guten Passung zwischen Modell bzw. Trainingsdaten + und der Komplexität der zu tokenisierenden Daten hohe Genauigkeiten von über 99 % (<term type="dh">F1 + score</term>) erreichen,<note type="footnote"> <ref type="bibliography" target="#beisswenger_empirist_2016">Beißwenger et al. 2016</ref>.</note> bei + schlechterer Passung aber auch deutlich darunter liegen. Der Prozess der + Tokenisierung steht in direkter Abhängigkeit zu den Eigenschaften der zu + tokenisierenden Textdaten sowie der Qualität bzw. der Passung der Modellierung des + Tokenisierungsprozesses.<note type="footnote"> + <ref type="bibliography" target="#ortmann_tools_2019">Ortmann et al. 2019</ref>.</note></p> + </div> + <div type="subchapter"> + <head>2.2 Segmentierung in der Literaturwissenschaft</head> + <p>In der literaturwissenschaftlichen Textanalyse geht es zumeist um wesentlich größere + Texteinheiten als in der Linguistik. In der Analyse von Erzähltexten umfasst eine + Einheit typischerweise sogar den ganzen Text, wobei nicht selten eine ganze Reihe von + Texten im Fokus steht, etwa das Gesamtwerk eine:r Autor:in oder eine Sammlung zumeist + als exemplarisch geltender Texte z. B. einer Strömung oder Gattung. Wenn auch im + Einzelfall durchaus Kapitel und ähnliche strukturelle Einheiten in Analysen mit + einbezogen werden, gibt es kaum konventionalisierte Unterteilungen von Texten, die in + Analysen normalerweise genutzt werden. </p> + <p>Das wird bei der Betrachtung von literaturwissenschaftlichen Grundlagenwerken + offensichtlich. So findet sich im <bibl> + <title type="desc">Handbuch Literaturwissenschaft</title> + </bibl> mit seinen drei Bänden zu Gegenständen und Grundbegriffen (Band 1), Methoden + und Theorien (Band 2) und Institutionen und Praxisfeldern (Band 3) nichts zu + Segmentierung als Verfahren oder zu Segmenten als Texteinheiten.<note type="footnote" + > Vgl. <ref type="bibliography" target="#anz_handbuch_2013">Anz (Hg.) 2013</ref>.</note> Zwar wird in den Bänden 1 und 2 auf Segmentierung im + Kontext von Dramen und von Lyrik eingegangen und es werden jeweils typische Segmente + genannt.<note type="footnote"> Für Dramen wird etwa festgestellt: <quote>Den + sichtbar markierten Segmentierungen von Texten in ›Auftritte‹, ›Szenen‹, + ›Akte‹, ›Kapitel‹ oder den unmarkierten Segmentierungen liegt vielfach ein + Zeit- und Raumwechsel zugleich zugrunde</quote> (vgl. <ref type="bibliography" target="#anz_textwelten_2013">Anz 2013</ref>, S. 118). Bei + lyrischen Texten werden darüber hinaus semantische Segmente thematisiert: + <quote>In einem ersten Schritt kann der Interpret eine erste Gliederung seines + Textes in syntaktische Einheiten (etwa Strophen, Kapitel, Abschnitte) und + semantische Segmente (etwa Orte, Figuren, Figurencharakteristika, + Handlungselemente) vornehmen</quote> (vgl. <ref type="bibliography" target="#koeppe_theorien_2013">Köppe / Winko 2013</ref>, S. 296).</note> + Dies geschieht aber ohne Explizierung des Konzepts bzw. des Verfahrens. Für + Erzähltexte hingegen werden die in der Analyse genutzten Segmente erst gar nicht + bestimmt, allerdings wird zumindest implizit Text als aus Segmenten zusammengesetzt + dargestellt. Außerdem klingt, wie auch bei der Beschreibung lyrischer Texte, eine + semantische Segmentierung – etwa nach Handlung oder Figuren – an, die jedoch nicht + systematisch in Bezug auf das Segmentieren der Texte beschrieben wird.<note + type="footnote"> Vgl. dazu den Abschnitt »Erzähltexttheorie« im Handbuch + Literaturwissenschaft (<ref type="bibliography" target="#schmid_erzaehltextanalyse_2013">Schmid 2013</ref>, S. 89–120).</note> Dieser geringen Relevanz + von Segmenten und Segmentierung in der Literaturwissenschaft entspricht auch, dass + sich im Standardnachschlagewerk der germanistischen Literaturwissenschaft, dem <bibl> + <title type="desc">Reallexikon der deutschen Literaturwissenschaft</title> + </bibl><note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>.</note>, kein eigener + Eintrag dazu findet. In Bezug auf Prosatexte – und zum Teil auch auf alle Texte – ist + der literaturwissenschaftliche Zugang zu Text also insofern vorwiegend ein + holistischer, als er keine allgemein akzeptierte Segmentierung kennt.</p> + <p>Für die Automatisierung im Bereich der computationellen Literaturwissenschaft ist die + fehlende Segmentierung von Prosatexten problematisch. Anders als in den meisten + linguistischen Fragestellungen kann hier nicht auf standardisierte Segmente + zurückgegriffen werden, dabei basieren viele Verfahren auf Segmenten. Sei es bei der + Bestimmung von Autor:innenschaft, bei der Berechnung von als eine Art thematische Struktur + aufgefassten <term type="dh">Topics</term>, bei <term type="dh" + >Sentiment-Analysen</term> oder bei Verfahren zur Bestimmung semantischer + Ähnlichkeiten, wie sie in der distributionellen Semantik gerade populär sind: Die + Verfahren basieren in verschiedenem Umfang auf einer Unterteilung der Texte in + kleinere Einheiten. Dabei segmentieren sie je nachdem, ob sie dem Paradigma der Suche + in oder der abstrakten Repräsentation von Texten verpflichtet sind, auf ganz + unterschiedlichen Ebenen. Für Verfahren wie die Sentiment-Analyse ist zu vermuten, + dass eine literaturwissenschaftliche Bestimmung der genutzten Einheiten – etwa als + figurenbezogene Segmente oder eine Segmentierung der Handlung – zu einer wesentlichen + Verbesserung der Verfahren führen würde. Andere Verfahren nehmen zwar bereits + behelfsmäßig eine Unterteilung der Texte in Segmente gleichen Wortumfangs vor, können + damit aber wahrscheinlich nicht ihre vollen Möglichkeiten ausschöpfen. Das betrifft + etwa das <term type="dh">Topic Modeling</term>, welches insbesondere für auch in + ihrer Struktur vergleichbare Texte bzw. Texteinheiten entworfen wurde. Da bislang mit + von der Wortzahl bestimmten Segmenten gearbeitet wird, wird die Textstruktur nicht + berücksichtigt.</p> + </div> + </div> + <div type="chapter"> + <head>3. Fünf Beispiele </head> + <div type="subchapter"> + <head>3.1 Segmentierung von Layout und Textstruktur</head> + <p>Neben der inhaltsbezogenen Bildrecherche,<note type="footnote"> Vgl. <ref type="bibliography" target="#bullin_bildsuche_2020">Bullin / Henrich + 2020</ref>.</note> die auf u. a. Segmentierungsverfahren aufsetzt, ist die + Segmentierung von Layoutelementen und entsprechenden Textstrukturen für + Texterkennungsverfahren wie <term type="dh">Optical Character Recognition</term> + (OCR) und <term type="dh">Handwriting Recognition</term> (HWR) bzw. <term type="dh" + >Handwritten Text Recognition</term> (HTR) von zentraler Bedeutung. Darüber hinaus + erlaubt eine solche Segmentierung jedoch auch die Analyse von Schreibprozessen<note + type="footnote"> Vgl. <ref type="bibliography" target="#gabler_primacy_2007">Gabler 2007</ref>.</note> und gibt neue Einsichten in + Textüberlieferungsprozesse auch sehr komplexer Natur.<note type="footnote"> Vgl. + <ref type="bibliography" target="#krewet_wissenstransfer_2015">Krewet 2015</ref>.</note> Die mathematischen und informatisch-methodischen Grundlagen + der verschiedenen Verfahren beschreibt Rainer Herzog.<note type="footnote"> Vgl. + <ref type="bibliography" target="#herzog_ansatz_2018">Herzog 2018</ref>. </note> Aus dieser Perspektive ist die Segmentierung von + Texteinheiten auf der Bildoberfläche eine seit langem erkannte Herausforderung, die + intensiv erforscht wird. Die Analyse von modernen oder historischen Drucken sowie von + Handschriften aller Art bringt dabei aufgrund der Beschaffenheit und des + Erhaltungszustands unterschiedliche Anforderungen mit sich.</p> + <p>Das Beispiel der als so ›kontaminiert‹ geltenden Überlieferung der + Aristoteles-Schrift <bibl> + <title type="desc">de interpretatione</title></bibl>, dass sie in vertretbarer bzw. verfügbarer Zeit eines Forscher:innenlebens + nicht entschlüsselt werden könne,<note type="footnote"> Vgl. <ref type="bibliography" target="#krewet_aristoteles_2019">Krewet et al. 2019</ref>, S. + 77.</note> soll zeigen, wie eine Segmentierung von Layout- und Textstrukturen in + Grundtext und Paratexte neue Einsichten in die Überlieferungs- und + Rezeptionsgeschichte geben kann. Dabei werden sowohl Veränderungen der Texteinheiten + und ihrer Layoutgestalt(ung) als äußerer Transfer (materielles Resultat) wie auch die + sich daraus ergebende Veränderung der Konstitution des Grundtexts als innerer + Transfer (epistemischer Prozess) in den Blick genommen, denn beides gehört untrennbar + zusammen. Segmentierung erlaubt also Analyse textueller Dynamiken an der Oberfläche + (Layout) sowie in der Tiefe (Textverständnis).</p> + <p>Solche Segmentierungsfragen an Texte bzw. Textüberlieferungen sind im Zuge des <term + type="dh">Material Turns</term> in den Blick geraten,<note type="footnote"> Vgl. + <ref type="bibliography" target="#schubert_materialitaet_2010">Schubert (Hg.) 2010</ref>.</note> erfahren vor allem aber auch durch digitale + Möglichkeiten weitere Aufmerksamkeit. Zum einen lassen sich Segmente umfangreicher + Überlieferungen (semi-)automatisch bestimmen, zum anderen solche Segmente und ihre + Schichtungen dann anschaulich visualisieren. Darüber hinaus eröffnet gerade ein + gemischter Ansatz von automatischer (Vor-)Segmentierung und intellektueller + (Tiefen-)Annotation sowie quantitativer und qualitativer Verfahren bessere + Analysemöglichkeiten, wie unsere Arbeiten im Infrastruktur- sowie im Gastprojekt des + SFB 980 ›Episteme in Bewegung‹ zeigen konnten.<note type="footnote"> Vgl. <ref type="bibliography" target="#krewet_aristoteles_2019">Krewet et + al. 2019</ref>; <ref type="bibliography" target="#krewet_diagramme_2020">Krewet / Hegel 2020</ref>.</note> Die strukturelle und materielle Organisation + der Wissensbestände in <bibl> + <title type="desc">de interpretatione</title> + </bibl> verändert sich im Laufe der Überlieferungsgeschichte beständig: + Verschiedenste Arten und Formen von Interlinear- oder Marginal-Glossen, Scholien, + Diagrammen und Kommentaren können in gleicher, ähnlicher oder stark veränderter Form + bis hin zur Aufnahme in den Grundtext in eine neu entstehende Abschrift aufgenommen + werden. Die Segmentierung dieser Einheiten und ihre eindeutige Kategorisierung führt + dazu, dass Versionen dieser Einheiten vergleichbar gemacht und damit Kontaminationen + aufgespürt werden können.<note type="footnote"> Vgl. dazu ausführlich <ref type="bibliography" target="#krewet_diagramme_2020">Krewet / Hegel + 2020</ref>.</note> + </p> + <p>Auch im Bereich der materiellen Textoberfläche wirken also digitale Modellierungen + auf Forschungsfragen und Forschungsergebnisse zurück, indem in einem ersten Schritt + der Segmentierung relevante Eigenschaften der Forschungsgegenstände kategorisiert und + festgehalten werden. Idealerweise geschieht dies in einem Aushandlungsprozess + zwischen Text- und Informationswissenschaftler:innen, damit die gemeinsame Arbeit am + Modell zu Erkenntnisfortschritt am Gegenstand und zu Interoperabilität der Kategorien + führt.</p> + </div> + <div type="subchapter"> + <head>3.2 Segmentierung jenseits der Textoberfläche: Mehrwortausdrücke</head> + <p>Segmentierung kann verschiedene Formen und Rollen im analytischen Workflow annehmen. + Neben ihrer Rolle als Teil der Vorverarbeitung von Korpora spielt die Segmentierung + auch als Teil der Heuristik zur Identifikation und Extraktion lexikalischer <term + type="dh">Mehrwortausdrücke</term> (MWA) eine zentrale Rolle. In diesem Abschnitt + soll am Beispiel der Identifikation und Extraktion lexikalischer Mehrwortausdrücke in + Korpora, hier anhand von <term type="dh">Kollokationen</term>, gezeigt werden, auf + welchen Segmentierungen der Prozess beruht und wie diese das Extraktionsergebnis + beeinflussen. Die Herausforderung ist im Falle solcher MWA, dass sie keine feste + identifizierbare Oberflächenform aufweisen, also keinem festen Muster folgen, sondern + neben kontinuierlichen, ununterbrochenen Wortfolgen, wie z. B. Kollokationen zwischen + prädikativem Adjektiv und Substantiv (wie <term type="figure">blondes Haar</term>) + auch diskontinuierliche MWA, wie z. B. Kollokationen zwischen Prädikatsverb und + Substantiv in der Nominalphrase (wie <term type="figure">ein Verbrechen + begehen</term> – <term type="figure">jemand begeht schreckliche Verbrechen</term>) + umfassen. </p> + <p>Segmentierungsentscheidungen beruhen auf möglichst gut beschriebenen Merkmalen zur + Identifikation der zu segmentierenden Einheiten an der sprachlichen Oberfläche. + Typischerweise werden entsprechende Entscheidungskriterien in Segmentierungs- und + Annotationsrichtlinien festgehalten sowie bei automatischen Verfahren in + entsprechenden Segmentierungsalgorithmen implementiert. Dabei kommt es auf eine + Balance zwischen der Treffsicherheit und Zuverlässigkeit der Segmentierung, der + möglichst exhaustiven Identifikation der zu untersuchenden linguistischen Einheiten + und der Implementierungs- bzw. Anwendungsanforderungen an. Das heißt, dass sich unter + Umständen nicht alle aus linguistischer Perspektive interessanten Einheiten mit der + angestrebten Zuverlässigkeit in Form manuell oder automatisch anwendbarer + Segmentierungsanweisungen umsetzen lassen. Entscheidend sind hierfür eine Reihe von + Faktoren, denen es systematisch beizukommen gilt. Auf der ersten Ebene geht es um die + eineindeutige Beschreibung der Merkmale in Form von Segmentierungsrichtlinien. Diese + müssen auf der nächsten Ebene entweder manuell von menschlichen Segmentierer:innen + möglichst gut verstanden und so bei der Segmentierung befolgt und bei automatisierten + Verfahren in Form von Regeln implementiert werden. Grundvoraussetzung ist im Fall der + manuellen Anwendung der Segmentierung ein intellektuelles Verstehen der Eigenschaften + der zu segmentierenden sprachlichen Einheiten im Sinne ihrer diskreten Identifikation + in den Daten. Dieser Prozess beinhaltet als elementaren Bestandteil eine Beschreibung + der Merkmale, an denen diskrete Segmentierungseinheiten an der Oberfläche der Daten + identifizierbar sind. Eine solche Modellierung von Segmentierungseinheiten und deren + Kennzeichen an der sprachlichen Oberfläche ist elementar für die algorithmische + Implementierung der Segmentierung. Die relative Einfachheit der Identifikation von + Segmentierungsmerkmalen an der Oberfläche ist zugleich die größte Stärke und Schwäche + des Verfahrens, denn zuverlässig lassen sich so zunächst am besten solche + Segmentierungsentscheidungen modellieren, die sich anhand oberflächenstruktureller + Merkmale möglichst eineindeutig, z. B. anhand regulärer Ausdrücke, abbilden lassen. + Anhand solcher Verfahren gut zu modellierende Segmentierungen sind Wortgrenzen auf + der Basis von Leerzeichen und Interpunktionszeichen sowie regelkonforme Sätze. </p> + <p>Korpora mit auf diese Weise vorgenommenen Segmentierungen, wie die Tokenisierung auf + Wortebene sowie die Satztokenisierung, bilden die Grundlage für die linguistische + Kategorisierung durch Verfahren wie die automatische Wortartenannotation (<term + type="dh">Part-of-Speech-Tagging</term>). Das Part-of-Speech-Tagging ist so eng + mit der Tokenisierung auf Wort-und Satzebene verwoben und von der + Tokenisierungsqualität abhängig, dass beide Prozesse in der Regel in einem Workflow + miteinander verbunden sind. So implementieren gängige Part-of-Speech-Tagger, wie der <bibl> + <title type="desc">Stanford Log-Linear Part-of-Speech Tagger</title></bibl><note type="footnote"> Vgl. <ref type="bibliography" target="#toutanova_enriching_2000">Toutanova / Manning 2000</ref>.</note> und der <bibl> + <title type="desc">TreeTagger</title></bibl><note type="footnote">Vgl. <ref type="bibliography" target="#schmid_part_1994">Schmid 1994</ref>; + <ref type="bibliography" target="#schmid_improvements_1995">Schmid 1995</ref>.</note> eigene + Tokenisierungsprozesse, die dem Part-of-Speech-Tagging innerhalb des Workflows + vorgeschaltet werden. Es handelt sich bei der Tokenisierung also um + Vorverarbeitungsschritte, die Voraussetzung und Grundlage für automatische + Annotationsprozesse, wie das Part-of-Speech-Tagging, sind. Die meisten aktuellen + Part-of-Speech-Tagger bringen eine eigene Implementierung der Tokenisierung mit, da + die Modellierung der Wortartenannotation eine spezifische Tokenisierung voraussetzt + und eine gute Tokenisierung auch entscheidenden Einfluß auf die Qualität der + Wortartenannotation hat.</p> + <p>Doch Segmente als Grundlage linguistischer Analysen konstituieren sich im Prozess der + Analyse auch auf andere Weise, nämlich dann, wenn die zu untersuchenden + linguistischen Phänomene zwar auf tokenisierten Elementen beruhen, sich jedoch + darüber hinaus strukturell auf weiteren Ebenen der linguistischen Organisation + konstituieren. Ein Beispiel hierfür sind Kollokationen und andere komplexe + lexikalische Gruppen, die sich aus zwei oder mehr kontinuierlichen oder + diskontinuierlichen lexikalischen Einheiten konstituieren. Die folgenden Beispiele + sollen dies illustrieren:</p> + <table> + <row> + <cell> + <hi rend="bold">Mehrwortausdruck</hi> + </cell> + <cell> + <hi rend="bold">Beispiel</hi> + </cell> + </row> + <row> + <cell>Stützverbkonstruktionen, z. B. <term type="figure">Rede halten</term>, <term + type="figure">Bad nehmen</term> + </cell> + <cell>Diese <hi rend="bold">Rede hielt </hi>die Kanzlerin anlässlich des …<lb/> + Die <hi + rend="bold">Rede</hi>, die die Kanzlerin anlässlich des ... <hi rend="bold" + >hielt</hi>.<lb/></cell> + </row> + <row> + <cell>trennbare Verben, z. B. <term type="figure">stoßen auf</term>, <term + type="figure">binden an</term> + </cell> + <cell>Im Verlaufe der Untersuchung <hi rend="bold">stießen </hi>die Ärzte <hi + rend="bold">auf </hi>neue Symptome.</cell> + </row> + <row> + <cell>Kollokationen, z. B. <term type="figure">Verbrechen begehen</term> + </cell> + <cell> + Von dieser Gruppierung wurden über Jahre schwerste <hi rend="bold" + >Verbrechen begangen</hi>.<lb/> + Die <hi rend="bold">Verbrechen </hi>wurden von + dieser Gruppierung über mehrere Jahre <hi rend="bold">begangen</hi>.</cell> + </row> + <trailer xml:id="tab02"> + <ref type="intern" target="#tab2">Tab. 2</ref>: Beispiele lexikalischer Mehrwortausdrücke.<ref type="graphic" target="#segment_t2"/> + </trailer> + </table> + + + <p>Lexikalische Mehrwortausdrücke sind phraseologisch also als relativ feste + Kombinationen im Inventar der Sprache etabliert. Manche davon sprichwörtlich und + relativ unveränderlich (›Der Spatz in der Hand ist besser als die Taube auf dem + Dach‹), die meisten aber – wie die hier adressierten Beispiele – flexibler im Rahmen + des Sprachsystems. Ihr habituelles kombiniertes Auftreten, das J. R. Firth mit dem DiKtum <quote>You shall know a word by the company it keeps</quote><note type="footnote"><ref type="bibliography" target="#firth_papers_1964">Firth 1964 [1957]</ref>.</note> beschreibt – hat in der + Forschung der vergangenen Jahrzehnte, vor allem aber seit der Einführung digitaler + Daten und Verfahren in der Linguistik eine Reihe von Ansätzen mit dem Ziel + hervorgebracht, relevante und reproduzierbare Ergebnismengen lexikalischer + Mehrwortausdrücke aus Korpora zu extrahieren. Dies geschieht üblicherweise auf der + Grundlage statistischer Verfahren, wie zum Beispiel anhand von Assoziationsmaßen, + unter denen <term type="dh">Log-Likelihood-Ratio</term>, <term type="dh" + >t-Score</term>, der <term type="dh">Dice-Koeffizient</term> und <term type="dh" + >Mutual Information Score</term> (MI) zu den am häufigsten verwendeten + zählen.<note type="footnote"> Vgl. <ref type="bibliography" target="#evert_corpora_2008">Evert 2008</ref>; + <ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> Neben + der relativ etablierten Kookkurrenz von zwei oder mehr Konstituenten der + lexikalischen Ebene weisen lexikalische Mehrwortausdrücke aber auch ein gewisses Maß + an Flexibilität bezüglich struktureller Permutationen im Rahmen der regulären + Grammatik auf, können also je nach Kontext modifiziert und anhand der Regeln der + Grammatik verändert und umgestellt werden (siehe Beispiel zu Kollokationen in <ref type="intern" target="#tab02">Tabelle 2</ref>). Kollokationen sind zudem + häufig zu einem gewissen Grad semantisch transparent, ihre Bedeutung lässt sich also + vollständig oder teilweise aus den Einzelbedeutungen ihrer Konstituenten + ableiten.</p> + <p>Im Folgenden soll am Beispiel der Extraktion von Kollokationen im Firth’schen + Sinne<note type="footnote"> Vgl. <ref type="bibliography" target="#firth_papers_1964">Firth 1964 [1957]</ref>.</note> habitueller + Kookkurrenzen lexikalischeblor Einheiten – also des wiederkehrenden gemeinsamen + Auftretens als Wortverbindungen – und einer um syntaktische Relationen erweiterten + Definition diskutiert werden, welchen Einfluss die Segmentierung im Sinne von + Tokenisierung und Satzsegmentierung auf die Extraktion von Kollokationen aus Korpora + anhand statistischer Assoziationsmaße hat und wie die Veränderung von Parametern mit + Bezug auf den Suchraum – die gleichfalls eine Form der Segmentierung darstellt –, + die Ergebnismenge bei der Identifikation von Kollokationen beeinflusst. Anhand dieses + Beispiels lässt sich zeigen, dass die Operationalisierung einer bereits in prä-computationaler Zeit + formulierten Definition mittels digitaler Verfahren und statistischer + Assoziationsmaße auf Segmentierungsentscheidungen fußt und auf dieser + Grundlage im Digitalen geschärft und weiterentwickelt werden konnte.</p> + <p>Bei Kollokationen handelt es sich um ein Phänomen, das Stefan Evert als ›Epiphänomen‹<note + type="footnote"> <ref type="bibliography" target="#evert_corpora_2008">Evert 2008</ref>.</note> bezeichnet hat, da diese im klassischen + Firth’schen Sinne zunächst ein Effekt der habituellen Kookkurrenz ihrer Konstituenten + sind, denen man auch nach Firth eine gegenseitige Erwartbarkeit (»mutual expectancy + between certain words«<note type="footnote"><ref type="bibliography" target="#firth_selected_1968">Firth 1968</ref>, S. 181.</note>) zwischen + bestimmten Wörtern zuschreibt. Diese habituell kookkurrierenden, wechselseitig + erwartbaren lexikalischen Konstituenten bilden von kompetenten Muttersprachler:innen + im Sprachgebrauch beherrschte, relativ feste, aber auch im Rahmen der Grammatik + flexible, wiederkehrende Einheiten, die zumeist semantisch relativ transparent sind, + aber auch anhand der etablierten Kookkurrenz zusätzliche Bedeutung tragen können. + Jedenfalls sind Kollokationen aber derart etabliert, dass sie im Sprachgebrauch als + Einheiten empfunden werden und entsprechend funktional sind. Ein Verstoß gegen die + Verwendung der etablierten Wortkombinationen wird unter Umständen verstanden, aber + auch als den Konventionen widersprechend erkannt.</p> + <p>Eine der zentralen Herausforderungen der Identifikation von Kollokationen in Korpora + liegt nun darin, dass sie einerseits relativ fest etablierte, wiederkehrende + Verbindungen aus zwei oder mehr Konstituenten darstellen, dass diese Konstituenten + aber erstens, wie oben ausgeführt, den im Rahmen der Grammatik gestatteten + Permutationen ihrer relativen Reihenfolge und Formenbildung unterliegen (z. B. <term type="figure">ein + Verbrechen begehen</term> und <term type="figure">Verbrechen werden begangen</term>), und dass die Konstituenten von + Kollokationen im Gegensatz zu n-Grammen nicht notwendigerweise konsekutiv + aufeinanderfolgen. Weiterhin wird in den meisten Definitionen des Phänomens die + Kookkurrenz innerhalb der Satzgrenzen, entweder innerhalb von Phrasen (z. B. in der + Nominalphrase <term type="figure">blondes Haar</term>) oder über Phrasengrenzen hinweg zwischen + Satzkonstituenten definiert (z. B. die Kollokation aus dem Prädikats-Verb und einem + Substantiv als Kopf der Nominalphrase in Objektposition, <term type="figure">X + begeht ein Verbrechen</term>). Die Identifikation von Kollokationen fußt so auf + der Tokeniserung der lexikalischen Ebene, also der Identifikation von Lexemen des + untersuchten Korpus, und wird begrenzt durch die Satztokenisierung als äußerer Grenze. + Kollokationen reichen in den meisten Definitionen nicht über die Satzgrenze + hinaus,<note type="footnote"> Vgl. jedoch die abweichende Definition von <ref type="bibliography" target="#halliday_cohesion_1976">Halliday / + Hasan 1976</ref>, S. 284–286.</note> wiewohl Konstituenten selbstverständlich im + Folgesatz erneut aufgegriffen werden können. Es ist bei der Identifikation von + Kollokationen in Korpora authentischer Sprache also einerseits, wie bei vielen + Analysen, die Tokenisierung Grundvoraussetzung. Andererseits ist auf Grundlage der + Tokenisierung im Korpus der Gegenstand trotzdem nicht sicher erfassbar, weil eben die + Konstituenten von Kollokationen nicht notwendigerweise konsekutiv aufeinander folgen. + Kollokationen müssen also innerhalb eines definierten Kontexts (oder Fensters) als an + der sprachlichen Oberfläche zunächst scheinbar unverbundene – und für uninformierte + Sprachteilnehmer:innen nicht unmittelbar erkennbare – Einheiten durch statistische + Verfahren ermittelt werden.</p> + <p>Umfang und Qualität der Korpusdaten und hier vor allem der Segmentierung als Teil der + linguistischen Vorverarbeitung sind von entscheidender Bedeutung für die + Identifikation von Kollokationen, da korrekt identifizierte Tokens und Satzgrenzen + die Einhaltung der Parameter, die Identifikation der Konstituenten und damit auch von + Kollokationen beeinflussen. Gerade in sehr großen Korpora, deren Vorverarbeitung + aufgrund des Datenumfangs nicht manuell qualitätsgesichert werden kann und wird, + verbleiben häufig Artefakte der Digitalisierung, unverbundene Zeichen etc., die die + Vorverarbeitung erschweren und damit auch die Qualität der Kollokationsextraktion + negativ beeinflussen. So konnte in der erwähnten Studie von Sabine Bartsch und Stefan Evert<note + type="footnote"> Vgl. <ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> gezeigt werden, dass bei der + Extraktion von Kollokationen entgegen quantitativer Vorannahmen, die große Korpora + als zentrale Grundlage für die Kollokationsforschung annehmen, das Kriterium der + Korpusgröße immer auch gegen die Korpusqualität abgewogen werden muss und dass + kleinere, aber sehr sauber vorverarbeitete Korpora durchaus bessere + Extraktionsergebnisse liefern können als sehr große Korpora, die aufgrund ihrer Größe + unter Umständen weniger saubere Daten enthalten. </p> + <p>Bei der Kollokationsextraktion kommt darüber hinaus eine zweite Ebene der + Segmentierung zusätzlich zur im Rahmen des <term type="dh">Pre-Processings</term> + erfolgten Tokenisierung zum Einsatz, durch die der Suchraum, innerhalb dessen + Konstituenten von Kollokationen erwartbar auftreten, eingegrenzt und für die + Statistik beherrschbar wird, indem das Rauschen in + den Daten reduziert und damit die Sicherheit der Identifikation relevanter + Kollokationen erhöht wird. Die hier vorgenommene Segmentierung ist eine heuristische, + sie modelliert und grenzt den potenziellen Suchraum ein, ohne dabei das gesuchte + Phänomen direkt auszuwählen. Sie nähert sich sozusagen dem gesuchten Phänomen durch + Begrenzung des Suchraumes an, ohne direkt Kollokationskandidaten zu adressieren. In + extensiven Untersuchungen konnte gezeigt werden, dass die Parameter für die + Begrenzung des Suchraums sowohl Einfluss auf die Menge der identifizierten + Kollokationskandidaten (<term type="dh">Recall</term>), also auch auf die der + tatsächlich relevanten Kollokationskandidaten (<term type="dh">Precision</term>) + haben, die in Tests als tatsächliche Kollokationen identifiziert werden konnten. Das + Verhältnis zwischen Precision und Recall gibt schließlich Aufschluss über + die Güte der Extraktion im Sinne des Umfangs der mit einer gewissen Konfidenz (im + nichttechnischen Sinne) identifizierbaren Ergebnismenge.</p> + <p>Die von Evert und Bartsch<note type="footnote"><ref type="bibliography" target="#bartsch_notion_2014">Bartsch / Evert 2014</ref>.</note> getesteten Parameter-Settings für den Suchraum + umfassen neben den etablierten wort-basierten Suchfenstern<note type="footnote"> Vgl. + <ref type="bibliography" target="#sinclair_corpus_1991">Sinclair 1991</ref>.</note> 3:3, 5:5 und 10:10 Wörter als je linker und rechter Kontext + auch die Satzgrenze, also den kompletten Satz als delimitierenden Kontext. Weiterhin + werden einer z. B. von Bartsch (2004) vorgeschlagenen Definition folgend und über die + Firth’sche Definition hinausgehend Kollokationskandidaten auf der Grundlage einer + direkten syntaktischen Relation zwischen den Konstituenten extrahiert.<note + type="footnote"> Vgl. <ref type="bibliography" target="#bartsch_properties_2004">Bartsch 2004</ref>, S. 76.</note> Dies erfordert wiederum eine + weitere Segmentierung und Annotation im Sinne der Identifikation syntaktischer + Einheiten und Relationen. Es kann so unter anderem der Einfluss unterschiedlicher + Parametersettings für den Suchraum systematisch evaluiert werden, zum anderen kann + aufgezeigt werden, dass unter Hinzuziehung unterschiedlicher linguistischer + Parameter, wie zum Beispiel Lemmatisierung, lexiko-grammatischer + Wortartenklassifikation und grammatischer Dependenz, die Ergebnisse der + Kollokationsextraktion beeinflusst und die Ergebnismengen verändert und verbessert + werden können. </p> + <p>Anhand dieses Beispiels konnte gezeigt werden, dass Segmentierungsentscheidungen zum + einen als Teil des linguistischen Pre-Processings Einfluss auf die Qualität + linguistischer Analysen haben, indem sie den Zugriff auf lexikalische Einheiten als + Konstituenten von Kollokationen ermöglichen. Zum anderen ist eine Segmentierung im + Sinne der Auswahl begrenzter Suchräume innerhalb der Korpusdaten elementarer + Bestandteil von linguistischen und statistischen Verfahren zur Identifikation von + Kollokationskandidaten. So werden auf der Grundlage wortbasierter Suchfenster (3–5 + Wörter als linker und rechter Kontext eines Suchwortes) oder grammatisch definierter + Segmente, wie Sätze oder Konstituenten in direkter syntaktischer Relation, + Kollokationskandidaten anhand statistischer Maße für die Bedeutung des gemeinsamen + Auftretens ermittelt.</p> + </div> + <div type="subchapter"> + <head>3.3 Analyse heuristischer Textpraktiken </head> + <p>An der Diskussion von Mehrworteinheiten ist schon deutlich geworden, dass sprachliche + Segmente nur funktional zu bestimmen sind: Es gehört zusammen, was gemeinsam eine + Funktion in der Kommunikation übernimmt. Während Mehrworteinheiten funktional auf den + Satz bezogen sind, konstituiert sich die Einheit des Satzes dadurch, dass mit ihr + sprachliche Praktiken vollzogen werden. Bei deren Analyse wiederum ist das + Zusammenspiel von Handlungsinterpretation, kategorialer Subsumption und struktureller + Segmentierung entscheidend. Was das bedeutet, soll im Folgenden anhand von + Segmentierungsfragen beim Erstellen eines Tagsets zur Analyse heuristischer + Textpraktiken erläutert werden. Unter ›heuristischen Textpraktiken‹ verstehen wir + Formulierungsverfahren, mit denen in institutionell verankerten Routinen neues Wissen + generiert und an vorhandenes Wissen angeschlossen wird, z. B. ›die Relevanz eines + Forschungsthemas markieren‹, ›einen Begriff definieren‹ oder ›eine Aussage + argumentativ stützen‹. Dabei interessiert uns, wie solche Formulierungsverfahren in + Dissertationen verschiedener wissenschaftlicher Disziplinen zum Einsatz kommen, an + welcher Stelle im Text sie verwendet werden, wie sie miteinander kombiniert werden, + welche Textfunktion sie haben und was man aus all dem über die epistemischen + Praktiken der jeweiligen Disziplin lernen kann. Dieser Forschungsansatz ist + ausführlich in einer Pilotstudie dokumentiert.<note type="footnote"> Vgl. <ref type="bibliography" target="#bender_textpraktiken_2020">Bender / + Müller 2020</ref>.</note> Darin wurde in einem abduktiven Verfahren ein Tagset + entwickelt und ein Pilotkorpus von 65 Einleitungen zu Dissertationen aus den 13 an + der Technischen Universität Darmstadt vertretenen Fachbereichen händisch kollaborativ + annotiert. Es ergeben sich als übergeordnete Textpraktiken die expositorischen + Verfahren der Relevanzmarkierung, der Zielsetzung und der Thesenstellung sowie + Praktiken der Definition und der Stützung von Assertionen. Dazu gibt es jeweils + Subkategorien (vgl. <ref type="graphic" target="#segment_001">Abbildung + 1</ref>).<note type="footnote"> Ausführlich in <ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>, S. + 22–24.</note> + </p> + <figure> + <graphic xml:id="segment_001" url="Medien/segment_001.png"> + <desc> + <ref type="graphic" target="#abb1">Abb. 1</ref>: Das taxonomische Annotationsschema HeuTex. + [<ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>, + S. 23]<ref type="graphic" target="#segment_001"/> + </desc> + </graphic> + </figure> + <p>Wie bei allen pragmatischen Untersuchungen in der Linguistik handelt es sich dabei um + ein x-als-y-Verfahren: Da Formulierungsverfahren nicht sinnvoll in actu beobachtet + werden können (zumindest nicht großflächig), gilt es, die Textsegmente zu ermitteln, + mit denen eine bestimmte Textpraktik vollzogen wurde. Nun kann zum Beispiel die + Praktik des Argumentierens – je nach Argumentationsbegriff – mit einem Wort, einem + Satz oder einer Buchreihe vollzogen werden. Würde man aber ad hoc für jede + sprachliche Praktik das Textsegment festlegen, mit dem sie vollzogen wird, könnte man + die Segmente nicht miteinander vergleichen, zumindest eine quantitative Auswertung + wäre unmöglich. Daher haben wir Annotations-Kategorien grundsätzlich der Einheit + ›Satz‹ zugewiesen. Das ist auch die Basiskategorie der linguistischen Pragmatik: + Sprachliche Handlungen werden typischerweise mit Sätzen vollzogen. Da andererseits + Textpraktiken, wie man sich am Argumentieren gut verdeutlichen kann, oft über die + Satzgrenze hinausreichen, ist bei der Analyse mit ›Zonen‹ aufeinanderfolgender + diskreter heuristischer Textpraktiken zu rechnen. </p> + <p>Die Festlegung einer linguistischen Einheit zur Segmentierung war auch aus einem + anderen Grund wichtig: Das Projekt zielt darauf ab, heuristische Textpraktiken + automatisch zu klassifizieren. Hierzu liegen vielversprechende Ergebnisse einer + Pilotstudie vor, in der wir eine <term type="dh">Deep-Learning</term><hi rend="italic">-</hi>Architektur, genauer: ein <term type="dh">Recurrent Neural + Network</term> (RNN), zur Klassifikation auf der Basis unseres Tagsets (vgl. <ref + type="graphic" target="#segment_001">Abbildung 1</ref>) verwendet haben.<note + type="footnote"> Vgl. <ref type="bibliography" target="#becker_heuristic_2020">Becker et al. 2020</ref>.</note> Wir konnten feststellen, dass + unser Modell auf allen Annotationsebenen recht gut funktioniert und Genauigkeitswerte + von bis zu 93 % (Level 0) erreicht. Auf Level 0 ist die Basisebene der + Kategorisierung angesiedelt, die Levels 1 und 2 sind jeweils Unterkategorien. Wir + sehen auch ein ausgewogenes Verhältnis zwischen <term type="dh">Precision-</term> und <term type="dh">Recall-Scores</term> auf + allen Ebenen, mit dem größten Unterschied auf Level 0, wo der <term type="dh" + >Recall</term> 8 Prozentpunkte über dem <term type="dh">Precision-Score</term> + liegt, was darauf hindeutet, dass das Modell hier (etwas) besser darin ist, alle + relevanten Instanzen jedes Labels innerhalb unseres Datensatzes zu finden, als + korrekte Vorhersagen der Labels für die Instanzen zu machen. Um diese Ergebnisse zu + interpretieren, muss die <term type="dh">Majority Baseline</term> – d. h. die Menge + der häufigsten Instanzen innerhalb des Datensatzes – berücksichtigt werden. Wir haben + die Majority Baseline auf allen drei Ebenen übertroffen, wobei die auffälligste + Verbesserung auf Ebene 2 zu verzeichnen war (vgl. <ref type="intern" target="#tab03">Tabelle 3</ref>). Da es sich um eine komplexe + Klassifikationsaufgabe auf der Basis eines extrem kleinen Trainingsdatensatzes (2.689 + Sätze) handelt, haben sich Tagset und Segmentierungspraxis als robust erwiesen.</p> + <table> + <row> + <cell/> + <cell> + <hi rend="bold">Level 0</hi> + </cell> + <cell> + <hi rend="bold">Level 1</hi> + </cell> + <cell> + <hi rend="bold">Level 2</hi> + </cell> + </row> + <row> + <cell>Numb. of Labels</cell> + <cell> + <hi rend="bold">5</hi> + </cell> + <cell> + <hi rend="bold">11</hi> + </cell> + <cell> + <hi rend="bold">2</hi> + </cell> + </row> + <row> + <cell> + <hi rend="bold">Accuracy</hi> + </cell> + <cell> + <hi rend="bold">0.8302</hi> + </cell> + <cell> + <hi rend="bold">0.7548</hi> + </cell> + <cell> + <hi rend="bold">0.9292</hi> + </cell> + </row> + <row> + <cell> + <hi rend="bold">F1</hi> + </cell> + <cell>0.8071</cell> + <cell>0.7546</cell> + <cell>0.9291</cell> + </row> + <row> + <cell> + <hi rend="bold">Precision</hi> + </cell> + <cell>0.7661</cell> + <cell>0.7541</cell> + <cell>0.9309</cell> + </row> + <row> + <cell> + <hi rend="bold">Recall</hi> + </cell> + <cell>0.8537</cell> + <cell>0.7549</cell> + <cell>0.9295</cell> + </row> + <row> + <cell> + <hi rend="bold">Majority Baseline</hi> + </cell> + <cell> + <hi rend="bold">0.7164 </hi>(Relevanzmarkierung)</cell> + <cell> + <hi rend="bold">0.6219 </hi>(Sachbeschreibung)</cell> + <cell> + + <hi rend="bold">0.6023</hi><lb/> + (gerichtet)<lb/> + </cell> + </row> + <trailer xml:id="tab03"> + <ref type="intern" target="#tab3">Tab. 3</ref>: Ergebnis der RNN-Klassifizierung auf verschiedenen Ebenen. [Aus: + <ref type="bibliography" target="#becker_heuristic_2020">Becker et al. 2020</ref>]<ref type="graphic" target="#segment_t3"/> + </trailer> + </table> + + <p>Nun mag man annehmen, die Satzsegmentierung sei ein mechanischer Schritt des + Pre-Processings ohne weitere semantische Implikationen. Hier soll aber an zwei Fällen + demonstriert werden, dass die Segmentierungsentscheidung unmittelbaren Einfluss auf + kategoriale Zuweisungen hat, und zwar weil sie die Tiefe des hermeneutischen Zugriffs + delimitiert, die wiederum die Kategorisierung bestimmt. Unsere Segmentierung ist + grundsätzlich der syntaktisch autonome Satz (<term type="dh">Sentence</term>), da untergeordnete Teilsätze + funktional dem Matrixsatz beigeordnet sind und daher auch keine eigenständige + Texthandlung repräsentieren. Wird zum Beispiel der folgende Teilsatz (<term type="dh" + >Clause</term>) als Segment der Kategorisierungsentscheidung zugrundegelegt (a) + und kategorisiert man flach, d. h. ohne Einbeziehung von Kontextwissen, dann ist ein + assertiver Sprechakt, in unserem Schema eine Relevanzmarkierung durch + Sachbeschreibung, zu kategorisieren. Ist das Segment aber der Satz im Sinne von + <term type="dh">Sentence</term>, in diesem Fall also ein Satzgefüge, dann ergibt sich eine Argumentation + (b). + <list type="unordered"> + <item>a) <term type="figure">Ihr Lebenslauf ist für die bürgerlichen Frauen ihrer Epoche keineswegs + exemplarisch</term><note type="footnote"> Vgl. <ref type="bibliography" target="#siegel_hang_2002">Siegel 2002</ref>, S. 241.</note></item> + <item>b) <term type="figure">Ihr Lebenslauf ist für die bürgerlichen Frauen ihrer Epoche keineswegs + exemplarisch, denn diese wurden weiterhin als Hausfrauen und Mütter definiert.</term><note + type="footnote"> Vgl. <ref type="bibliography" target="#siegel_hang_2002">Siegel 2002</ref>, S. 241.</note> + </item></list></p> + <p>Ein etwas anders gelagerter Fall findet sich in den Beispielen (c) und (d). + Betrachtet man Satz (c) isoliert und ohne Kontextwissen einzubeziehen, dann wäre er + als deontisch modalisierte Proposition zu interpretieren und pragmatisch als + direktiver Sprechakt einzuordnen, konkret als Handlungsempfehlung. Berücksichtigt man + aber den unmittelbaren Textzusammenhang (d), linguistisch gesprochen: den <term + type="dh">Kotext</term>, dann ergibt sich nach unserem Kategorienschema die + heuristische Textpraktik einer Zielsetzung. + <list type="unordered"> + <item>c) <term type="figure">Die Arbeit soll in diesen [sic] Zusammenhang Aspekte darstellen, die bei der + Erstellung eines solchen Verfahrens grundsätzlich zu beachten sind, und Wege + aufzeigen, wie diese im konkreten Anwendungsfall zu einem anwendungsfähigen Verfahren + konkretisiert werden können.</term><note type="footnote"> Vgl. <ref type="bibliography" target="#dieleman_hinweise_2016">Dieleman 2016</ref>, S. 3.</note> + </item> + <item>d) <term type="figure">1.2 Zielsetzung der Arbeit. Ziel der Arbeit ist die Erarbeitung von + allgemeingültigen Hinweisen für die Entwicklung von Entscheidungsverfahren, [...].</term> <hi + rend="super">→</hi><hi rend="sub">i</hi> <term type="figure">Die Arbeit soll in diesen [sic] Zusammenhang Aspekte + darstellen, die bei der Erstellung eines solchen Verfahrens grundsätzlich zu beachten + sind,<hi rend="sub">i</hi> <hi rend="sub">ii</hi> und Wege aufzeigen, wie diese im konkreten Anwendungsfall zu einem + anwendungsfähigen Verfahren konkretisiert werden können.</term><hi rend="sub">ii</hi><hi rend="super">â†</hi> + <note type="footnote"> Vgl. <ref type="bibliography" target="#dieleman_hinweise_2016">Dieleman 2016</ref>, S. 3.</note> + </item></list></p> + <p>An dem Beispiel sieht man, dass das Segment ›Satz‹ auch im konkretisierten Sinne + keineswegs eindeutig ist. Das Automatisierungsvorhaben unseres Projektes bringt es + mit sich, dass Sätze formal im Sinne von ›mit satzabschließendem + Interpunktionszeichen abgeschlossene Einheit‹ bestimmt sein müssen. Im entscheidenden + Satz der Beispiele (c) und (d) sind aber zwei Satzgefüge miteinander koordiniert, die + textpragmatisch nach unserem Schema jeweils unterschiedlich zu kategorisieren wären, + nämlich als deskriptive Zielsetzung (Teilsatz i) bzw. als konstruktive Zielsetzung + (Teilsatz ii). In unserem Ansatz muss nun aber eine Kategorisierungsentscheidung + getroffen und das Satzgefüge damit als pragmatisch subordinativ interpretiert werden: + in diesem Fall als deskriptive Zielsetzung.</p> + <figure> + <graphic xml:id="segment_002" url="Medien/segment_002.png"> + <desc> + <ref type="graphic" target="#abb2">Abb. 2</ref>: Dimensionen der Segmentierung. [Eigene Darstellung]<ref type="graphic" target="#segment_002"/> + </desc> + </graphic> + </figure> + <p>Segmentierung ist also keineswegs eine rein formale Angelegenheit, sondern muss immer + als hermeneutische Praktik gedacht werden, in der drei Teilprozesse untrennbar + ineinandergreifen und aufeinander bezogen sind (vgl. <ref type="graphic" + target="#segment_002">Abbildung 2</ref>): das Ausschneiden eines Segments aus + dem Textkontinuum (<term type="dh">Zoning</term>), die Zuweisung des Segments zu + einer analytischen Kategorie (<term type="dh">Subsumption</term>) und die Festlegung + der Tiefe des gedanklichen Zugriffs auf der Basis von mehr oder weniger + Kontextinformation (<term type="dh">Interpretation</term>). An den hier diskutierten + Beispielen heuristischer Textpraktiken konnten wir zeigen, dass diese drei + Teilprozesse bei jeder Segmentierungsentscheidung eine zentrale Rolle spielen und + dementsprechend zu reflektieren sind.</p> + </div> + <div type="subchapter"> + <head>3.4 Die Sequenzierbarkeit der Novelle</head> + <p>Dass Segmentierung heute in der Literaturwissenschaft systematisch unterreflektiert + erscheint, erstaunt nicht nur wegen ihrer großen Bedeutung bei der + Operationalisierung von Textanalysen. Es erstaunt auch historisch im Hinblick auf + alle generischen Ansätze in der Gattungspoetik, die seit dem 19. Jahrhundert zum + festen Bestandteil der Literaturtheorie gehören. Vor allem bei den an der Schwelle + zur Moderne viel theoretisierten Prosagattungen Märchen und Novelle hat die + Segmentierbarkeit definitorischen Charakter. Vladimir Propps legendäre <bibl> + <title type="desc">Morphologie des Märchens</title> + </bibl> leitet aus der Analyse eines einschlägigen Korpus ein festes Set von + Handlungssequenzen ab, aus dem sich jedes Märchen (re)produzieren lassen soll.<note + type="footnote"> Vgl. <ref type="bibliography" target="#propp_morphologie_1975">Propp 1975</ref>.</note> Dieser Ansatz hat heute in der + Filmbranche wieder Konjunktur, um Plots automatisch herzustellen.<note + type="footnote"> Vgl. <ref type="bibliography" target="#batty_slugune_2014">Batty 2014</ref>.</note> Während Formalismus und früher + Strukturalismus die generische Funktion von Segmenten und Sequenzen vor allem + texttheoretisch ausgebeutet haben,<note type="footnote"> Vgl. etwa <ref type="bibliography" target="#barthes_sequences_1971">Barthes + 1971</ref>.</note> sind die früheren Versuche im Zeichen des literarischen Realismus + für die aktuelle Forschung besonders wertvoll, weil sie noch stark auf + Operationalisierungen in einem hermeneutischen Rahmen ausgelegt sind. Textmerkmale + werden dabei nicht isoliert, sondern rezeptionsästhetisch im Hinblick auf ihre + kognitive Wirkung beim Lesen betrachtet, was Wolfgang Iser später als das Zusammenwirken von + Text- und Aktstruktur bezeichnet hat.<note type="footnote"> Vgl. <ref type="bibliography" target="#iser_akt_1976">Iser 1976</ref>, S. + 101–102.</note> + </p> + <p>Im <ref target="https://www.linglit.tu-darmstadt.de/institutlinglit/mitarbeitende/weitin/litla">Darmstädter LitLab</ref> sind schon seit einiger Zeit verschiedene korpusbasierte + Untersuchungen zu Novellen des 19. Jahrhunderts durchgeführt worden. Im + Sommersemester 2019 wurde erstmals eine empirische Wirkungsstudie durchgeführt, um + das gattungspoetisch bedeutsame Kriterium der Sequenzierbarkeit zu testen. + Theoretische Grundlage dafür war neben Propp die realistische Gattungspoetik, die + Paul Heyse in der Einleitung zum <bibl> + <title type="desc">Deutschen Novellenschatz</title> + </bibl> 1871 formuliert hat. Sie geht davon aus, dass die zeitgenössische + Hochkonjunktur der Novelle mit der im literarischen Massenmarkt unvermeidlichen + Auseinandersetzung um die knappe Ressource Aufmerksamkeit erklärt werden kann und die + daraus resultierenden Eigenschaften zugleich das zentrale Merkmal darstellen, das + Novellen von anderen Erzähltexten unterscheidet. Eine Novelle zeichnet sich demnach + dadurch aus, dass sie ein handlungsleitendes ›Grundmotiv‹ besitzt, das Leser:innen in + die Lage versetzt, <quote>den Inhalt in wenige Zeilen zusammenzufassen</quote>. Heyse + fordert dazu auf, die <quote>Probe« zu machen, »ob der Versuch gelingt</quote>.<note + type="footnote"> Vgl. <ref type="bibliography" target="#heyse_einleitung_1871">Heyse / Kurz 1871</ref>, S. XIX.</note> + </p> + <p>Bei unserem Test kam es uns darauf an, von den insgesamt 86 Novellen der Anthologie + eine auszuwählen, die der Einschätzung der historischen Herausgeber nach ihre + Novellen-Definition gut erfüllt (den Einleitungen zufolge gab es bei der Aufnahme von + Texten zum Teil auch andere Rücksichten) und zugleich unter pragmatischen + Gesichtspunkten für ein Leseexperiment geeignet ist, vor allem was die Textlänge + angeht. Die Wahl fiel auf Hieronymus Lorms <bibl> + <title type="desc">Ein adeliges Fräulein</title> + </bibl> (1867). Der Text hat ein klares Grundmotiv, das wie in den meisten Fällen als + Dingsymbol angelegt ist. Auf der Suche nach einem bestimmten Gemälde trifft ein + Kunstexperte auf die Besitzerin (Rahmenhandlung), die ihm die Geschichte des Bildes + erzählt (Binnenhandlung). Es stammt aus dem Geschenkfundus einer gescheiterten + Brautwerbung. Der Vater der adligen Titelheldin hatte sie einem vermögenden + Bürgerlichen versprochen, fühlt sich daran jedoch nicht mehr gebunden, als ein + adliger Mitbewerber auftaucht. Nachdem dieser sich jedoch als mittellos entpuppt, + will der Vater die ursprünglich angebahnte Ehe schließen. Obwohl das ihren + aufrichtigen Gefühlen entspricht, weigert sich die Tochter des gebrochenen + Versprechens wegen.</p> + <p>Unser Experiment wurde am 20. Mai 2019 in einem Hörsaal der Technischen Universität + Darmstadt mit 85 Proband:innen durchgeführt, die dafür eine Aufwandsentschädigung von + 10 Euro erhielten. Den Teilnehmenden wurde neben einem Ausdruck der Novelle ein + Fragebogen mit fünf Rubriken vorgelegt. An Metadaten wurden neben Alter, Geschlecht + und Muttersprache die Lesehäufigkeit im Alltag und die Art der gelesenen Texte + erhoben (Nachrichten, Sachbücher, Literatur, Social Media). Außerdem wurde gefragt, + ob die Novelle vorab bekannt war. Im zweiten Schritt wurde darum gebeten, den Text + aufmerksam durchzulesen. Die drei restlichen Aufgaben wurden nach der Lektüre + absolviert. Wir fragten zunächst, was vom Inhalt des Textes als Erstes in den Sinn + kommt, dann baten wir, das Geschehen in ganzen Sätzen zusammenzufassen, wozu + unnummerierte Zeilenkästen vorgegeben wurden. Schließlich fragten wir nach der + wesentlichen Textaussage.</p> + <p>Bei der Studie, die aus dem Experiment hervorgehen soll, arbeiten wir mit der + Arbeitsgruppe ›Soziale Netzwerke‹ von Ulrik Brandes an der ETH Zürich zusammen.<note + type="footnote"> Autor:innen der Studie: Thomas Weitin, Katharina Herget, + Anastasia Glawion, Simon Päpcke, Ulrik Brandes.</note> Ziel der Studie ist es, + herauszufinden, ob sich die als Gattungsmerkmal postulierte leichte + Zusammenfassbarkeit der Novelle empirisch nachweisen lässt. Eine starke + Übereinstimmung in den Zusammenfassungen der Teilnehmenden unseres Experiments wäre + ein Beleg dafür. Grundlage der Auswertung sind die Transkriptionen der Fragebögen, + die die Studierenden des Seminars ›Empirische Textanalysen‹ im Sommersemester 2019 an + der Technischen Universität Darmstadt angefertigt haben. Da sich die Proband:innen + bei ihren Zusammenfassungen weniger klar an die von uns vorgegebenen Zeilenkästen + gehalten haben als erhofft, haben wir für die Auswertung jeden einzelnen Satz als + Segment aufgefasst. Im Pre-Processing wurden die Stoppwörter entfernt und mit Hilfe + der Levenshtein-Distanz<note type="footnote"> <ref type="bibliography" target="#levenshtein_codes_1966">Levenshtein 1966 [1965]</ref>.</note> + automatische Vereinheitlichungen vorgenommen (z. B. ›adelig‹ – ›adlig‹). Die Auswertung + der Daten dauert derzeit noch an. In den bisherigen Berechnungen wurde für die + Wortebene eines jeden Segments der <term type="dh">term frequency - inverse document + frequency</term> (tf-idf)-Score ermittelt, um zu bestimmen, wie charakteristisch + es sich im Korpus sämtlicher Segmente ausnimmt. Auf der Basis dieser Formalisierung + kann die Distanz zu einer von uns selbst stammenden Muster-Zusammenfassung berechnet + werden. Ein erstes <term type="dh">Clustering</term> der Ergebnisse schien unter + Berücksichtigung unserer Metadaten die Tendenz zu zeigen, dass im Subset derjenigen + Proband:innen, die häufig lesen, eine größere Übereinstimmung herrscht als im Subset + der deutschen Muttersprachler:innen. Allerdings sind bei der Auswertung eine Reihe + von Schwierigkeiten aufgetaucht, die wir erst bewältigen müssen, bevor wir solchen + Ergebnissen Erklärungslasten aufbürden. Im Vergleich des <term type="dh" + >Goldstandards</term> unserer eigenen Muster-Zusammenfassung und den + Zusammenfassungen der Fragebögen fiel uns auf, dass die Teilnehmenden vor allem + Schwierigkeiten hatten, das Verhältnis von Rahmen- und Binnenhandlung in die + verlangte Folge von ganzen Sätzen einzugliedern. Wir haben daher die Studierenden des + Seminars ›Empirische Textanalysen‹ gebeten, aus den Satzfolgen der Fragebögen eine + weitere Muster-Zusammenfassung zu erstellen. Wir wollen auf dieser Basis unsere + bisherigen Ergebnisse und den Ansatz des Experiments kritisch hinterfragen.</p> + </div> + <div type="subchapter"> + <head>3.5 Inter-Annotator-Agreement-Parameter als Heuristik für die Segmentierung + literarischer Texte</head> + <p>Als letztes Beispiel wird ein Segmentierungsproblem vorgestellt, das in einem + weiteren Projekt aus dem Bereich der <term type="dh">Computational Literary + Studies</term> offensichtlich wurde. Dieses Projekt ist genauso wie der oben + vorgestellte Zugang zur Sequenzierung datengetrieben, hat aber im Unterschied dazu + eine automatisierte Textanalyse zum Ziel, die auf in der Computerlinguistik bzw. der + automatischen Sprachverarbeitung etablierten Verfahren zur Automatisierung basiert. + Ziel des noch laufenden Projektes ist die Automatisierung der Erkennung szenenhafter + Passagen in Prosatexten.<note type="footnote"> Vgl. dazu <ref type="bibliography" target="#gius_detection_2019">Gius et al. 2019</ref>; <ref type="bibliography" target="#zehe_scenes_2021">Zehe et + al. 2021</ref>.</note> Als szenenhaft werden dabei jene Abschnitte erzählender Texte + verstanden, in denen die Figurenkonstellation und der Raum der Erzählung weitgehend + unverändert sind und die Geschehnisse chronologisch, zusammenhängend und weitgehend + zeitdeckend erzählt werden.<note type="footnote"> Szene wird dabei verstanden als + <quote>segment of the discours (presentation) of a narrative which presents a + part of the histoire (chronologically ordered, causally connected events in the + narrated world) in such a way that a) time is more or less equal in discours + and histoire, b) place stays – more or less – the same c) it centers around a + particular action, and d) the character configuration is – again: more or less + – equal</quote> (<ref type="bibliography" target="#gius_detection_2019">Gius et al. 2019</ref>, Abs. 3). Für eine weitere Diskussion und + Beispiele vgl. <ref type="bibliography" target="#zehe_scenes_2021">Zehe et al. 2021</ref>.</note> Textgrundlage sind sogenannte Heftromane, + die in ihrer Struktur weniger komplex sind als Höhenkammliteratur und insbesondere + weniger Varianz aufweisen. Im skizzierten Projekt ist das Auffinden der Szenen zwar + das Ziel, allerdings sind diese Szenen als Vorverarbeitungsschritt für eine Reihe + zukünftiger computationeller Analysen angelegt. Die automatisierte Annotation + szenenhafter Passagen stellt nämlich eine für literaturwissenschaftliche + computationelle Textanalysen geeignete Segmentierung literarischer Texte zur + Verfügung.</p> + <p>Im ›Szenen-Projekt‹ wird ein für viele Analyseansätze in den Computational Literary + Studies typischer Zugang umgesetzt: Als <term type="dh">Input</term> für die + Automatisierung der Analyse literarischer Texte werden sogenannte <term type="dh" + >Golddaten</term> bzw. ein sogenannter Goldstandard erstellt. Dafür annotieren + mehrere Annotator:innen anhand von Annotationsrichtlinien dieselben Texte. Auf Basis + der so erstellten Daten – also der Texte und ihrer Annotationen – wird dann an der + Automatisierung der Erkennung der annotierten Phänomene gearbeitet. Diese Praxis ist + für die ansonsten mit exemplarischen Textstellen in Definitionen und Analysen + arbeitende Literaturwissenschaft ungewöhnlich. In der literaturwissenschaftlichen + Textanalyse werden traditionell nur einzelne Textstellen genutzt – um sie als + besonders typische Textpassagen zu analysieren oder um die Definition von Phänomenen + an ihnen zu veranschaulichen. Dahinter steht zumindest implizit eine behauptete + Exemplarität und damit Repräsentativität der ausgewählten Beispiele.</p> + <p>Während in der Literaturwissenschaft also die Repräsentativität durch die + Feststellung von Expert:innen gewährleistet wird, nähert man sich in + Automatisierungszugängen einer Repräsentativität an, indem man mit einer großen + Anzahl an Beispielen arbeitet und außerdem Annotationen mehrfach anfertigt, welche + anschließend in eine konsolidierte Annotation im Sinne des Goldstandards überführt + werden. Im computationellen Zugang ist die Repräsentativität der genutzten + Textstellen fundamental, da aus diesen Textstellen zum Teil unüberwacht gelernt wird + und entsprechend nach der Annotation keine weiteren menschlichen Analysen in den + Prozess mit einfließen. Der literaturwissenschaftliche Umgang mit Beispielen und der + Zugang zu Annotationen im Bereich der computationellen Literaturwissenschaft + unterscheiden sich damit recht deutlich. Will man jedoch sicherstellen, dass ein + Annotationsverfahren im Kontext von Automatisierungsaufgaben auch + literaturwissenschaftlich adäquat ist, so muss man sich fragen, inwiefern ein + Goldstandard auch eine literaturwissenschaftlich gute Textanalyse abbildet bzw. + abbilden kann. </p> + <p>Eine naheliegende Begründung der Adäquatheit ist, dass in den Annotationen, die zur + Erstellung des Goldstandards genutzt werden, intersubjektiv gültige Analysen der + entsprechenden Textpassagen abgebildet werden. In der Literaturwissenschaft wird + nämlich Intersubjektivität, also die Übereinstimmung mehrerer Subjekte in Bezug auf + Urteile über literarische Texte, als geeignete Alternative zu einer – als nicht + vorhanden bzw. zugänglich angenommenen – Realität oder objektiven Wahrheit + betrachtet. Um wissenschaftlich zu sein, müssen literaturwissenschaftliche Befunde + demnach eine <quote>prinzipielle intersubjektive Vermittelbarkeit – einen <hi + rend="italic">›sensus communis‹</hi> [als von Kant für Geschmacksurteile + angenommene Basis]</quote> aufweisen.<note type="footnote"> Vgl. + <ref type="bibliography" target="#stoeckmann_aesthetik_2013">Stöckmann 2013</ref>, + S. 475.</note> Literaturwissenschaftliche Analyse hat die Aufgabe, vorerst ohne + Wertung <quote>die Feststellung von allgemein beobachtbaren und intersubjektiv + anerkennbaren Eigenheiten bestimmter Texte zu fixieren</quote><note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>, S. 447.</note>, wobei + Ansätze wie die systemtheoretische oder die strukturalistische Literaturwissenschaft + <quote>die Möglichkeit rationaler, intersubjektiver Analysierbarkeit und + Theoriebildung auch gegenüber Objekten wie der Literatur</quote> postulieren.<note + type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. (Hg.) 1997–2003</ref>, S. 535.</note> Das bedeutet + insbesondere, dass sie <quote>prinzipiell explizierbare, rationale, intersubjektiv + diskutierbare Methodologien und Theoriebildungen für den Objektbereich der + Literaturwissenschaft</quote> anstreben.<note type="footnote"> Vgl. <ref type="bibliography" target="#fricke_reallexikon_1997">Fricke et al. + (Hg.) 1997–2003</ref>, S. 536.</note> + </p> + <p>Vor diesem Hintergrund erscheinen <term type="dh" + >Inter-Annotator-Agreement-Maße</term> (IAA-Maße), die den Grad der + Übereinstimmung zwischen Annotationen angeben, als Möglichkeit, um + Intersubjektivität zu messen. Die Tatsache, dass bei typischen Annotationsaufgaben + der Sprachverarbeitung wie etwa der <term type="dh">Part-of-Speech-Bestimmung</term> + Übereinstimmungen von über 95 % durchaus möglich sind, eine solche hohe + Übereinstimmung bei komplexeren Textphänomenen aber nicht erreicht werden kann, + spricht ebenfalls dafür, dass IAA-Maße Intersubjektivität abbilden können.</p> + <p>Nun war es aber so, dass im ›Szenen-Projekt‹ Szenengrenzen aus + literaturwissenschaftlicher Sicht erstaunlich übereinstimmend annotiert wurden, + dieser Umstand sich aber nicht in einem entsprechend hohen IAA-Maß niederschlug. + Damit scheint der angenommene Zusammenhang zwischen dem Maß der Übereinstimmung + zwischen zwei Annotator:innen und dem Grad der intersubjektiven Gültigkeit ihrer + Analysen fraglich. Dies könnte auch daran liegen, dass IAA-Maße für sehr + unterschiedliche Zwecke genutzt werden und diese nicht immer einen Bezug zu + Intersubjektivität haben – etwa wenn sie eingesetzt werden, um die Konsistenz von + Annotationen einzelner Annotator:innen zu überprüfen, die Qualität von Guidelines zu + evaluieren oder Automatisierungsverfahren zu bewerten.<note type="footnote"> Vgl. + dazu auch <ref type="bibliography" target="#gius_agreement_2022">Gius / Vauth 2022</ref>.</note> + <note type="footnote"> In der Computerlinguistik wird zum Teil auch keine + Unterscheidung zwischen Intersubjektivität und Objektivität gemacht. So wird bei + der Anwendung von IAA-Maßen für die Evaluation von Algorithmen nicht + problematisiert, dass auch ein Goldstandard keine objektive Tatsache ist, sondern + eben intersubjektiv erstellt. Pevzner und Hearst weisen zum Beispiel zwar auf das + Problem der Bestimmung von Segmentgrenzen bzw. der Referenz für die Bewertung von + Segmentierungsalgorithmen hin – <quote>human judges do not always agree where + boundaries should be placed and how fine-grained an analysis should be</quote>. + Der folgende Verweis auf eine der praktizierten Lösungen – <quote>others have + several human judges make ratings to produce a ›gold standard‹</quote> wird + dann gemacht, ohne zu thematisieren, dass diese gegebenenfalls anhand derselben + Maße gemessen wird (vgl. <ref type="bibliography" target="#pevzner_critique_2002">Pevzner / Hearst 2002</ref>, S. 2).</note> Konzentriert man + sich aber auf die Messung von Übereinstimmung verschiedener Annotator:innen, also auf + den Aspekt, der literaturwissenschaftlich als Intersubjektivität gefasst werden kann, + müssen für die Erklärung der schlechten IAA-Werte im ›Szenen-Projekt‹ die in den + IAA-Metriken abgebildeten Prinzipien betrachtet werden. IAA-Metriken beinhalten sehr + differenzierte Berechnungen, die für eine gewisse Vergleichbarkeit der berechneten + Werte sorgen sollen. Diese Berechnung im Hinblick auf Vergleichbarkeit kann man + entsprechend als eine Operationalisierung von Intersubjektivität auffassen, anhand + derer man die oben geforderte literaturwissenschaftlich adäquate Umsetzung von + Annotationsverfahren bzw. des Goldstandards erreichen könnte. Für die Wahl einer + geeigneten IAA-Metrik muss deshalb die jeweilige Operationalisierung von + Vergleichbarkeit oder Übereinstimmung der IAA-Metrik – in Form von (Nicht-)Einbezug + der erwarteten Übereinstimmung, Gewichtung der Nicht-Übereinstimmung in Abhängigkeit + der betroffenen Kategorien usw. – berücksichtigt und gegebenenfalls geeignete + Einstellungen der zur Verfügung gestellten Parameter gefunden werden.<note + type="footnote"> Für eine zusammenfassende Darstellung der gängigen + Koeffizienten-Berechnungen vgl. <ref type="bibliography" target="#artstein_agreement_2008">Artstein / Poesio 2008</ref>, S. 560–570, sowie den + aktuellen Überblick von <ref type="bibliography" target="#reiter_messverfahren_2022">Reiter / Konle 2022</ref>.</note> Im Fall des ›Szenen-Projekts‹ + hat sich bei der Beschäftigung mit der Vergleichbarkeit von IAA-Werten und + Wahrnehmung der intersubjektiven Übereinstimmung neben dem Testen verschiedener + Parametrisierungen schnell herausgestellt, dass die gewählte IAA-Metrik + berücksichtigen muss, dass es sich um eine sogenannte Segmentierungsaufgabe handelt. + Während etwa eine Part-of-Speech-Annotation auf vorausgewählten Segmenten (nämlich + Wörtern) stattfindet, müssen Annotator:innen bei Segmentannotationen wie den oben + beschriebenen Textpraktiken<note type="footnote"> Vgl. <ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>; <ref type="bibliography" target="#teufel_zoning_1999">Teufel + 1999</ref>.</note> die zu annotierende Textspanne selbst auswählen. Nutzt man für die + Evaluation der manuellen Annotationen klassische IAA-Metriken wie Fleiss’ <term + type="dh">Ï€</term>,<note type="footnote"> Vgl. <ref type="bibliography" target="#fleiss_scale_1971">Fleiss 1971</ref>.</note> Cohens <term type="dh">κ</term><note type="footnote"> Vgl. <ref type="bibliography" target="#cohen_agreement_1960">Cohen 1960</ref>.</note> oder Krippendorffs <term type="dh" + >α</term><note type="footnote">Vgl. <ref type="bibliography" target="#krippendorff_content_1980">Krippendorff 1980</ref>; <ref type="bibliography" target="#krippendorff_reliability_2004">Krippendorff 2004</ref>. </note>, so erhält man meist schlechte Werte, weil diese Metriken nicht + berücksichtigen, dass die zu annotierenden Texteinheiten nicht vorgegeben sind. + Deshalb wurden für die Annotation von Segmenten eigene Metriken entwickelt.<note + type="footnote"> Gängige IAA-Metriken für Segmentierung sind Pk (<ref type="bibliography" target="#beeferman_text_1997">Beeferman et al. + 1997</ref>), WindowDiff (<ref type="bibliography" target="#pevzner_critique_2002">Pevzner / Hearst 2002</ref>; + <ref type="bibliography" target="#lamprier_evaluation_2007">Lamprier et al. 2007</ref>), GHD (<ref type="bibliography" target="#bestgen_indice_2009">Bestgen + 2009</ref>), Boundary Edit Distance (<ref type="bibliography" target="#fournier_segmentation_2012">Fournier / Inkpen 2012</ref>), Boundary Similarity (B) + (<ref type="bibliography" target="#fournier_text_2013">Fournier 2013</ref>) und γ + (<ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>). Für eine Diskussion der Metriken bis + 2009 vgl. <ref type="bibliography" target="#fournier_text_2013">Fournier 2013</ref>; + <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>.</note> Mathet et al. geben einen + Überblick über einige Segmentierungsmetriken und schlagen für die Darstellung + bestehender Metriken und die Entwicklung ihres eigenen Vorschlags <term type="dh" + >γ</term> sechs Parameter vor, die Segmentierungsmetriken berücksichtigen + sollten.<note type="footnote"> Vgl. <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>.</note> Diese + berücksichtigen, dass eine Annotationsaufgabe (i) die Zuweisung von Kategorien (<term + type="dh">Categorization</term>) und / oder (ii) die Bestimmung von Texteinheiten + (<term type="dh">Unitizing</term>) beinhalten kann, die zu annotierenden + Textphänomene im Text (iii) ineinander verschachtelt (<term type="dh" + >Embedding</term>) oder (iv) sich anderweitig überlappend (<term type="dh">Free + Overlap</term>) vorkommen können sowie (v) nicht durchgehend vorhanden sein müssen + (<term type="dh">Sporadicity</term>) und außerdem (vi) zwei aufeinanderfolgende + Einheiten gegebenenfalls zu einer zusammengefasst werden können (<term type="dh" + >Aggregatable</term>).<note type="footnote"> Vgl. <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref>, S. + 440.</note> Damit wird deutlich, wie wichtig die Wahl einer zur Annotationsaufgabe + passenden IAA-Metrik ist – ein Umstand, der zumindest in der computationellen + Literaturwissenschaft nur selten reflektiert wird. Die sechs Kategorien von Mathet et + al. sind aber auch jenseits von Annotation und Automatisierung für die Arbeit mit + literaturwissenschaftlichen Phänomenen hilfreich, da sie die Schärfung der genutzten + Analysekonzepte unterstützen. Im Folgenden wird eine Auseinandersetzung mit diesen + Kategorien anhand des Szenenkonzepts und der dort bestehenden Rahmenbedingungen + skizziert.</p> + <p>Die <term type="dh">Categorization</term> ist grundlegend für jede Textanalyse: Man möchte dem Text bzw. + seinen Teilen Kategorien zuweisen, die die analysierten Phänomene benennen. Selbst in + dem diesbezüglich einfachen Fall im ›Szenen-Projekt‹, das nur auf einer Kategorie, + nämlich ›Szene‹, aufbaut, kann man von der Zuweisung von zwei Kategorien ausgehen, da + in der Annotation zwischen szenenhaften Passagen und nichtszenenhaften Textteilen + unterschieden wird. Problematisch ist in solchen Fällen aber fast immer das + <term type="dh">Unitizing</term>, welches die Segmentierung des Textes betrifft + und das, wie bereits erläutert, in der Literaturwissenschaft nur bedingt + standardisiert ist. Im ›Szenen-Projekt‹ wurde diskutiert, ob die oben besprochene + grundlegende Diskurseinheit Satz als Basiseinheit gewählt werden soll oder eine + größere, wie etwa der Absatz. Aufgrund der absehbaren Probleme bei der Bestimmung von + Absätzen in Rohtexten wurde eine satzbasierte Annotation gewählt, wobei eine Szene + normalerweise eine ganze Reihe von Sätzen umfasst. Diese vermeintlich triviale, durch + technische Einschränkungen motivierte Entscheidung hat aber auch konzeptuelle + Konsequenzen, da sie die Granularität des Szenenbegriffs beeinflusst. Eine + zusätzliche Annäherung an Segmentgrößen in Form der Angabe des typischen Textumfangs, + den ein Phänomen umfasst, hat sich außerdem als hilfreiche Heuristik + herausgestellt.<note type="footnote"> Vgl. <ref type="bibliography" target="#gius_narration_2016">Gius 2016</ref>, S. 12.</note> + </p> + <table> + <row> + <cell/> + <cell> + <hi rend="italic">Szene als Textphänomen</hi> + </cell> + <cell> + <hi rend="italic">Operationalisierung von Szene</hi> + </cell> + <cell> + <hi rend="italic">Schwierigkeit</hi> + </cell> + </row> + <row> + <cell> + <hi rend="bold">Categorization</hi> + </cell> + <cell>X</cell> + <cell>X</cell> + <cell>– (ist Voraussetzung für Textanalyse) </cell> + </row> + <row> + <cell> + <hi rend="bold">Unitizing</hi> + </cell> + <cell>X</cell> + <cell>X</cell> + <cell>literaturwissenschaftliche Grundlage fehlt</cell> + </row> + <row> + <cell> + <hi rend="bold">Embedding</hi> + </cell> + <cell>X</cell> + <cell>-</cell> + <cell>zur Vereinfachung der Annotationsaufgabe nicht berücksichtigt</cell> + </row> + <row> + <cell> + <hi rend="bold">Free Overlap</hi> + </cell> + <cell>-</cell> + <cell>-</cell> + <cell>–</cell> + </row> + <row> + <cell> + <hi rend="bold">Sporadicity</hi> + </cell> + <cell>X</cell> + <cell>X</cell> + <cell>erschwert die Annotationsaufgabe</cell> + </row> + <row> + <cell> + <hi rend="bold">Aggregatable</hi> + </cell> + <cell>x</cell> + <cell>?</cell> + <cell>nicht generalisierbar</cell> + </row> + <trailer xml:id="tab04"> + <ref type="intern" target="#tab4">Tab. 4</ref>: Parameter von <ref type="bibliography" target="#mathet_method_2015">Mathet et al. 2015</ref> angewendet auf Szenen (Phänomen + und Operationalisierung in den Guidelines).<ref type="graphic" target="#segment_t4"/> + </trailer> + </table> + + <p>Die Frage, ob Phänomene verschachtelt (<term type="dh">Embedding</term>) oder sich anderweitig überlappend + (<term type="dh">Free Overlap</term>) auftreten können, ist wiederum verbunden mit + ihrer Definition. Können die Phänomene in eine Begriffstaxonomie eingeordnet werden, + die hierarchisch organisiert ist oder auch darüber hinausgehende, nicht hierarchische + Verbindungen zwischen den Kategorien aufweist? Dazu gehört auch die Frage + von über- und untergeordneten Phänomen, in die die Untersuchungsbegriffe + gegebenenfalls aufgeteilt werden können. Für Szenen kann man annehmen, dass sie + verschachtelt auftreten können, da sie – ähnlich wie Erzählebenen – von anderen + Szenen unterbrochen und anschließend weitergeführt werden können. Nicht zuletzt + aufgrund der relativ wenig komplexen Handlungsabläufe in den untersuchten Heftromanen + haben wir auf Verschachtelungen verzichtet. Diese Entscheidung war zusätzlich dadurch + motiviert, dass eine hierarchische Szenenstruktur für das maschinelle Lernen eine + ungleich größere Herausforderung bedeutet. Unabhängig von der Entscheidung für oder + gegen Verschachtelung und Überschneidung muss geprüft werden, welche Konsequenzen die + jeweilige Ausprägung für die Analysekonzepte hat. Die daraus resultierende Taxonomie + führt nämlich dazu, dass die genutzten Phänomene sich gegenseitig ausschließen, über- + oder unterordnen etc. – oder eben nicht. </p> + <p>Die Frage nach der durchgehenden Präsenz von Phänomenen im Text (<term type="dh">Sporadicity</term>) + betrifft u. a. das Textkonzept. Ausschlaggebend ist hier, inwiefern die untersuchten + Phänomene als für Texte konstitutiv und ob Texte gegebenenfalls als noch aus weiteren + Phänomenen zusammengesetzt gesehen werden. Für die Szenenanalyse kann man davon + ausgehen, dass es Textabschnitte gibt, die nicht als Szenen gelten sollten. Dies + liegt daran, dass das Zeitkriterium – im Gegensatz zu den Kriterien Wechsel von Raum, + Figuren oder Handlung – nicht für einen Wechsel, sondern für die Szenenhaftigkeit an + sich steht und entsprechend Abschnitte, die es nicht erfüllen, nicht szenenhaft sind. + Im Gegensatz dazu gehen etwa die meisten Konzepte von Erzählebenen davon aus, dass + jeder Abschnitt eines Textes (mindestens) einer Erzählebene zugeordnet werden kann. + Dies ist in der Analysepraxis der einfachere Fall. Das Erkennen von Nicht-Szenen hat + sich nämlich als durchaus problematisch erwiesen, da das zugrunde liegende Kriterium, + wie in der Textanalyse häufig, graduell ist.</p> + <p>Schließlich ist die Frage der Aggregierbarkeit (<term type="dh">Aggregatable</term>) im Falle der Szenen + problematisch. Während direkt aufeinanderfolgende Szenen potenziell zu einer + einzelnen Szene zusammengefasst werden können, wenn man die Szenen als kleinere + Unterteilungen einer großen Szene interpretieren kann, sollten aufeinanderfolgende + Szenen, die sich sehr deutlich in Raum, Zeit, Figuren oder Handlung unterscheiden, + nicht zu einer längeren Szene zusammengefasst werden. An dieser Stelle wird + offensichtlich, dass die aufgrund der damit verbundenen Probleme nicht vorgenommene + Vorsegmentierung der Texte nun ihrerseits zu Problemen führt. </p> + <p>Auch wenn die sechs vorgestellten Parameter für Analysen der Übereinstimmung von + Annotationen auf der Textoberfläche vorgeschlagen werden, soll die Darstellung der + einzelnen Punkte zeigen, dass sie eine darüber hinausgehende Relevanz für die + literaturwissenschaftliche Beschreibung und Definition von Textphänomenen haben. Ihre + Explizierung kann erheblich zur intersubjektiven Verständlichkeit von Phänomenen und + ihren Definitionen beitragen. Auch die aufgezeigten Zusammenhänge zwischen den + Parametern können bei der Entwicklung intersubjektiv besser nachvollziehbarer und + damit stabilerer Definitionen nützlich sein. </p> + </div> + </div> + <div type="chapter"> + <head>4. Sinn und Segment</head> + <p>Die in diesem Beitrag diskutierten Aspekte von Segmentierung reichen von der + Layoutanalyse über die Identifizierung lexikalischer Mehrwortausdrücke, die + Auseinandersetzung mit heuristischen Textpraktiken und die Frage nach der + Sequenzierbarkeit von Novellen bis hin zu Segmenten als intersubjektiv + identifizierbare Einheiten in Prosatexten. Segmentierung wurde also im Kontext + (zumindest scheinbar) standardisierter Segmentierungspraktiken wie dem <term type="dh">Unitizing</term>, der + Tokenisierung oder der Bestimmung von Diskurs- und Layouteinheiten, aber auch iin Bezug auf den Zugang zu nicht ohne Weiteres linguistisch und / oder am Schriftbild bzw. Layout bestimmbaren Segmentkonzepten diskutiert. Die Bandbreite der Ansätze deckt + damit weite Teile der philologischen Analysepraxis ab und verdeutlicht, dass + Segmentierung im philologischen Kontext wesentliche Konsequenzen hat. Das gilt + unabhängig davon, ob im Forschungszugang die Bestimmung der Segmente im Zentrum steht + oder auf Segmentierung aufbauende Forschung betrieben wird. Für alle Zugänge lässt + sich beobachten: Für eine geeignete Segmentierung des Untersuchungsgegenstands muss + das relevante Wissen zu theoretischen Konzepten mit der Gestaltung des + Analyseprozesses und Eigenschaften des untersuchten Mediums in Einklang gebracht + werden. Segmentierung kann man entsprechend als eine Art Vorverarbeitung des zu + analysierenden Textmaterials sehen, während erst das Ergebnis der darauf aufbauenden + Analyse und Interpretation als die anvisierte Erkenntnis betrachtet werden kann. + Aufgrund der skizzierten Zusammenhänge besteht allerdings eine Interaktion von + Vorverarbeitung und Analyse, die zu einer Kreisbewegung führt. Entsprechend fehlt der + gesamten Tätigkeit ein offensichtlicher Anfangspunkt. Die epistemische – oder auch + hermeneutische – Zwickmühle wird hier schnell offensichtlich: Vorverarbeitung und + Analyse sollten getrennt stattfinden, aber wir können nicht interpretieren, ohne zu + segmentieren, und wir können nicht segmentieren, ohne zu interpretieren. + Wünschenswert ist daher in erster Linie die Transparenz der Methoden und ihres + Ineinandergreifens bzw. die konsequente Reflexion und Explizierung des + Forschungsprozesses. </p> + <p>Dies gilt für Segmentierung unabhängig vom digitalen Zugang. Wie jede + Textanalyseaufgabe ist auch Segmentierung nicht trivial oder zumindest ist die + Aufgabe in vielen Fällen nicht eindeutig lösbar. Im analogen Analysemodus können und + werden diese Unbestimmtheiten allerdings regelmäßig nicht expliziert, jedenfalls aber + häufig hingenommen. Der digitale Zugang wirkt hingegen – wie bei jeder anderen + Textanalyseaufgabe – problemverstärkend. Die Bestimmung von für eine Analyse + adäquaten Textsegmenten wird in digitalen Zugängen dadurch erschwert, dass diese den + Zwang des Diskreten mit sich bringen. Die Operationalisierung der Segmentierung + resultiert in binären Entscheidungen – etwas ist ein Segment oder nicht. Hier liegt + der wesentliche Unterschied zwischen digitalen und analogen Zugängen: Der digitale + Zugang erzwingt gewissermaßen die Offenlegung von Segmentierungsentscheidungen und + fördert stark die Festlegung und Explizierung von Kriterien für diese Entscheidungen. + Die algorithmische Formulierung sowie deren Implementierung als eindeutige und + diskrete Segmentierungsentscheidung schärft damit unsere Begriffe.</p> + <p>Die diskutierten Segmentierungsprobleme verdeutlichen außerdem, dass + Segmentierungsentscheidungen den Forschungsprozess wesentlich beeinflussen. Dieser + Zusammenhang ist ebenfalls unabhängig vom digitalen Zugang, allerdings wird er durch + diesen leichter offensichtlich. So wird die Menge der Untersuchungseinheiten sowie + deren Granularität durch die Segmentierungsentscheidungen bestimmt. Man kann auch + sagen: Nur was als Segment einer Analyseebene identifiziert und segmentiert wird, + wird auch analysiert; aber auch: Was analysiert werden soll, also Gegenstand der + Untersuchung sein soll, muss auch segmentiert, also als diskrete Einheit + identifiziert werden (können). Hinzu kommt: Aufgrund der beschriebenen Interaktion + von Segmentierung und Interpretation werden – unabhängig vom digitalen Zugang – + bereits im Korpusaufbau Segmentierungsentscheidungen getroffen, die sich auf die + späteren Ergebnisse auswirken. Im automatisierten Zugang wird es insbesondere dann + problematisch, wenn die für die ursprüngliche Segmentbestimmung relevanten + Unsicherheiten und Entscheidungen nicht mehr ohne Weiteres zugänglich oder aufgrund + ihrer schieren Menge nicht mehr erfassbar sind.</p> + </div> + <div type="bibliography"> + <head>Bibliografische Angaben</head> + <listBibl> + <bibl xml:id="adler_philologie_2020">Marc Adler / Sabine Bartsch / Maria Becker / Michael Bender / Luise Borek / Cindy + Brinkmann / Friedrich Michael Dimpel / Rotraut Fischer / Anastasia Glawion / Svenja + A. Gülden / Canan Hastik / Philipp Hegel / Katharina Herget / Franziska Horn / Celia + Krause / Marcus Müller / Alexandra Núñez / Andrea Rapp / Lisa Scharrer / Oliver + Schmid / Jörn Stegmeier / Beate Thull / Thomas Weitin: Digitale Philologie: Das + Darmstädter Modell. + Darmstadt 2020. (= Digital Philology. Working Papers in Digital Philology, 1). DOI: <ref target="https://doi.org/10.25534/tuprints-00012476" + >10.25534/tuprints-00012476</ref></bibl> + <bibl xml:id="angehrn_sinn_2010">Emil Angehrn: Sinn und Nicht-Sinn. Das Verstehen des Menschen. Tübingen 2010. (= Philosophische + Untersuchungen, 25). <ptr type="gbv" cRef="618811168"/></bibl> + <bibl xml:id="anz_textwelten_2013">Thomas Anz: Textwelten. In: Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3 + Bde. Stuttgart 2013. Bd. 1: Gegenstände und Grundbegriffe, S. 111–130. <ptr type="gbv" cRef="766534278"/></bibl> + <bibl xml:id="artstein_agreement_2008">Ron Artstein / Massimo Poesio: Inter-Coder Agreement for Computational + Linguistics. In: Computational Linguistics 34 (2008), H. 4, S. 555–596. DOI: <ref + target="http://dx.doi.org/10.1162/coli.07-034-R2">10.1162/coli.07-034-R2</ref> <ptr type="gbv" cRef="130396419"/></bibl> + <bibl xml:id="barthes_sequences_1971">Roland Barthes: Action Sequences. In: Patterns of Literary Style. Hg. von Joseph + Strelka. University Park, PA u. a. 1971, S. 5–14. (= Yearbook of Comparative Criticism, 3). <ptr type="gbv" cRef="1601196733"/></bibl> + <bibl xml:id="batty_slugune_2014">Craig Batty: ›Show Me Your Slugune and I'll Let You Have the Firstlook‹: Some + Thoughts on Today’s Digital Screenwriting Tools and Aprs. In: Media International + Australia 153 (2014), H. 1, S. 118–127. DOI: 10.1177/1329878X1415300114 <ptr type="gbv" cRef="191054135"/></bibl> + <bibl xml:id="bartsch_properties_2004">Sabine Bartsch: Structural and Functional Properties of Collocations in English. A + Corpus Study of Lexical and Pragmatic Constraints in Lexical Co-occurrence. Tübingen + 2004. <ptr type="gbv" cRef="361068964"/></bibl> + <bibl xml:id="bartsch_notion_2014">Sabine Bartsch / Stefan Evert: Towards a Firthian Notion of Collocation. In: + Vernetzungsstrategien, Zugriffsstrukturen und automatisch ermittelte Angaben in + Internetwörterbüchern. Hg. von Andrea Abel / Lothar Lemnitzer. Mannheim 2014, S. 48–61. (= OPAL - Online + publizierte Arbeiten zur Linguistik, 2014.2). URN: <ref + target="https://nbn-resolving.org/urn:nbn:de:bsz:mh39-24029" + >urn:nbn:de:bsz:mh39-24029</ref> + </bibl> + <bibl xml:id="becker_heuristic_2020">Maria Becker / Michael Bender / Marcus Müller: Classifying Heuristic Textual + Practices in Academic Discourse. A Deep Learning Approach to Pragmatics. In: + International Journal of Corpus Linguistics 25 (2020), H. 4, S. 426–460. 11.11.2020. + DOI: 10.1075/ijcl.19097.bec <ptr type="gbv" cRef="215035194"/></bibl> + <bibl xml:id="beeferman_text_1997">Doug Beeferman / Adam Berger / John Lafferty: Text Segmentation Using Exponential + Models. In: Proceedings of the 2nd Conference on Empirical Methods in Natural + Language Processing. (EMNLP: 2, Providence, 01.–02.08.1997). Somerset, NJ u. a. 1997, + S. 35–46. [<ref target="https://aclanthology.org/W97-0304">online</ref>] <ptr type="gbv" cRef="1162143851"/></bibl> + <bibl xml:id="beisswenger_empirist_2016">Michael Beißwenger / Sabine Bartsch / Stefan Evert / Kay-Michael Würzner: EmpiriST + 2015: A Shared Task on the Automatic Linguistic Annotation of Computer-mediated + Communication and Web Corpora. In: Proceedings of the 10th Web as Corpus Workshop and + the EmpiriST Shared Task. Hg. von Association for Computational Linguistics. (WAC-X: + 10, Berlin, 12.08.2016). Stroudsburg, PA 2016, S. 44–56. DOI: <ref + target="https://doi.org/10.18653/v1/W16-2606">10.18653/v1/W16-2606</ref> + </bibl> + <bibl xml:id="bender_textpraktiken_2020">Michael Bender / Marcus Müller: Heuristische Textpraktiken. Eine kollaborative + Annotationsstudie zum akademischen Diskurs. In: Zeitschrift für Germanistische + Linguistik 48 (2020), H. 1, S. 1–46. DOI: <ref + target="https://doi.org/10.1515/zgl-2020-0001">10.1515/zgl-2020-0001</ref> + <ptr type="gbv" cRef="129095605"/></bibl> + <bibl xml:id="bestgen_indice_2009">Yves Bestgen: Quel indice pour mesurer l’efficacité en segmentation de textes? In: + Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. + Articles longs. Hg. von Adeline Nazarenko / Thierry Poibeau. Senlis 2009, S. 171–180. + [<ref target="https://aclanthology.org/2009.jeptalnrecital-long.18" + >online</ref>]</bibl> + <bibl xml:id="bullin_bildsuche_2020">Martin Bullin / Andreas Henrich: Die inhaltsbasierte Bildsuche und + Bilderschließung. Ansätze und Problemfelder. In: Bilddaten in den digitalen + Geisteswissenschaften<hi rend="italic">.</hi> Hg. von Canan Hastik / Philipp + Hegel. Wiesbaden 2020, S. 11–33 (= Episteme in Bewegung, 16). DOI: <ref + target="https://www.doi.org/10.13173/9783447114608">10.13173/9783447114608</ref> + <ptr type="gbv" cRef="1734711329"/></bibl> + <bibl xml:id="cohen_agreement_1960">Jacob Cohen: A Coefficient of Agreement for Nominal Scales. In: Educational and + Psychological Measurement 20 (1960), H. 1, S. 37–46. DOI: <ref + target="https://doi.org/10.1177/001316446002000104" + >10.1177/001316446002000104</ref> <ptr type="gbv" cRef="129492906"/></bibl> + <bibl xml:id="dieleman_hinweise_2016">Owen Dieleman: Hinweise für die Entwicklung von Verfahren zur + maßnahmenartübergreifenden Dringlichkeitsbewertung von Straßenbaumaßnahmen. Darmstadt 2016. (= Schriftenreihe des Instituts für Verkehr, Darmstadt, Technische Universität + Darmstadt, 34). [<ref + target="https://tuprints.ulb.tu-darmstadt.de/id/eprint/5570">online</ref>] + <ptr type="gbv" cRef="483304484"/></bibl> + <bibl xml:id="evert_corpora_2008">Stefan Evert: Corpora and Collocations. In: Corpus Linguistics: An International + Handbook. Hg. von Anke Lüdeling / Merja Kytö. 2. Bde. Berlin u. a. 2008. Bd. 2, S. 1212-1248. (= Handbooks of Linguistics and + Communication Science, 29). DOI: + 10.1515/9783110213881.2.1212</bibl> + <bibl xml:id="firth_papers_1964">John Rupert Firth: Papers in Linguistics 1934–1951. London u. a. 1964 [1957]. URN: + <ref target="https://archive.org/search.php?query=external-identifier%3A%22urn%3Aoclc%3Arecord%3A1150956406%22">urn:oclc:record:1150956406</ref> <ptr type="gbv" cRef="253298466"/></bibl> + <bibl xml:id="firth_selected_1968">John Rupert Firth: Selected Papers of J. R. Firth. 1952–59. Hg. von Frank Robert Palmer. London 1968. <ptr type="gbv" cRef="196465206"/></bibl> + <bibl xml:id="fleiss_scale_1971">Joseph L. Fleiss: Measuring Nominal Scale Agreement among Many Raters. In: + Psychological Bulletin 76 (1971), H. 5, S. 378–382. DOI: 10.1037/h0031619 <ptr type="gbv" cRef="129067016"/></bibl> + <bibl xml:id="fournier_text_2013">Chris Fournier: Evaluating Text Segmentation Using Boundary Edit Distance. In: + Proceedings of the 51st Annual Meeting of the Association for Computational + Linguistics. Long Papers. Hg. von Hinrich Schuetze / Pascale Fung / Massimo Poesio. + (ACL 51: Sofia, 04.–09.08.2013). Stroudsburg, PA 2013, S. 1702–1712. PDF. [<ref + target="https://www.aclweb.org/anthology/P13-1167">online</ref>] + </bibl> + <bibl xml:id="fournier_segmentation_2012">Chris Fournier / Diana Inkpen: Segmentation Similarity and Agreement. In: + Proceedings of the 2012 Conference of the North American Chapter of the Association + for Computational Linguistics: Human Language Technologies. Hg. von Eric + Fosler-Lussier / Ellen Riloff / Srinivas Bangalore. (NAACL: Montréal, + 03.–08.06.2012). Stroudsburg, PA 2012, S. 152–161. [<ref + target="https://www.aclweb.org/anthology/N12-1016">online</ref>] <ptr type="gbv" cRef="736086943"/></bibl> + <bibl xml:id="fricke_reallexikon_1997">Reallexikon der deutschen Literaturwissenschaft. Neubearbeitung des Reallexikons + der deutschen Literaturgeschichte. Hg. von Harald Fricke / Klaus Grubmüller / + Jan-Dirk Müller / Klaus Weimar. 3 Bde. Berlin 1997–2003. <ptr type="gbv" cRef="224594834"/></bibl> + <bibl xml:id="gabler_primacy_2007">Hans-Walter Gabler: The Primacy of the Document in Editing. In: Ecdotica 4 (2007), + S. 197–207. <ptr type="gbv" cRef="590955543"/></bibl> + <bibl xml:id="gius_narration_2016">Evelyn Gius: Narration and Escalation. An Empirical Study of Conflict Narratives. + In: Diegesis 5 (2016), H. 1, S. 4–25. [<ref + target="https://www.diegesis.uni-wuppertal.de/index.php/diegesis/article/view/222" + >online</ref>] <ptr type="gbv" cRef="799341215"/></bibl> + <bibl xml:id="gius_detection_2019">Evelyn Gius / Fotis Jannidis / Markus Krug / Albin Zehe / Andreas Hotho / Frank + Puppe / Jonathan Krebs / Nils Reiter / Natalie Wiedmer / Leonard Konle: Detection of + Scenes in Fiction. In: Digital Humanities 2019 Conference papers. Book of Abstracts. + (DH 2019: Utrecht, 09.–12.07.2019). Utrecht 2019. </bibl> + <bibl xml:id="gius_agreement_2022">Evelyn Gius / Michael Vauth: Inter Annotator Agreement und Intersubjektivität. In: + DHd2022: Kulturen des digitalen Gedächtnisses. Konferenzabstracts. (DHd 8: Potsdam, + 07.–11.03.2022). Potsdam 2022. DOI: <ref + target="https://doi.org/10.5281/zenodo.6328208">10.5281/zenodo.6328208</ref> + </bibl> + <bibl xml:id="halliday_cohesion_1976">Michael Alexander Kirkwood Halliday / Ruqaiya Hasan: Cohesion in English. London + 1976. <ptr type="gbv" cRef="1604473088"/></bibl> + <bibl xml:id="anz_handbuch_2013">Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3 Bde. Stuttgart 2013. + <ptr type="gbv" cRef="766534278"/></bibl> + <bibl xml:id="herzog_ansatz_2018">Rainer Herzog: Ein generischer Ansatz zur digitalen Layoutanalyse von + Manuskripten. Hamburg 2018. PDF. [<ref + target="https://ediss.sub.uni-hamburg.de/volltexte/2019/10058/pdf/Dissertation.pdf" + >online</ref>] <ptr type="gbv" cRef="168069748X"/></bibl> + <bibl xml:id="heyse_einleitung_1871">Paul Heyse / Hermann Kurz: Einleitung. In: Deutscher Novellenschatz. Hg. von Paul + Heyse / Hermann Kurz. 24 Bde. München 1871–1876, Bd. 1 (1871), S. V–XXIV. <ptr type="gbv" cRef="167398210"/></bibl> + <bibl xml:id="iser_akt_1976">Wolfgang Iser: Der Akt des Lesens. Theorie ästhetischer Wirkung. München 1976. + <ptr type="gbv" cRef="025607464"/></bibl> + <bibl xml:id="katz_sense_2004">Jerrold Jacob Katz: Sense, Reference, and Philosophy. Oxford u. a. 2004. <ptr type="gbv" cRef="349705259"/></bibl> + <bibl xml:id="keller_diskurs_2015">Diskurs – Interpretation – Hermeneutik. Hg. von Reiner Keller. Weinheim 2015. (= Zeitschrift für + Diskursforschung / Beihefte, 1). <ptr type="gbv" cRef="1615247599"/></bibl> + <bibl xml:id="koeppe_theorien_2013">Tilmann Köppe / Simone Winko: Theorien und Methoden der Literaturwissenschaft. In: + Handbuch Literaturwissenschaft. Hg. von Thomas Anz. 3 Bde. Stuttgart 2013. Bd. 2: + Methoden und Theorien, S. 285–371. <ptr type="gbv" cRef="766534278"/></bibl> + <bibl xml:id="krewet_wissenstransfer_2015">Michael Krewet: Wissenstransfer in Scholien. Zur Präsenz Platons in den + Marginalien von de interpretationeâ€Handschriften. Berlin 2015. (= Working Paper des SFB 980 + Episteme in Bewegung, 6). PDF. [<ref + target="https://www.sfb-episteme.de/Listen_Read_Watch/Working-Papers/No_6_Krewet_Scholien/Working-Paper-Nr-6_Krewet.pdf" + >online</ref>] <ptr type="gbv" cRef=""/></bibl> + <bibl xml:id="krewet_aristoteles_2019">Michael Krewet / Philipp Hegel / Germaine Götzelmann / Sybille Söring / Danah + Tonne: Aristoteles auf Reisen: Handschriftenforschung in der digitalen Infrastruktur + des SFBs 980 ›Episteme in Bewegung‹. In: Forschungsinfrastrukturen in den digitalen + Geisteswissenschaften. Hg. von Martin Huber / Sybille Krämer / Claus Pias: + Fachinformationsdienst Allgemeine und Vergleichende Literaturwissenschaft. + (DFG-Symposienreihe Digitalität in den Geisteswissenschaften, Bayreuth, + 26.–28.09.2018). Frankfurt / Main 2019, S. 77–87. PDF. [<ref + target="https://d-nb.info/1201549485/34">online</ref>] <ptr type="gbv" cRef=""/></bibl> + <bibl xml:id="krewet_diagramme_2020">Michael Krewet / Philipp Hegel: Diagramme in Bewegung: Scholien und Glossen zu ›de + interpretatione‹. In: Bilddaten in den digitalen Geisteswissenschaften. Hg. von Canan + Hastik / Philipp Hegel. Wiesbaden 2020, S. 199–216. (= Episteme in Bewegung, 16). <ptr type="gbv" cRef="1734711329"/></bibl> + <bibl xml:id="krippendorff_content_1980">Klaus Krippendorff: Content Analysis: an Introduction to Its Methodology. Beverly Hills, CA 1980.(= The + Sage Commtext Series, 5). <ptr type="gbv" cRef="130556084"/></bibl> + <bibl xml:id="krippendorff_reliability_2004">Klaus Krippendorff: Reliability in Content Analysis: Some Common Misconceptions + and Recommendations. In: Human Communication Research 30 (2004), H. 3, S. 411–433. + <ptr type="gbv" cRef="129567736"/></bibl> + <bibl xml:id="lamprier_evaluation_2007">Sylvain Lamprier / Tassadit Amghar / Bernard Levrat / Frederic Saubion: On + Evaluation Methodologies for Text Segmentation Algorithms. In: Proceedings of the + 19th IEEE International Conference on Tools with Artificial Intelligence. (ICTAI 19: + Patras, 29.–31.10.2007). Los Alamitos, CA 2007, S. 19–26. DOI: 10.1109/ICTAI.2007.142 <ptr type="gbv" cRef="581958004"/></bibl> + <bibl xml:id="levenshtein_codes_1966">Vladimir I. Levenshtein: Binary Codes Capable of Correcting Deletions, Insertions, + and Reversals. In: Soviet Physics Doklady 10 (1966) [1965], H. 8, S. 707–710. + <ptr type="gbv" cRef="129482234"/></bibl> + <bibl xml:id="schubert_materialitaet_2010">Materialität in der Editionswissenschaft. Hg. von Martin Schubert. Berlin 2010. (= Editio / Beihefte, 32). DOI: 10.1515/9783110231311</bibl> + <bibl xml:id="mathet_method_2015">Yann Mathet / Antoine Widlöcher / Jean-Philippe Métivier: The Unified and Holistic + Method Gamma (γ) for Inter-Annotator Agreement Measure and Alignment. In: + Computational Linguistics 41 (2015), H. 3, S. 437–479. DOI: 10.1162/COLI_a_00227 + <ptr type="gbv" cRef="320641066"/></bibl> + <bibl xml:id="glueck_lexikon_2016">Metzler Lexikon Sprache. Hg. von Helmut Glück / Michael Rödel. 5. aktualisierte + und überarbeitete Auflage. Stuttgart 2016. <ptr type="gbv" cRef="859110699"/></bibl> + <bibl xml:id="ortmann_tools_2019">Katrin Ortmann / Adam Roussel / Stefanie Dipper: Evaluating Off-the-Shelf NLP + Tools for German. In Proceedings of the 15th Conference on Natural Language + Processing. Hg. von German Society for Computational Linguistics & Language + Technology. (KONVENS 15: Erlangen, 09.–11.10.2019). 2019, S. 212–222. + <ptr type="gbv" cRef="1690535733"/></bibl> + <bibl xml:id="pevzner_critique_2002">Lev Pevzner / Marti Alice Hearst: A Critique and Improvement of an Evaluation Metric + for Text Segmentation. In: Computational Linguistics 28 (2002), H. 1, S. 19–36. + <ptr type="gbv" cRef="320641066"/></bibl> + <bibl xml:id="pfeifer_woerterbuch_1993">Wolfgang Pfeifer et al.: Etymologisches Wörterbuch des Deutschen, + digitalisierte und von Wolfgang Pfeifer überarbeitete Version im Digitalen Wörterbuch + der deutschen Sprache. Berlin 1993. HTML. [<ref + target="https://www.dwds.de/d/wb-etymwb">online</ref>]</bibl> + <bibl xml:id="propp_morphologie_1975">Vladimir Propp: Morphologie des Märchens. Frankfurt / Main 1975. <ptr type="gbv" cRef="198411758"/></bibl> + <bibl xml:id="reiter_messverfahren_2022">Nils Reiter / Leonard Konle: Messverfahren zum Inter-annotator-agreement (IAA): + Eine Übersicht. Göttingen 2022. (= DARIAH-DE Working Papers, 44). PDF. DOI: <ref + target="https://doi.org/10.47952/gro-publ-103">10.47952/gro-publ-103</ref> + </bibl> + <bibl xml:id="saussure_cours_1916">Ferdinand de Saussure: Cours de linguistique générale. Hg. von Charles Bally / + Albert Sechehaye. Lausanne u. a. 1916. <ptr type="gbv" cRef="136041396"/></bibl> + <bibl xml:id="schmid_part_1994">Helmut Schmid: Probabilistic Part-of-Speech Tagging Using Decision Trees. (International Conference on New Methods in Language Processing, Manchester, 06.07–08.07.1994). + Manchester 1994. PDF. [<ref target="https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf">online</ref>]</bibl> + <bibl xml:id="schmid_improvements_1995">Helmut Schmid: Improvements in Part-of-Speech Tagging with an Application to + German. (ACL SIGDAT-Workshop, Dublin 1995, 27.03.1995). PDF. [<ref target="https://www.cis.uni-muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger2.pdf">online</ref>]</bibl> + <bibl xml:id="schmid_erzaehltextanalyse_2013">Wolf Schmid: Erzähltextanalyse. In: Handbuch Literaturwissenschaft. Hg. von Thomas + Anz. 3 Bde. Stuttgart 2013. Bd. 2: Methoden und Theorien, S. 98–120. + <ptr type="gbv" cRef="766534278"/></bibl> + <bibl xml:id="siegel_hang_2002">Monika Siegel: Ich hatte einen Hang zur Schwaermerey ... Das Leben der + Schriftstellerin und Übersetzerin Meta Forkel-Liebeskind im Spiegel ihrer Zeit. + Darmstadt 2002. PDF. [<ref target="https://tuprints.ulb.tu-darmstadt.de/epda/000222/" + >online</ref>] </bibl> + <bibl xml:id="sinclair_corpus_1991">John Sinclair: Corpus, Concordance, Collocation. Oxford 1991. (= Describing + English Language). <ptr type="gbv" cRef="276280504"/></bibl> + <bibl xml:id="stoeckmann_aesthetik_2013">Ingo Stöckmann: Ästhetik. In: Handbuch Literaturwissenschaft. Hg. von Thomas Anz. + 3 Bde., Stuttgart 2013. Bd. 1: Gegenstände und Grundbegriffe, S. 465–491. + <ptr type="gbv" cRef="766534278"/></bibl> + <bibl xml:id="teufel_zoning_1999">Simone Teufel: Argumentative Zoning: Information Extraction from Scientific Text. + Dissertation, University of Edinburgh. 1999. PDF. [<ref + target="https://www.cl.cam.ac.uk/~sht25/thesis/t1.pdf">online</ref>]</bibl> + <bibl xml:id="thuemmel_segmentierung_2016">Wolf Thümmel: Segmentierung. In: Metzler Lexikon Sprache. Hg. von Helmut Glück / + Michael Rödel. 5. aktualisierte und überarbeitete Auflage. Stuttgart 2016, S. 602. + <ptr type="gbv" cRef="859110699"/></bibl> + <bibl xml:id="thuernau_sinn_2017">Donatus Thürnau: Sinn/Bedeutung. In: Historisches Wörterbuch der Philosophie. + Onlineversion. Hg. von Joachim Ritter, Karlfried Gründer und Gottfried Gabriel. 2017. DOI: 10.24894/HWPh.3901 + </bibl> + <bibl xml:id="toutanova_enriching_2000">Kristina Toutanova / Christopher David Manning: Enriching the Knowledge Sources Used + in a Maximum Entropy Part-of-Speech Tagger. In: Proceedings of the Joint SIGDAT + Conference on Empirical Methods in Natural Language Processing and Very Large + Corpora. (EMNLP/VLC-2000: Hong Kong, Oktober 2000) S. 63–70. PDF. DOI: <ref + target="https://doi.org/10.3115/1117794.1117802">10.3115/1117794.1117802</ref> + </bibl> + <bibl xml:id="zehe_scenes_2021">Albin Zehe / Leonard Konle / Lea Katharina Dümpelmann / Evelyn Gius / Andreas + Hotho / Fotis Jannidis / Lucas Kaufmann / Markus Krug / Frank Puppe / Nils Reiter / + Annekea Schreiber / Natalie Widmer: Detecting Scenes in Fiction. A New Segmentation + Task. In: Proceedings of the 16th Conference of the European Chapter of the + Association for Computational Linguistics: Main Volume. Hg. von Association for + Computational Linguistics. (EACL 16: online, 19.–23.04.2021) 2021, S. 3167–3177. PDF. + DOI: <ref target="https://doi.org/10.18653/v1/2021.eacl-main.276" + >10.18653/v1/2021.eacl-main.276</ref> + </bibl> + </listBibl> + </div> + <div type="abbildungsnachweis"> + <head>Abbildungs- und Tabellenverzeichnis</head> + <desc type="table" xml:id="tab1"><ref target="#tab01" type="intern">Tab. 1</ref>: Linguistische Einheiten der Segmentierung.<ref type="graphic" target="#segment_t1"/></desc> + <desc type="table" xml:id="tab2"><ref target="#tab02" type="intern">Tab. 2</ref>: Beispiele lexikalischer Mehrwortausdrücke.<ref type="graphic" target="#segment_t2"/></desc> + <desc type="graphic" xml:id="abb1">Das taxonomische Annotationsschema HeuTex. [<ref type="bibliography" target="#bender_textpraktiken_2020">Bender / Müller 2020</ref>, S. + 23]<ref type="graphic" target="#segment_001"/></desc> + <desc type="table" xml:id="tab3"><ref target="#tab03" type="intern">Tab. 3</ref>: Ergebnis der RNN-Klassifizierung auf verschiedenen Ebenen. [Aus: + <ref type="bibliography" target="#becker_heuristic_2020">Becker et + al. 2020</ref>]<ref type="graphic" target="#segment_t3"/></desc> + <desc type="graphic" xml:id="abb2">Dimensionen der Segmentierung. [Eigene Darstellung]<ref type="graphic" target="#segment_002"/></desc> + <desc type="table" xml:id="tab4"><ref target="#tab04" type="intern">Tab. 4</ref>: Parameter von <ref type="bibliography" target="#mathet_method_2015">Mathet et al. (2015)</ref> angewendet auf Szenen (Phänomen und + Operationalisierung in den Guidelines).<ref type="graphic" target="#segment_t4"/></desc> + </div> + </div> + </body> + </text> +</TEI> diff --git a/2023_002_bartsch_et_al/segment_2023_001.png b/2023_002_bartsch_et_al/segment_2023_001.png new file mode 100644 index 0000000000000000000000000000000000000000..f3e9202204e4ac9dc1478710aeca6d46e7ac523d Binary files /dev/null and b/2023_002_bartsch_et_al/segment_2023_001.png differ diff --git a/2023_002_bartsch_et_al/segment_2023_002.png b/2023_002_bartsch_et_al/segment_2023_002.png new file mode 100644 index 0000000000000000000000000000000000000000..78284cff6c28f0ebc3b124ab5d26babf21aba56d Binary files /dev/null and b/2023_002_bartsch_et_al/segment_2023_002.png differ diff --git a/2023_003_lang/Lang_2023_v1_0.pdf b/2023_003_lang/Lang_2023_v1_0.pdf new file mode 100644 index 0000000000000000000000000000000000000000..6539d47753fac0f4ca3bc7e408630bd4359b8e68 Binary files /dev/null and b/2023_003_lang/Lang_2023_v1_0.pdf differ diff --git a/2023_003_lang/Lang_2023_v1_0.xml b/2023_003_lang/Lang_2023_v1_0.xml new file mode 100644 index 0000000000000000000000000000000000000000..63aff014000998d7a025bd30bf3dae28e254b829 --- /dev/null +++ b/2023_003_lang/Lang_2023_v1_0.xml @@ -0,0 +1,2118 @@ +<?xml version="1.0" encoding="utf-8"?> +<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html" + xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink" + xmlns:xhtml="http://www.w3.org/1999/xhtml"> + <teiHeader> + <fileDesc> + <titleStmt> + <title> + <biblStruct> + <analytic> + <title level="a">»[…] nicht die Ausnahme, sondern der Normalfall [!]« Die + digitale Lücke in der Kunstgeschichte und Provenienzforschung</title> + <respStmt> + <resp ref="http://id.loc.gov/vocabulary/relators/aut">Author</resp> + <persName> + <forename>Sabine</forename> + <surname>Lang</surname> + <email>sab.lang@fau.de</email> + <idno type="gnd">1100083812</idno> + <idno type="orcid">0000-0003-2543-0085</idno> + <affiliation>Friedrich-Alexander-Universität Erlangen-Nürnberg, Department + Digital Humanities and Social Studies</affiliation> + </persName> + </respStmt> + <idno type="doi">10.17175/2023_002</idno> + <idno type="ppn">184313442X</idno> + <idno type="zfdg">2023.002</idno> + <idno type="url">https://www.zfdg.de/node/438</idno> + <date when="2023-05-15">11.05.2023</date> + </analytic> + <monogr> + <title level="j">Zeitschrift für digitale Geisteswissenschaften</title> + <respStmt> + <resp>Publiziert von</resp> + <orgName role="marc_pbl">Herzog August Bibliothek</orgName> + </respStmt> + <respStmt> + <resp>Transformation der Word Vorlage nach TEI</resp> + <persName/> + <name role="marc_trc"> + <surname>Baumgarten</surname> + <forename>Marcus</forename> + <idno type="gnd">1192832655</idno> + </name> + </respStmt> + <availability status="free"> + <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref> + </p> + </availability> + <imprint> + <biblScope unit="year">2023</biblScope> + <biblScope unit="artikel">02</biblScope> + </imprint> + </monogr> + </biblStruct> + </title> + </titleStmt> + <editionStmt> + <edition>Elektronische Ausgabe nach TEI P5</edition> + </editionStmt> + <publicationStmt> + <distributor> + <name> + <orgName>Herzog August Bibliothek Wolfenbüttel</orgName> + </name> + </distributor> + <idno type="doi">10.17175/zfdg.01</idno> + <idno type="ppn">819494402</idno> + <authority> + <name>Herzog August Bibliothek</name> + <address> + <addrLine>Lessingplatz 1</addrLine> + <addrLine>38304 Wolfenbüttel</addrLine> + </address> + </authority> + <authority> + <name>Forschungsverbund Marbach Weimar Wolfenbüttel</name> + <address> + <addrLine>Burgplatz 4</addrLine> + <addrLine>99423 Weimar </addrLine> + </address> + </authority> + <availability status="free"> + <p> Sofern nicht anders angegeben </p> + <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence> + </availability> + <availability status="free"> + <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund + MWW</ref> + </p> + </availability> + </publicationStmt> + <sourceDesc> + <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p> + </sourceDesc> + </fileDesc> + <encodingDesc> + <editorialDecl> + <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und + XSLT-Skripten</p> + </editorialDecl> + <editorialDecl> + <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von + <persName>Caroline Jansky</persName>.</p> + </editorialDecl> + <editorialDecl> + <p>Medienrechte liegen bei den Autor*innen</p> + </editorialDecl> + <editorialDecl> + + <p>All links checked<date when="2023-05-03">03.05.2023</date> + </p> + </editorialDecl> + </encodingDesc> + <profileDesc> + <creation>Einreichung als Artikel der Zeitschrift für digitale + Geisteswissenschaften</creation> + <langUsage> + <language ident="de">Text in Deutsch</language> + <language ident="de">Abstract in Deutsch</language> + <language ident="en">Abstract in Englisch</language> + </langUsage> + <textClass> + <keywords scheme="gnd"> + + <term>Auslassung<ref target="4359960-6"/></term> + <term>Datenbank<ref target="4011119-2"/></term> + <term>Kunstgeschichte<ref target="4138803-3"/></term> + <term>Provenienzforschung<ref target="7697228-8"/></term> + + </keywords> + </textClass> + </profileDesc> + <revisionDesc> + <change/> + </revisionDesc> + </teiHeader> + <text> + <body> + <div> + <div type="abstract"> + <argument xml:lang="de"> + <p>Die Arbeit mit Datenbanken ist Teil des Alltags vieler Kunsthistoriker*innen + und Provenienzforscher*innen. Dabei werden sie nicht nur mit dem Anwesenden, + sondern auch mit dem Abwesenden konfrontiert. Der folgende Beitrag widmet sich + der digitalen Lücke im Kontext der Kunstgeschichte und Provenienzforschung und + fragt nach Arten und Ursachen. Auf Basis einer Studie verschiedener Datenbanken + und einer digitalen Methode werden Arten digitaler Lücken identifiziert und in + einer (erweiterbaren) Typologie festgehalten. Im Anschluss werden die Ursachen + problematisiert, wobei festgestellt werden soll, ob die Lücken auf bereits + lückenhafte analoge Bestände oder tatsächlich auf digitale Methoden oder andere + Faktoren zurückzuführen sind. Eine wesentliche Erkenntnis besteht darin, dass + vor allem fehlende Ressourcen digitale Lücken generieren. Abschließende + Gedanken greifen die Fragen auf, warum eine Auseinandersetzung mit Lücken vor + allem im Digitalen wichtig ist und ob die Lücke auch positive Qualitäten hat. + </p> + </argument> + </div> + <div type="abstract"> + <argument xml:lang="de"> + <p>Art historians and provenance researchers use databases almost daily. By doing + so, they are not only confronted with what is present but also with what is + missing. The following article studies digital gaps in the context of art + history and provenance research and specifically asks for types and causes. + Based on a study of various databases and a digital method, types of digital + gaps are identified and recorded in an (expandable) typology. In the following + section, the article addresses causes for gaps to determine if they are a + result of already incomplete analog sources, digital methods or other factors. + A key finding is that missing resources generate gaps. The article concludes + with a discussion of the importance of gaps in the digital space, and whether + gaps can have positive qualities as well. </p> + </argument> + </div> + <div type="chapter"> + <head>1. Einführung in die ›digitale Lücke‹</head> + <p>Um mehr über die Geschichte eines Gegenstandes zu erfahren, bedient sich die + Provenienzforschung<note type="footnote">Provenienzforschung zielt auf die + Klärung der Herkunft eines Objekts und dessen Besitzverhältnisse ab und + untersucht zudem, unter welchen Bedingungen ein Besitzwechsel stattgefunden + hat. Sie findet in verschiedenen Kontexten statt, dazu gehört der NS-Kunstraub, + aber auch Kulturgutentziehungen in der Sowjetischen Besatzungszone (SBZ) und + DDR oder Sammlungsgut aus kolonialen Kontexten (vgl. <ref type="bibliography" + target="#kulturgutverluste_2022">Deutsches Zentrum Kulturgutverluste et al. + 2019</ref>, S. 6; <ref type="bibliography" target="#haase_einfuehrung_2022" + >Haase / Hopp 2022</ref>, S. 6). </note> unterschiedlicher Methoden, dazu + gehören die Untersuchung des Objektes oder Recherchen in Datenbanken. Da + Institutionen wie Museen, Bibliotheken oder Archive ihre Bestände und + weiterführende Informationen zunehmend online stellen und diese somit schnell und + ortsunabhängig zugänglich sind, besitzen Datenbanken eine enorme Relevanz für die + Provenienzforschung. Eine wichtige Quelle ist die <bibl> + <title type="desc">Datenbank ›Entartete Kunst‹</title> + </bibl>, die all diejenigen Werke verzeichnet, die von den Nationalsozialisten + vorwiegend in den Jahren 1937 / 1938 in deutschen Museen beschlagnahmt + wurden.<note type="footnote">Vgl. <ref type="bibliography" + target="#fek_datenbank_2010">Forschungsstelle ›Entartete Kunst‹ (Hg.) + 2010</ref>. </note> Wer die Provenienz eines Werkes von Max Beckmann + (1884–1950) prüft, wird auch diese Quelle konsultieren, da seine Werke von den + Nationalsozialisten als <quote>entartet</quote> diffamiert wurden.<note + type="footnote">Zehn Gemälde Beckmanns waren im Juli 1937 in der Ausstellung <bibl> + <title type="desc">Entartete Kunst</title> + </bibl> in München zu sehen (vgl. <ref type="bibliography" + target="#schmeisser_beckmann_2021">Schmeisser 2021</ref>). </note> Eine + Suche im Künstlerfeld nach »Max Beckmann« liefert 685 Treffer. Auf den ersten + Blick ist sichtbar, dass für einige Werke keine Abbildungen vorhanden sind; + stattdessen treten Platzhalter mit den Vermerken <quote>Keine Abbildung</quote> + und <quote>Abbildung in der Forschungsstelle vorhanden</quote>.<note + type="footnote">Vgl. <ref type="bibliography" target="#fek_datenbank_2010" + >Forschungsstelle ›Entartete Kunst‹ (Hg.) 2010</ref>. Die Anzahl der Treffer + entspricht dem Stand am 27. Oktober 2022. </note> Abbildungslücken, wie die + hier beschriebenen, sind im Netz zahlreich und äußerst problematisch für die + Provenienzforschung. Sie erschweren das Studium der Objekte und behindern eine + eindeutige Objektidentifikation, die eine wesentliche Voraussetzung für eine + erfolgreiche Recherche ist.</p> + <p>Das Beispiel Beckmann benennt eine Art der Lücke im Digitalen und zeigt, dass + diese entweder nur hier (Datenbank) auftritt oder auch im Analogen existiert. Es + verdeutlicht zudem, wie problematisch die digitale Lücke für die Forschung sein + kann und weshalb das Thema eine große Relevanz hat. Der folgende Beitrag geht + deshalb der Frage nach, welche Arten digitaler Lücken es im Kontext der + Kunstgeschichte und Provenienzforschung gibt.<note type="footnote">Gründe für den + Fokus: Zunächst besteht hierin der Forschungsschwerpunkt der Autorin. Zudem + greifen Forschende beider Disziplinen für ihre Arbeit auf Datenbanken zurück, + die Lücken beinhalten, z. B. in Form von Abbildungslücken. Letztlich ist eine + Thematisierung der Lücke vor allem in der Provenienzforschung unbedingt + notwendig (vgl. <ref type="bibliography" target="#dzk_leitfaden_2019">Deutsches + Zentrum Kulturgutverluste et al. 2019</ref>, S. 83–84). </note> Der Beitrag + zeigt auf, dass das Digitale unterschiedliche Lücken bereithält, die viele + Ursachen haben. Ich argumentiere, dass digitale Lücken nicht nur auf + unvollständige analoge Bestände zurückzuführen sind, sondern auch aufgrund + digitaler Methoden und anderer Faktoren entstehen. Nach der Beschreibung der + Methodik folgt zunächst die Darlegung des Forschungsstandes und die Einordnung des + Beitrags (vgl. <ref type="intern" target="#hd2">Kapitel 2</ref>). Der + anschließende Teil widmet sich den Arten digitaler Lücken in der Kunstgeschichte + und Provenienzforschung mit dem Ziel der Entwicklung einer Typologie (vgl. <ref + type="intern" target="#hd3">Kapitel 3</ref>). Im Anschluss erfolgt eine + Auseinandersetzung mit den Ursachen der Lücken; hier wird im Besonderen gefragt, + ob die Fehlstelle auf die analogen Bestände oder auf andere Ursachen + zurückzuführen ist (vgl. <ref type="intern" target="#hd12">Kapitel 4</ref>). Daran + anschließend erfolgt die Darlegung einer Definition der digitalen Lücke (vgl. <ref + type="intern" target="#hd13">Kapitel 5</ref>). Im folgenden Teil werden daran + anschließende Gedanken erörtert: Warum ist eine Auseinandersetzung mit Lücken vor + allem im Digitalen wichtig (vgl. <ref type="intern" target="#hd15">Kapitel + 6.1</ref>)? Und kann die Lücke auch positive Qualitäten haben (vgl. <ref + type="intern" target="#hd16">Kapitel 6.2</ref>)? Der Schluss enthält eine + Zusammenfassung der Ergebnisse und benennt Folgeforschung (vgl. <ref type="intern" + target="#hd17">Kapitel 7</ref>).</p> + <p>Kunsthistoriker*innen und Provenienzforscher*innen arbeiten zunehmend mit + digitalen Daten, Datenbanken, Methoden und Werkzeugen und sind an deren + Entwicklung beteiligt. Da das Digitale zahlreiche Lücken in unterschiedlicher + Gestalt bereithält – wie nachfolgende Ausführungen zeigen werden –, sind + Forschende in gesteigertem Maße mit digitalen Lücken konfrontiert. Diese zu + identifizieren, einzuordnen, zu bewerten und zu vermitteln sind deshalb wichtige + Fähigkeiten des Forschenden. Mit der Bearbeitung des Themas ›digitale Lücke‹ + möchte der Beitrag für die Präsenz von Lücken im digitalen Raum sensibilisieren + und eine weitere wissenschaftliche Bearbeitung anstoßen, die über die + Kunstgeschichte und Provenienzforschung hinausgeht. Eine Auseinandersetzung mit + der digitalen Lücke und ihren Ursachen ist gerade jetzt wichtig, da die Produktion + digitaler Daten und die Entwicklung digitaler Methoden konstant voranschreitet und + zudem verschiedene Initiativen wie NFDI4Memory<note type="footnote">NFDI4Memory + ist eines von mehreren Konsortien innerhalb der Nationalen + Forschungsdateninfrastruktur (NFDI), die <quote>[…] wertvolle Datenbestände von + Wissenschaft und Forschung für das gesamte deutsche Wissenschaftssystem + systematisch [erschließt], vernetzt und nachhaltig sowie qualitativ nutzbar + [macht]</quote> (Nationale Forschungsdateninfrastruktur (NFDI); vgl. <ref + type="bibliography" target="#nfdifm_2022">NFDI for Memory</ref> + (NFDI4Memory)). </note> Standards für historische Forschungsdaten definieren + und etablieren. </p> + <p>Die Festlegung von Arten und Ursachen digitaler Lücken erfolgt durch die Studie + verschiedener Datenbanken und einer digitalen Methode. Hierbei kann nur eine + Auswahl untersucht werden, die allerdings wesentliche und übergreifende Muster + aufzeigt und deshalb repräsentativ für andere stehen kann. Die Auswahl erfolgt mit + Blick auf die für den Beitrag gewählten fachlichen Schwerpunkte, nämlich + Kunstgeschichte und Provenienzforschung, und favorisiert demnach Datenbanken und + Methoden, mit denen in der Community bevorzugt gearbeitet wird. Im folgenden Teil + <ref type="intern" target="#hd3">Was ist die ›digitale Lücke‹?</ref> wird die + Auswahl gelistet und erläutert. </p> + </div> + <div type="chapter"> + <head>2. Forschungsstand</head> + <p>Eine initiale Literaturrecherche verdeutlicht die interdisziplinäre Bearbeitung + des Themas ›Lücke‹ sowie ihre unterschiedlichen Erscheinungsformen: In Romanen + tritt sie in Form von Leerstellen auf und markiert dort z. B. etwas + Unausgesprochenes, das von Lesenden antizipiert werden muss und diese deshalb zur + Mitarbeit auffordert.<note type="footnote">Vgl. <ref type="bibliography" + target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 153–156.</note> + Die Mediävistik verwendet den Begriff <term type="dh">Deperdita</term> für nicht + (mehr) überlieferte Dokumente, <quote>[…] deren Inhalt aber aus anderen Quellen + oder Kontexten rekonstruierbar ist.</quote> + <note type="footnote">Vgl. <ref type="bibliography" + target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note> + Nennenswert ist zudem die vielfältige Auseinandersetzung mit dem Thema der Lücke + in den Archivwissenschaften, z. B. in Bezug auf den Vorgang der Kassation.<note + type="footnote">Vgl. <ref type="bibliography" target="#farrenkopf_logik_2021" + >Farrenkopf et al. 2021</ref>, S. 11; <ref type="bibliography" + target="#schenk_aufheben_2013">Schenk 2013</ref>; <ref type="bibliography" + target="#schaeffler_networks_2022">Schäffler et al. 2022</ref>; <ref + type="bibliography" target="#ul_kassation_2023">Was ist eigentlich + ›Kassation‹? 2023</ref>.</note> Schließlich wird die Lücke auch in den + Naturwissenschaften behandelt, in der Statistik z. B. in Form fehlender + Daten.<note type="footnote">Vgl. <ref type="bibliography" + target="#little_analysis_2019">Little / Rubin 2020</ref>.</note> Der nun + folgende Überblick über den Forschungsstand konzentriert sich auf ausgewählte, für + den Beitrag relevante thematische Schwerpunkte.</p> + <p>Lücken in der Kunstgeschichte und Provenienzforschung: Das an- und abwesende + Objekt ist ein wichtiges Forschungsthema in der Kunstgeschichte. Die 2012 + erschienene Konferenzschrift The Challenge of the Object widmet sich dem Objekt + ganzheitlich. Die Beiträge befassen sich u. a. mit Begriffen wie Kopie, Original + und Aura; auch der Abwesenheit des Objekts und der Leere wird ein Kapitel + gewidmet.<note type="footnote"> Vgl. <ref type="bibliography" + target="#grossmann_challenge_2012">Großmann / Krutisch 2012 / 2013</ref>. + </note> Das abwesende Objekt ist unweigerlich mit Verlustgeschichten verbunden: Im + Kontext der Provenienzforschung sind deshalb Beiträge zu nennen, die sich explizit + mit Kulturgutverlusten als Resultat von Enteignungen, Beschlagnahmungen, Raub oder + Kriegen befassen.<note type="footnote">Vgl. <ref type="bibliography" + target="#deinert_enteignet_2022">Deinert et al. 2022</ref>; <ref + type="bibliography" target="#kaiser_gedaechtnis_2021">Kaiser-Schuster + 2021</ref>; <ref type="bibliography" target="#schawe_verluste_2019">Schawe + 2019</ref>.</note> Zudem wird vor allem der Umgang und die Bewertung von + Lücken<note type="footnote">Vgl. <ref type="bibliography" + target="#geldmacher_luecken_2022">Geldmacher / Kulbe 2022</ref>. </note> + oder die Vermittlung von Provenienzinformationen und Forschungsergebnissen im + Digitalen thematisiert.<note type="footnote">Vgl. <ref type="bibliography" + target="#tuernich_provenienzforschung_2019">Türnich 2019</ref>.</note> + Dorothee Haffner hat sich außerdem intensiv mit Webseiten von Museen, musealen + online Sammlungen und der Abbildung von Provenienzen beschäftigt.<note + type="footnote">Vgl. <ref type="bibliography" + target="#haffner_provenienzen_2020">Haffner 2020</ref>; <ref + type="bibliography" target="#haffner_provenienzforschung_2019">Haffner + 2019</ref>.</note> Auch das Fragment, als besondere Art der Lücke in der + Kunst oder Architektur, wird in der kunsthistorischen Forschung bearbeitet.<note + type="footnote"> Vgl. <ref type="bibliography" target="#daraban_figuren_2017" + >Daraban 2017</ref>. </note> Aktuelle Beiträge befassen sich auch mit dem + Mehrwert digitaler Technologien für die Rekonstruktion, Präsentation und + Restaurierung des fragmentarischen Objekts.<note type="footnote">Vgl. <ref + type="bibliography" target="#schaedler_fragment_2021">Schädler-Saub + 2021</ref>.</note> Eine weitere besondere Art der Lücke sind Kunstwerke, die + nie fertiggestellt wurden. Auch diese unvollendeten künstlerischen Zeugnisse + stehen im Fokus des kunsthistorischen Interesses.<note type="footnote">Vgl. <ref + type="bibliography" target="#steinaecker_ende_2021">Steinaecker 2021</ref>. + </note> Daran anschließend beschäftigen sich aktuelle Publikationen und Projekte + auch mit der Frage, was es bedeutet, über Objekte zu schreiben, die nicht mehr + existieren.<note type="footnote">Vgl. <ref type="bibliography" + target="#fricke_destroyed_2022">Fricke / Kumler 2022</ref>; <ref + type="bibliography" target="#mpi_decay_2022">Decay, Loss, and Conservation + in Art History 2022</ref>. </note> Der Umgang mit beschädigten, verlorenen + oder nicht archivierbaren Objekten spielt hierbei eine Rolle, wobei im Besonderen + auf Potenziale und Herausforderungen digitaler Technologien eingegangen wird.<note + type="footnote">Vgl. <ref type="bibliography" target="#mww_verschwinden_2022" + >Forschungsverbund Marbach Weimar Wolfenbüttel 2022</ref>. </note> Im + musealen Kontext tritt die Lücke in Form von Leerstellen in Ausstellungsräumen in + Erscheinung; Fragen nach dem, was nicht gezeigt wird oder generell fehlt, werden + aufgegriffen und beziehen sich auch auf fehlende (Ausstellungs-) Narrative, + Methoden und Akteur*innen.<note type="footnote">Vgl. <ref type="bibliography" + target="#edenheiser_missing_2021">Edenheiser et al. 2021</ref>.</note> + </p> + <p>Unsicherheit und Unschärfe: Eine Beschäftigung mit der Lücke führt unweigerlich zu + den Begriffen Unsicherheit und Unschärfe. Beide können im Rahmen des Beitrags + nicht berücksichtigt werden; die in der Fußnote genannte Literatur gibt aber einen + Überblick über Beiträge aus unterschiedlichen Disziplinen, die sich mit beiden + Begriffen beschäftigen.<note type="footnote">Vgl. <ref type="bibliography" + target="#ullrich_geschichte_2009">Ullrich 2009</ref> ; <ref + type="bibliography" target="#freitag_unschaerfe_2018">Freitag et al. + 2018</ref>; <ref type="bibliography" target="#syropoulos_vagueness_2021" + >Syropoulos / Papadopoulos 2021</ref> ; <ref type="bibliography" + target="#bacon_vagueness_2018">Bacon 2018</ref>; <ref type="bibliography" + target="#syropoulos_introduction_2020">Syropoulos / Grammenos 2020</ref>; + <ref type="bibliography" target="#hannemann_beruecksichtigung_2010" + >Hannemann 2010</ref>.</note> + </p> + <p>Objekte und Lücken im Digitalen: Das Thema der Lücke spielt in den <term type="dh" + >Digital Humanities</term> z. B. in Form von Datenlücken und Datenbias eine + Rolle.<note type="footnote">Vgl. <ref type="bibliography" + target="#criado_frauen_2020">Criado-Perez / Singh 2020</ref>; <ref + type="bibliography" target="#ntoutsi_bias_2020">Ntoutsi et al. + 2020</ref>.</note> In der digitalen Provenienzforschung wird die Lücke auch im + Hinblick auf fehlende oder äußerst rudimentäre Provenienzinformationen in online + Sammlungen deutscher Museen behandelt.<note type="footnote">Vgl. <ref + type="bibliography" target="#haffner_provenienzforschung_2019">Haffner + 2019</ref>, S. 93.</note> Ein Bereich, der für diesen Beitrag zudem relevant + ist, sind Arbeiten, die sich mit der Dokumentation und Veröffentlichung von + Objekten im digitalen Raum befassen. Der Sammelband Objekte im Netz widmet sich + der Digitalisierung und Digitalität wissenschaftlicher Sammlungen. Beispiele aus + der Praxis stellen die digitale Dokumentation, Darstellung und Visualisierung von + Objektsammlungen vor und thematisieren rechtliche und ethische Probleme, die bei + der Sammlungsdigitalisierung entstehen.<note type="footnote">Vgl. <ref + type="bibliography" target="#andraschke_objekte_2020">Andraschke / Wagner + 2020</ref>, S. 9–12, sowie allgemein <ref type="bibliography" target="#andraschke_hg_objekte_2020">Andraschke / Wagner (Hg.)</ref> 2020.</note> Auch die + Datenmodellierung spielt hierin eine Rolle<note type="footnote">Vgl. <ref + type="bibliography" target="#nasarek_forschungsumgebung_2020">Nasarek + 2020</ref>. </note>; dieser methodische Ansatz der Wissensstrukturierung + wird neben einer grundsätzlichen Modellierung ausführlich in der Informatik + besprochen und auch im Kontext historischer Forschung aufgegriffen.<note + type="footnote">Vgl. <ref type="bibliography" + target="#kastens_modellierung_2018">Kastens / Kleine Büning 2018</ref>; <ref + type="bibliography" target="#staud_datenmodellierung_2005">Staud 2005</ref>; + <ref type="bibliography" target="#wintergruen_netzwerkanalysen_2019" + >Wintergrün 2019</ref>. </note> + </p> + <p>Eine Auseinandersetzung mit der Objektpräsentation im Netz ist eingebettet in eine + grundsätzliche Debatte über die Bedeutung der Digitalisierung und digitaler + Methoden für Kultureinrichtungen: In <bibl> + <title type="desc">Museen digital</title> + </bibl> zeigt Hubertus Kohle anhand ausgewählter Beispiele auf, wie Museen sich + dem Digitalen nähern und digitale Möglichkeiten für z. B. die + Informationsvermittlung oder Nutzer*innenbeteiligung verwenden.<note + type="footnote">Vgl. <ref type="bibliography" target="#kohle_museen_2018">Kohle + 2018</ref>. </note> In den letzten Jahren wurden zudem zahlreiche Leitfäden + und Handreichungen veröffentlicht, die Richtlinien für die standardisierte + Objektdokumentation oder Erfassung und Veröffentlichung von Metadaten zu + Kulturobjekten enthalten; hinzukommen praktische Empfehlungen für die Produktion + und Verwendung von Daten in Museen.<note type="footnote">Vgl. <ref + type="bibliography" target="#dmb_leitfaden_2011">Deutscher Museumsbund e. V. + 2011</ref>; <ref type="bibliography" target="#knaus_lido_2019">Knaus et al. + 2019</ref>; <ref type="bibliography" target="#knaus_lido_2022">Knaus et al. + 2022</ref>; <ref type="bibliography" target="#luther_digitization_2022" + >Luther 2022</ref>.</note> + </p> + <p>Kategorisierung von Lücken: Der vorliegende Beitrag entwickelt anhand der + abgeleiteten digitalen Lücken eine Typologie und kann dabei auf Arbeiten + zurückgreifen, die bereits Kategorisierungen für verwandte Begriffe vorgeschlagen + haben.<note type="footnote">Vgl. <ref type="bibliography" + target="#schneider_kriegsverluste_2013">Schneider 2013</ref>, S. 8.</note> + Von besonderer Relevanz ist der 2019 erschienene Beitrag zu Quellenverlusten von + Stefan Münnich, der u. a. eine Kategorisierung von Quellenverlusten enthält.<note + type="footnote">Vgl. <ref type="bibliography" + target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note> Münnichs + Beitrag ist zudem wichtig, da er sich mit der Modellierung von Deperdita und + Verneinungen auseinandersetzt und dabei die digitale Abbildung der Lücke in den + Blick nimmt: </p> + <p> + <quote type="grosszitat">Wie können nun aber nicht (mehr) vorhandene musikalische Quellen und + Schriften so modelliert werden, dass sie im Zusammenhang digitaler + Editionen, Kataloge oder Repertorien zugleich als Quelle, aber eben auch als + Verlust greifbar und verarbeitbar sind? Wie kann ein digitales Objekt, das + existiert, Instanz von etwas sein, dass [sic] nicht (mehr) + existiert?</quote><note type="footnote"><ref type="bibliography" + target="#muennich_quellenverluste_2019">Münnich 2019</ref>.</note> + </p> + <p>Der hier vorliegende Beitrag will durch die Studie verschiedener Datenbanken und + einer Methode digitale Lücken identifizieren und Ursachen benennen. Er kann + deshalb den Forschungsarbeiten zugeordnet werden, die sich mit möglichen analogen + Lücken in der Kunstgeschichte und Provenienzforschung und der Veröffentlichung von + Objekten im Netz befassen. Zudem bestehen direkte Verbindungen zu Arbeiten, die + bereits Kategorien für Lücken oder verwandte Phänomene vorgeschlagen haben. Eine + umfassende und explizite Auseinandersetzung mit der digitalen Lücke im Kontext der + Kunstgeschichte und Provenienzforschung hat bisher aber nicht stattgefunden, + vorhandene Beiträge beschränken sich zumeist auf den analogen Bereich oder + spezifische Fälle.<note type="footnote">Vgl. <ref type="bibliography" + target="#steinaecker_ende_2021">Steinaecker 2021</ref>; <ref + type="bibliography" target="#edenheiser_missing_2021">Edenheiser et al. + 2021</ref>.</note> Auch die Frage nach der Ursache digitaler Lücken wurde + bisher nicht in diesem Ausmaß gestellt und beantwortet. Einen wichtigen und + genuinen Beitrag zum aktuellen Forschungsstand leistet der Beitrag durch die + Entwicklung einer Typologie und einer tiefergehenden Auseinandersetzung mit der + digitalen Lücke durch anschließende Fragestellungen. </p> + </div> + <div type="chapter"> + <head>3. Was ist die ›digitale Lücke‹?</head> + <p>Das Ziel dieses Abschnitts ist die Entwicklung einer Typologie der digitalen + Lücken (vgl. <ref type="graphic" target="#luecke_006">Abbildung 6</ref>). Dafür werden + verschiedene Datenbanken und eine digitale Methode untersucht. Bei den Datenbanken + handelt es sich um Bildarchive und andere Objektdatenbanken, die von Forschenden + aus der Kunstgeschichte und Provenienzforschung verwendet werden. Hinzukommen + online Sammlungen verschiedener deutscher Museen, die Abbildungen und + weiterführende Informationen zu den Objekten bereithalten und eine gewisse Varianz + hinsichtlich der Präsentation zeigen. Folgende Datenbanken wurden ausgewählt: <bibl> + <title type="desc">Prometheus</title> + </bibl> + <note type="footnote">Vgl. <ref type="bibliography" target="#kik_prometheus_2022" + >Kunsthistorisches Institut der Universität zu Köln (Hg.) 2022</ref>. + </note>, der <bibl> + <title type="desc">Bildindex der Kunst & Architektur</title> + </bibl> (<bibl> + <title type="desc">Bildindex</title> + </bibl>)<note type="footnote">Vgl. <ref type="bibliography" + target="#ddk_bildindex_2022">Deutsches Dokumentationszentrum für + Kunstgeschichte (Hg.) 2022</ref>.</note>, <bibl> + <title type="desc">Lost Art</title> + </bibl> + <note type="footnote">Vgl. <ref type="bibliography" target="#sdzk_art_2000" + >Stiftung Deutsches Zentrum Kulturgutverluste (Hg.) 2000a</ref>.</note>, die <bibl> + <title type="desc">Datenbank zum ›Central Collecting Point München‹</title> + </bibl> (<bibl> + <title type="desc">Datenbank CCP</title> + </bibl>)<note type="footnote">Vgl. <ref type="bibliography" + target="#dhm_datenbank_2009">Deutsches Historisches Museum (Hg.) 2009</ref>. + </note> und die Sammlungen des Frankfurter Städel Museums<note type="footnote" + >Vgl. <ref type="bibliography" target="#staedel_digisammlung_2023">Städelsches + Kunstinstitut (Hg.) 2023b</ref>.</note>, der Bayerischen + Staatsgemäldesammlungen (BStGS)<note type="footnote">Vgl. <ref type="bibliography" + target="#bsgs_sammlung_2022">Bayerische Staatsgemäldesammlungen (Hg.) + 2022</ref>. </note>, des Germanischen Nationalmuseums<note type="footnote" + >Vgl. <ref type="bibliography" target="#gnm_objektkatalog_2023">Germanisches + Nationalmuseum (Hg.) 2023a</ref>.</note> in Nürnberg und der Staatlichen + Kunstsammlungen Dresden (SKD)<hi rend="italic">.</hi> + <note type="footnote">Vgl. <ref type="bibliography" target="#skd_online_2023" + >Staatliche Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Im + Hinblick auf digitale Methoden muss die Auswahl sehr lückenhaft bleiben; so + konzentriert sich der Beitrag ausschließlich auf die Datenmodellierung und wird + das lückengenerierende Potenzial anhand des sogenannten <bibl> + <title type="desc">CIDOC Conceptual Reference Model</title> + </bibl> (<bibl> + <title type="desc">CIDOC CRM</title> + </bibl>) aufzeigen. </p> + <div type="subchapter"> + <head>3.1 Digitale Lücken in Datenbanken</head> + <p>Die Arbeit mit Datenbanken ist ein fester Bestandteil geisteswissenschaftlicher + Arbeit; die Suche nach Abbildungen für die Illustration eigener Publikationen + oder Präsentationen gehört ebenso dazu wie die Suche nach Informationen über + das zu untersuchende Objekt. Dabei offenbaren sich digitale Lücken, die in den + folgenden Abschnitten benannt werden. Die folgende Liste ist nicht vollständig, + sondern soll als ›work in progress‹ zur Erweiterung auffordern. </p> + <div type="subchapter"> + <head>3.1.1 Abbildungslücken</head> + <p>Die meisten Datenbanken – nicht nur in der Kunstgeschichte und + Provenienzforschung – enthalten Abbildungslücken: Die Suche nach »Max + Beckmann« in der <bibl> + <title type="desc">Datenbank ›Entartete Kunst‹ </title> + </bibl>hat dies verdeutlicht und zwei Arten von Abbildungslücken aufgezeigt. + Fehlende Abbildungen sind dabei nicht nur ein Resultat lückenhafter analoger + Bestände, sondern können auch nur ein Phänomen des Digitalen sein. Die + Visualisierung von fehlenden Objektabbildungen erfolgt (noch) nicht + standardisiert. <ref type="graphic" target="#luecke_001">Abbildung 1</ref> + und <ref type="graphic" target="#luecke_002">Abbildung 2</ref> zeigen + beispielhaft, wie Abbildungslücken in Datenbanken dargestellt werden. Die + Ursachen hierfür sind nicht sofort sichtbar: Die BStGS verweisen darauf, + dass <quote>[d]ie digitale Darstellung […] aktuell nicht verfügbar + [ist]</quote>, näheres erfährt man erst in der Objektansicht. Das + Copyright-Symbol, das sich unter dem Platzhalter befindet, informiert über + den rechtlichen Status. Eine Studie von Max Beckmann aus dem Jahr 1900 + unterliegt beispielsweise der Creative-Commons Lizenz 4.0, welche das Teilen + und Adaptieren der Abbildung erlaubt.<note type="footnote">Vgl. <ref + type="bibliography" target="#bsg_beckmann_2023">Beckmann, + Bildnisstudie Martha Beckmann im Profil nach links</ref>; <ref + type="bibliography" target="#cc_sa_2023">Creative-Commons, + Attribution-ShareAlike 4.0 International (CC BY-SA 4.0)</ref>.</note> + Die Abbildungslücke muss deshalb einen anderen Grund haben. Die Abbildung + der <bibl> + <title type="desc">Max-Beckmann-Medaille</title> + </bibl> des ungarischen Künstlers István Béla Farkas (1915–2005) fehlt + hingegen, da die <quote>Bildrechte beim Rechteinhaber</quote> + <note type="footnote">Vgl. <ref type="bibliography" + target="#bsg_istvan_2023">Farkas, Max-Beckmann-Medaille</ref>.</note> + liegen. Laut Gesetz erlischt das Urheberrecht erst siebzig Jahre nach dem + Tod des Urhebers; da Farkas erst 2005 verstorben ist, bestehen an der Arbeit + weiterhin urheberrechtliche Ansprüche (§ 64 UrhG). Die Abbildungslücken für + die gezeigten Werke Beckmanns im Bildindex haben im Übrigen andere Gründe: + Als die Objekte in der Datenbank erfasst wurden, standen keine Aufnahmen zur + Verfügung.<note type="footnote">Vgl. Information entstammt einer E-Mail, + die die Autorin am 23. Februar 2023 vom Bildindex auf eine Anfrage hin + erhalten hat.</note> + </p> + <figure> + <graphic xml:id="luecke_001" url=".../medien/luecke_001.png"> + <desc> + <ref type="graphic" target="#abb1">Abb. 1</ref>: Abbildungslücken in + der Online-Sammlung der BStGS. Ausschnitt aus der Ergebnisliste für + die Suche mit ›Max Beckmann‹. [Quelle: <ref type="bibliography" + target="#bsgs_sammlung_2022">Bayerische Staatsgemäldesammlungen + (Hg.) 2022</ref>]<ref type="graphic" target="#luecke_001"/> + </desc> + </graphic> + </figure> + <figure> + <graphic xml:id="luecke_002" url=".../medien/luecke_002.png"> + <desc> + <ref type="graphic" target="#abb2">Abb. 2</ref>: Abbildungslücken im + Bildindex. Ausschnitt aus der Ergebnisliste für die werkbezogene Suche + mit ›Max Beckmann‹. [Quelle: <ref type="bibliography" + target="#ddk_bildindex_2022">Deutsches Dokumentationszentrum für + Kunstgeschichte (Hg.) 2022</ref>]<ref type="graphic" + target="#luecke_002"/> + </desc> + </graphic> + </figure> + <p>Die <bibl> + <title type="desc">Datenbank zum ›Central Collecting Point + München‹</title> + </bibl> enthält Digitalisate verschiedener Karteikartenreihen, die im + Münchner Collecting Point von den Alliierten nach dem Zweiten Weltkrieg + angelegt wurden und die die Objekte aus den verschiedenen Sammeldepots der + Nationalsozialist*innen dokumentieren und näher beschreiben.<note + type="footnote">Vgl. <ref type="bibliography" + target="#kocourek_leitfaden_2019">Kocourek et al.</ref>, S. 2.</note> + Auch die <bibl> + <title type="desc">Datenbank CCP München</title> + </bibl> enthält Abbildungslücken, so z. B. in der Karteikartenreihe, die die + Abgaben an die Jewish Restitution Successor Organization (JRSO) verzeichnet. + Fehlende Scans von Karteikarten werden durch einen schwarzen Platzhalter mit + dem Hinweis <quote>kein Bild</quote> ersetzt.<note type="footnote">Vgl. <ref + type="bibliography" target="#dhm_datenbank_2009">Deutsches + Historisches Museum (Hg.) 2009</ref><hi rend="italic">. </hi>Eine + Suche mit der Münchner-Nummer 1780 in der Kartei JRSO zeigt eine solche + Abbildungslücke. </note> Die Datenbank <bibl> + <title type="desc">CCP</title> + </bibl> enthält eine weitere Abbildungslücke; um Speicherkapazitäten + einzusparen, wurden leere Rückseiten von Karteikarten aus dem Bundesarchiv + nicht gescannt. Stattdessen wird der Vermerk <quote>keine + Eintragungen</quote> verwendet.<note type="footnote">Vgl. <ref + type="bibliography" target="#enderlein_datenbank_2023">Enderlein / + Flacke</ref>.</note> Beispiele hierfür finden sich in der + Kontrollnummernkartei, so etwa für die Münchner-Nummern 2/1-2 oder 48.<note + type="footnote">Vgl. <ref type="bibliography" + target="#dhm_datenbank_2009">Deutsches Historisches Museum (Hg.) + 2009</ref>.</note> Im Kontext dieser Datenbank mögen die fehlenden + Rückseiten weniger problematisch sein, da sie keine weiteren + Objektinformationen enthalten. Das Beispiel verdeutlicht aber, dass das + Digitale oftmals nur eine Auswahl zeigt und fehlender Speicherplatz oder + eben auch rechtliche Restriktionen Gründe dafür sein können. Aufnahmen von + z. B. Gemälderückseiten fehlen tatsächlich in fast allen Datenbanken und + können deshalb grundsätzlich als Abbildungslücken verstanden werden. Gründe + hierfür sind zahlreich: Sie zeigen oftmals private Informationen und können + aufgrund von datenschutzrechtlichen Bestimmungen nicht gezeigt werden. + Weiter sind fehlender Speicherplatz oder fehlende Ressourcen für die + Digitalisierung zu benennen. </p> + <p>Für die Provenienzforschung sind fehlende Objektabbildungen besonders + problematisch, da sie eine eindeutige Identifikation und damit eine + (erfolgreiche) Recherche behindern. Die <bibl> + <title type="desc">Lost Art</title> + </bibl>-Datenbank, die Such- und Fundmeldungen von Kulturgütern verzeichnet, + die im Zuge der NS-Diktatur oder des Zweiten Weltkriegs beschlagnahmt, + enteignet oder verlagert wurden, verdeutlicht diese Problematik.<note + type="footnote">Vgl. <ref type="bibliography" target="#sdzk_ueber_2000" + >Stiftung Deutsches Zentrum Kulturgutverluste (Hg.) + 2000b</ref>.</note> Stand Januar 2023 verzeichnet die Datenbank 173.942 + Meldungen, wobei fast doppelt so viel Such- wie Fundmeldungen vorhanden + sind.<note type="footnote">Vgl. <ref type="bibliography" + target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste + (Hg.) 2000a</ref>. </note> In der Datenbank befinden sich zahlreiche + Abbildungslücken, die eine Objektidentifikation und damit die Feststellung + eines unrechtmäßigen Entzugs behindern. Eine Suche mit ›Beckmann‹ + verdeutlicht diese Abbildungslücke in <bibl> + <title type="desc">Lost Art</title> + </bibl>: 53 Meldungen werden gelistet, wobei nur für 8 Objekte Abbildungen + vorhanden sind.<note type="footnote">Vgl. <ref type="bibliography" + target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste + (Hg.) 2000a</ref>. Anzahl Treffer und Hinweise zu Abbildungen + entsprechen dem Stand der Datenbank am 14. Januar 2023. </note> Das + Beispiel <bibl> + <title type="desc">Lost Art</title> + </bibl> verdeutlicht, dass digitale Lücken eben auch auf bereits lückenhafte + analoge Bestände zurückzuführen sind.</p> + <p>Die Staatlichen Kunstsammlungen Dresden (SKD) haben sich dazu entschieden, + einige Abbildungen aufgrund ethischer Bedenken nicht in ihrer <bibl> + <title type="desc">Online Collection</title> + </bibl> darzustellen. Hintergrundinformationen finden sich in den <bibl> + <title type="desc">Ethischen Leitlinien der Online Collection</title> + </bibl>:<note type="footnote">Vgl. <ref type="bibliography" + target="#skd_leitlinien_2023">Ethische Leitlinien der Online + Collection 2023</ref>.</note> + </p> + <p> + <quote type="grosszitat">Wir möchten die Benutzer*innen der Datenbank darauf + hinweisen, dass einige Fotografien aus den Sammlungen der + ethnographischen Museen Forschung an Personen und Kulturen mit + wissenschaftlichen Methoden und Begrifflichkeiten des 19. und frühen 20. + Jahrhunderts widerspiegeln und damit Menschen auf eine Weise dargestellt + werden, die heute als verletzend angesehen werden kann. […] Wegen + ethischer Bedenken erscheinen einige Datensätze mit einem Platzhalter + anstelle einer Abbildung.</quote> + <note type="footnote"><ref type="bibliography" target="#skd_leitlinien_2023" + >Ethische Leitlinien der Online Collection 2023</ref>.</note> + </p> + <p>Auch in der Provenienzforschung werden Debatten über die Veröffentlichung + von historischem Material mit problematischen oder sensiblen Inhalten + geführt, vor allem in Bezug auf Kulturgüter aus kolonialen Kontexten oder + NS-Raubkunst. Es ist deshalb anzunehmen, dass Abbildungslücken aufgrund + ethischer Bedenken zukünftig noch zunehmen werden. Entscheidungen, bestimmte + Inhalte nicht zu zeigen, stehen dabei immer im Zwiespalt zwischen einer + moralischen Verantwortung und der Forderung nach Transparenz und + Zugänglichkeit des Materials.</p> + </div> + <div type="subchapter"> + <head>3.1.2 Begriffslücken</head> + <p>Die Veröffentlichung von historischen Begriffen im Netz hat nicht nur in der + deutschen Forschungsgemeinschaft zu einer Debatte über die Reproduktion + rassistischer und diskriminierender Begriffe im Digitalen geführt. In der + Kunstgeschichte und Provenienzforschung geschieht dies z. B. in Hinblick auf + Werktitel oder bestimmte historische Begrifflichkeiten. Im Kontext der + NS-Raubkunst sind dies z. B. Begriffe, die Ausdruck nationalsozialistischer + Ideologie sind und im heutigen Sprachgebrauch nicht mehr verwendet werden. + Datenbankbetreibende, die das historische Material und die darin enthaltenen + Begriffe veröffentlichen, müssen sich schließlich die Frage stellen, wie sie + mit problematischen Begriffen umgehen. Die SKD haben sich für ihre <bibl> + <title type="desc">Online Collection</title> + </bibl> dafür entschieden, historische Werktitel mit Anführungszeichnen zu + kennzeichnen und problematische Begriffe in Werktiteln oder Beschreibungen + durch Sternchen (****) zu ersetzen. Durch letzteren Vorgang entsteht im + Digitalen eine partielle Lücke. Der Forderung nach historischer Faktizität + wird dadurch begegnet, dass der*die Nutzer*in die Möglichkeit hat, in der + Objektansicht die Einblendung der Begriffe zu aktivieren.<note + type="footnote">Vgl. <ref type="bibliography" + target="#skd_leitlinien_2023">Ethische Leitlinien der Online + Collection 2023</ref>.</note> Ein Beispiel hierfür ist das Objekt <bibl> + <title type="desc">Taler</title> + </bibl> (<bibl> + <title type="desc">Speciestaler</title> + </bibl>, sogenannter <bibl> + <title type="desc">***kopftaler</title> + </bibl>);<note type="footnote">Vgl. <ref type="bibliography" + target="#skd_studer_2023">Studer, Taler (Speciestaler, sogenannter + ***kopftaler)</ref>.</note> nach dem Klick auf den Werktitel erscheint + ein weiteres Feld, das es dem Nutzenden erlaubt, die Ansicht zu ändern und + damit die digitale Lücke zu schließen (vgl. <ref type="graphic" + target="#luecke_003">Abbildung 3</ref>).</p> + + <figure> + <graphic xml:id="luecke_003" url=".../medien/luecke_003.png"> + <desc> + <ref type="graphic" target="#abb3">Abb. 3</ref>: Anzeige des + Disclaimers (nach Klick auf die Asterisken) auf einer Objektansicht + innerhalb der Online Collection der SKD. [Quelle: Johann Gotthelf + Studer (Münzmeister): Taler (Speciestaler, sogenannter ***kopftaler), + 1828, <ref type="bibliography" target="#skd_collection_2023" + >Staatliche Kunstsammlungen Dresden. Online Collection + 2023</ref>]<ref type="graphic" target="#luecke_003"/> + </desc> + </graphic> + </figure> + <p>Auch <bibl> + <title type="desc">Prometheus</title> + </bibl> hat sich dazu entschieden, bestimmte problematische Begriffe + auszublenden; zukünftig sollen weitere Begriffe – auch in anderen Sprachen – + hinzukommen.<note type="footnote">Vgl. <ref type="bibliography" + target="#kik_laura_2022">Laura 2023</ref>.</note> + </p> + <p> + <quote type="grosszitat">[W]ir haben uns bei der Anzeige auf erster Ebene + für eine Ausblendung in Form von anklickbaren Sternchen sowie für die + Anzeige eines Hinweises entschieden. […] Sie als Nutzer*innen können sich + jetzt auf der zweiten Ebene für eine Anzeige in diesem einen Fall oder + für eine Anzeige aller Begriffe während Ihrer gesamten Session + entscheiden. In diesem ersten Schritt werden automatisch vier + deutschsprachige diskriminierende Begriffe (I***, M***, N***, Z***) in + Titeln, Beschreibungen und bei den Schlagwörtern ausgeblendet.</quote> + <note type="footnote"><ref type="bibliography" target="#kik_laura_2022" + >Laura 2023</ref>. </note> + </p> + <p>Die SKD und <bibl> + <title type="desc">Prometheus</title> + </bibl> haben sich mit ihrer Entscheidung, problematische Begriffe + auszublenden, bewusst für eine digitale Lücke entschieden und damit eine + mögliche Umgangsart aufgezeigt. Die SKD verfolgen damit einen + <quote>didaktischen Ansatz, der die Historie des Begriffs nicht + ausblendet, sondern sie im Gegenteil sichtbar macht; da wird Bewusstsein + geschaffen.</quote> + <note type="footnote"><ref type="bibliography" target="#soltau_debatte_2021" + >Soltau 2021</ref>.</note> Beide Datenbanken nehmen damit – zumindest + in Deutschland – eine Vorreiterrolle ein. </p> + </div> + <div type="subchapter"> + <head>3.1.3 Informationslücken</head> + <p>Trotz der Informationsflut im digitalen Raum sind auch hier + Informationslücken zu finden.<note type="footnote">Die Ausführungen beziehen + sich nur auf Informationslücken, die im Digitalen oder zum Teil auch nur + an einer bestimmten Stelle im Digitalen vorkommen. Aufgrund des + thematischen Schwerpunkts werden Informationslücken, die auf eine bereits + fehlende Information im Analogen zurückgeführt werden können, + ausgeklammert. </note> Das <bibl> + <title type="desc">Prometheus</title> + </bibl> Bildarchiv hat dies exemplarisch aufgezeigt, indem bei der + Verwendung der Datenbank festgestellt wurde, dass nicht alle bekannten + Informationen aus der Ursprungsdatenbank übernommen wurden. Am Beispiel von + Ernst Ludwig Kirchners (1880–1938) <bibl> + <title type="desc">Cyclamen</title> + </bibl> (1918–1919) aus der Sammlung des Metropolitan Museum of Art (Met) in + New York lässt sich dies exemplarisch zeigen. Während in <bibl> + <title type="desc">Prometheus</title> + </bibl> die wesentlichen Informationen aufgenommen wurden, enthält der + entsprechende Objekteintrag in der <bibl> + <title type="desc">Online Collection</title> + </bibl> des Met weitere Informationen, die in <bibl> + <title type="desc">Prometheus</title> + </bibl> nicht abgebildet werden: eine Werkbeschreibung, Maßangaben, Hinweise + auf Inschriften und andere Markierungen, ausführliche Provenienzangaben, + Ausstellungsgeschichte oder Literaturangaben.<note type="footnote">Vgl. <ref + type="bibliography" target="#kik_kirchner_2023">Kirchner, Cyclamen, + Prometheus</ref>; <ref type="bibliography" target="#met_kirchner_2012" + >Kirchner, Cyclamen, The Met Collection</ref>. </note> Damit spiegelt + der Eintrag in <bibl> + <title type="desc">Prometheus</title> + </bibl> nicht den tatsächlichen Wissensstand wider und weist signifikante + Informationslücken auf. Gründe können an dieser Stelle nur spekuliert + werden: Das Met bietet für den Datenaustausch eine Schnittstelle an; aus der + Auflistung der für ein Objekt verfügbaren Metadaten wird ersichtlich, dass + zwar die Maßangaben, aber nicht die anderen identifizierten + Informationslücken abgerufen werden können.<note type="footnote">Vgl. <ref + type="bibliography" target="#met_collection_2020">The Metropolitan + Museum of Art Collection API</ref>.</note> Warum die Maßangaben für + Kirchners Gemälde aber in <bibl> + <title type="desc">Prometheus</title> + </bibl> fehlen, kann nicht geklärt werden. Möglich ist, dass die Datenfelder + beider Datenbanken nicht deckungsgleich sind und deshalb einige + Informationen nicht integriert werden können. </p> + <p>Auch Entscheidungen hinsichtlich welche Informationen in eine Datenbank + eingegeben werden sollen, können zu Informationslücken führen. So haben sich + die Verantwortlichen der Datenbank <bibl> + <title type="desc">CCP</title> + </bibl> dafür entschieden, <quote>[…] die Informationen der Sog. + Restitutionskartei nach Münchener Nummer […] für die Eingabe in die + Datenbank [abzuschreiben] […], da sich dort die umfangreichsten Angaben + zum jeweiligen Kunstwerk befinden. Über die Scans von den anderen + Karteikartenreihen, die dem Datensatz angefügt sind, lassen sich die + fehlenden Informationen […] ablesen.</quote> + <note type="footnote"><ref type="bibliography" + target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note> + Damit sind in den Datenfeldern nicht alle bekannten Informationen zum Werk + ersichtlich, wobei eine Differenz zwischen analogem und digitalem Wissen + besteht. Eine weitere Informationslücke, die nicht nur in den hier + vorgestellten Datenbanken zu beobachten ist, betrifft die (fehlenden) + Angaben zur Provenienz der Objekte. Obwohl Informationen zu Eigentums- und + Besitzverhältnissen oft auch im Analogen fehlen – also grundsätzlich + unbekannt sind –, ist die Abwesenheit von Provenienzangaben ein häufig zu + beobachtendes Phänomen im Digitalen. Gründe hierfür sind mannigfaltig und + reichen von einer bewussten Zurückhaltung der besitzenden Institutionen bis + hin zu technischen Limitationen der Datenbanksysteme.<note type="footnote" + >Vgl. <ref type="bibliography" target="#haffner_provenienzforschung_2019" + >Haffner 2019</ref>, S. 93, 95–96.</note> + </p> + </div> + <div type="subchapter"> + <head>3.1.4 Übersetzungslücken</head> + <p>Webseiten deutscher Museen und andere Datenbanken bieten Zugang zu Wissen + über Sammlungsobjekte, Künstler*innen oder Ausstellungen, unabhängig vom + Standort der Nutzenden. Bei der Verwendung verschiedener Seiten wird + allerdings eine Lücke deutlich, die den Zugang wiederum erheblich + einschränkt: Beim Wechsel von der deutschen in eine andere Sprachversion + fallen einige Inhalte weg; dies betrifft sowohl die Hauptseite als auch die + digitalen Objektsammlungen. Die SKD stellen neben Deutsch insgesamt zehn + weitere Sprachversionen für ihre Webseite zur Auswahl. Die Sprache kann in + einem Dropdown-Menü oben rechts verändert werden.<note type="footnote">Vgl. + <ref type="bibliography" target="#skd_2023">Staatliche Kunstsammlungen + Dresden</ref>. </note> Beim Wechsel in eine andere Sprache reduziert + sich der Inhalt allerdings merklich. Auch für die englische Seite ist dies + zu beobachten, wenn auch vergleichsmäßig wenig.<note type="footnote">Vgl. + <ref type="bibliography" target="#skd_eng_2023">Staatliche + Kunstsammlungen Dresden [englische Sprachversion] 2023</ref>.</note> + Obwohl auf der englischen Hauptseite der Inhalt fast vollständig vorhanden + ist, manifestiert sich eine signifikante Übersetzungslücke vor allem in + Bezug auf die <bibl> + <title type="desc">Online Collection</title> + </bibl>, die weiterhin auf Deutsch erscheint.<note type="footnote">Vgl. <ref + type="bibliography" target="#skd_online_2023">Staatliche + Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Eine + Möglichkeit ins Englische zu wechseln ist an dieser Stelle nicht + ersichtlich. Das Fehlen der englischen Version ist besonders für nicht + deutschsprachige Nutzer*innen problematisch, für welche die Inhalte + schlichtweg unverständlich sind. </p> + <p>Das Problem fehlender Übersetzungen betrifft fast alle deutschsprachigen + Datenbanken, das Ausmaß der Lücke variiert allerdings, vor allem für die + online Sammlungen der Museen. So existieren für einige Datenbanken überhaupt + keine englischen Versionen, z. B. für die <bibl> + <title type="desc">Online Collection</title> + </bibl> der SKD oder den <bibl> + <title type="desc">Objektkatalog</title> + </bibl> des GNM, während in anderen Datenbanken ein Großteil der + Informationen ins Englische übersetzt wird. Die Digitale Sammlung des + Städels besticht im Vergleich zu anderen musealen Bestandskatalogen im Netz + durch eine fast vollständige Übersetzung der Objektinformationen. Der + Datensatz für Max Beckmanns <bibl> + <title type="desc">Die Synagoge in Frankfurt am Main</title> + </bibl> (1919) zeigt dies exemplarisch; er enthält eine englische + Werkbeschreibung, Informationen zum Erwerb und weitere + Objektinformationen.<note type="footnote">Vgl. <ref type="bibliography" + target="#staedel_beckmann_2023">Beckmann, The Synagogue in Frankfurt + am Main</ref>.</note> Eine Ausnahme bilden die Provenienzangaben, die + weiterhin auf Deutsch erscheinen. Dies ist vor allem im Kontext der + NS-Raubkunst äußerst problematisch, da Nachkommen der Opfer zumeist kein + Deutsch sprechen. Dieselbe Problematik besteht auch für die <bibl> + <title type="desc">Lost Art</title> + </bibl>-Datenbank: Obwohl hier ein Wechsel in eine englische Sprachversion + möglich ist<note type="footnote">Vgl. <ref type="bibliography" + target="#sdzk_art_2000">Stiftung Deutsches Zentrum Kulturgutverluste + (Hg.) 2000a</ref>. </note>, werden bei einigen wenigen Meldungen die + Objektangaben nicht vollständig übersetzt. Eine stichprobenartige Durchsicht + zeigt zwar, dass dies auf die meisten Einträge nicht zutrifft, aber eben + nicht auf alle.<note type="footnote"> Vgl. <ref type="bibliography" + target="#art_beckmann_2011">Beckmann, Blumenstrauß in einer Vase; + Kirchner, Umschlagzeichnung zu Boßharts </ref> + <bibl> + <title type="desc">Neben der Heerstraße</title> + </bibl>.</note> Auf den ersten Blick ist nicht nachvollziehbar, warum + einige Angaben weiterhin auf Deutsch erscheinen. Um mehr über die Ursachen + der Lücken zu erfahren, wurde das Deutsche Zentrum Kulturgutverluste (DZK), + Betreiber der Datenbank, kontaktiert. Die Rückmeldung gibt wertvolle + Einblicke. Privatpersonen oder Institutionen werden zwar darum gebeten, + Such- und Fundmeldungen auch auf Englisch abzugeben, eine Pflicht besteht + allerdings nicht. Nur wenn die Melder*innen aus dem Ausland stammen, werden + die Daten zumeist in englischer Sprache abgegeben. Die Datenbank enthält + neben vorgegebenen Datenfeldern auch Freitextfelder<note type="footnote" + >Vgl. <ref type="bibliography" target="#sdzk_art_2023">Stiftung Deutsches + Zentrum Kulturgutverluste (Hg.) 2023</ref>.</note>, die aufgrund + fehlender Normen nicht automatisch übersetzt werden; eine Übersetzung der + Freitextfelder kann schließlich nur manuell erfolgen. Die Verwendung von + kontrolliertem Vokabular könnte dabei helfen, diese digitalen Lücken zu + schließen: Im Moment verwendet <bibl> + <title type="desc">Lost Art</title> + </bibl> für einige Datenfelder kontrolliertes Vokabular; im Rahmen eines + geplanten <term type="dh">relaunch</term> der internen Datenbank soll dieses + erweitert und sodann auch englische Begriffe integriert werden. Zudem wird + von den Betreibern auf eine Lücke hingewiesen, die gegenwärtig nicht mehr + sichtbar ist: Die <bibl> + <title type="desc">Lost Art</title> + </bibl>-Datenbank war auch in einer russischen Sprachversion verfügbar, die + allerdings seit einigen Jahren nicht mehr online ist. Grund hierfür sind + fehlende personelle und finanzielle Ressourcen für die Übersetzungsarbeit. + Auch der Einsatz von KI-basierten Übersetzungswerkzeugen wie <bibl> + <title type="desc">DeepL</title> + </bibl> oder <bibl> + <title type="desc">Google Translate</title> + </bibl> könnte zur Schließung der Übersetzungslücken beitragen; doch obwohl + diese sehr gute Ergebnisse produzieren, werden sie selten von + Datenbankbetreibern verwendet. Auch hier werden Mitarbeitende mit + entsprechendem Fachwissen benötigt, wofür wiederum Ressourcen fehlen.<note + type="footnote">Die Ausführungen zur Lost Art-Datenbank sind einer E-Mail + entnommen, die die Autorin am 20. Januar 2023 vom DZK auf eine Anfrage + hin erhalten hat. </note> + </p> + <p>Eine fehlende oder lückenhafte Übersetzung der Datenbankinhalte ist ein + Problem vieler deutschsprachiger Datenbanken – vor allem im Kulturbereich. + Die Rückmeldung der Betreiber*innen der <bibl> + <title type="desc">Lost Art</title> + </bibl>-Datenbank erlaubt wertvolle Rückschlüsse auf die Gründe für fehlende + Sprachversionen bzw. fehlende Übersetzungen von Objektinformationen. Eine + Ursache ist die Verwendung von Freitextfeldern, die nicht automatisch + übersetzt werden. Da Provenienzangaben häufig in diesen erfasst werden, + fehlen Übersetzungen vor allem für diese Objektinformationen.<note + type="footnote">Vgl. <ref type="bibliography" + target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S. + 95–96; siehe Beispiel: <ref type="bibliography" + target="#staedel_beckmann_2023">Beckmann, The Synagogue in Frankfurt + am Main</ref>. </note> Schließlich ist deutlich geworden, dass vor + allem fehlende Ressourcen problematisch sind, denn sie produzieren digitale + Lücken und verhindern ihre Schließung, durch z. B. eine manuelle Übersetzung + oder den Einsatz von KI-Technologien. </p> + </div> + <div type="subchapter"> + <head>3.1.5 Gelöschte Daten</head> + <p>Das DZK veranstaltet in Kooperation mit dem Centre for Anthropological + Research on Museums and Heritage (CARMAH) die Veranstaltungsreihe + ›Kolloquium Provenienzforschung‹. Im Rahmen der Reihe fand am 27. Juni 2022 + ein Vortrag zu <bibl> + <title type="desc"> Lost Art und Löschungen</title> + </bibl> statt.<note type="footnote">Vgl. <ref type="bibliography" + target="#kulturgutverluste_2022">Kulturgutverluste / German Lost Art + Foundation 2022</ref>.</note> Anlass waren mehrere Gerichtsverfahren, + in denen verschiedene Kläger*innen die Löschung von Meldungen gefordert + hatten. Begründet wurde dies damit, dass eine Veröffentlichung in <bibl> + <title type="desc">Lost Art</title> + </bibl> den Eindruck erwecke, es handele sich erwiesenermaßen um + NS-Raubkunst, und das Objekt dadurch schwer verkäuflich sei.<note + type="footnote">Vgl. <ref type="bibliography" + target="#kulturgutverluste_2022">Kulturgutverluste / German Lost Art + Foundation 2022</ref>. Die Grundsätze zur Eintragung und Löschung von + Meldungen in die Lost Art-Datenbank sagen dazu folgendes: <quote>Mit der + Dokumentation eines Einzelobjekts oder einer Sammlung in der Lost + Art-Datenbank ist nicht die Feststellung verbunden, dass es sich dabei + tatsächlich um ein NS-verfolgungsbedingt entzogenes oder im + Zusammenhang mit dem Zweiten Weltkrieg verbrachtes oder + abhandengekommenes Kulturgut handelt.</quote> (<ref + type="bibliography" target="#grundsaetze_2018">Lost Art-Datenbank, + Grundsätze zur Eintragung und Löschung von Meldungen in die Lost + Art-Datenbank 2018</ref>, S. 2.)</note> Im Moment können <bibl> + <title type="desc">Lost Art</title> + </bibl>-Einträge entweder auf schriftlichen Antrag des*der Melder*in hin + oder durch die Betreiber selbst gelöscht werden; im ersten Fall ist keine + Begründung notwendig.<note type="footnote">Vgl. <ref type="bibliography" + target="#grundsaetze_2018">Grundsätze zur Eintragung und Löschung von + Meldungen in die Lost Art-Datenbank 2018</ref>, S. 4. Das DZK kann + eine Meldung löschen, wenn z. B. unrichtige Angaben gemacht wurden oder + neue Erkenntnisse die Plausibilität einer Meldung, die bereits + eingetragen wurde, in Frage stellen (vgl. <ref type="bibliography" + target="#grundsaetze_2018">Grundsätze zur Eintragung und Löschung von + Meldungen in die Lost Art-Datenbank 2018</ref>, S. 4).</note> Der + Vorgang der Löschung in <bibl> + <title type="desc">Lost Art</title> + </bibl> gestaltet sich also relativ einfach und die Löschungen selbst + bleiben für den Nutzenden unsichtbar. Im Sinne einer vollständigen + Objektbiografie ist eine Entfernung aus <bibl> + <title type="desc">Lost Art</title> + </bibl> aber zumindest aus Sicht der Provenienzforschung problematisch. Es + wird deshalb von vielen gefordert, dass Löschungen markiert werden sollen, + um nachvollziehbar zu sein. </p> + <p>Es ist anzunehmen, dass die Datenlöschung eine gängige Praxis ist, wovon + viele Datenbanken betroffen sind, wobei das digitale Format eine einfache + und schnelle Löschung noch zusätzlich begünstigt. Nicht nur für <bibl> + <title type="desc">Lost Art</title> + </bibl> müssen deshalb Grundsatzfragen gestellt werden: Sollte man + existierende Datensätze überhaupt löschen können und muss (und wenn ja, wie) + man diese Vorgänge kennzeichnen? Für Nutzende von Datenbanken bleiben diese + Vorgänge und die dadurch entstandenen Lücken zumeist unsichtbar. Dies gilt + allerdings nicht für Datensätze, die über einen <term type="dh">Persistent + Identifier</term> verfügen; werden Datensätze gelöscht, führt dieser Link + ins Leere. An diesem Punkt wird die Löschung für den Nutzenden sichtbar.</p> + </div> + <div type="subchapter"> + <head>3.1.6 Digitale Bestandslücken</head> + <p>Der digitale Raum erscheint unendlich; die enorme Menge der dort verfügbaren + Daten lässt die Vermutung zu, dass dort alles zu finden sei. Tatsächlich + aber bestehen im Digitalen signifikante Bestandslücken. Diese zeigen sich im + Besonderen in den online Sammlungen der Museen, denn die dort verfügbaren + Datenbestände entsprechen nicht den tatsächlichen Objektbeständen im + Analogen. Zudem besteht in den meisten Fällen eine Diskrepanz zwischen den + in den internen Museumsdatenbanken erfassten und im Netz veröffentlichten + Beständen. Die digitalen Bestandslücken werden dabei erst im Vergleich zu + den analogen Beständen oder eben den digitalen Beständen, die zwar erfasst, + aber noch nicht veröffentlicht wurden, sichtbar. </p> + + <figure> + <graphic xml:id="luecke_004" url=".../medien/luecke_004.png"> + <desc> + <ref type="graphic" target="#abb4">Abb. 4</ref>: Tagesaktuelle + Zahlenangaben zum Erfassungsstand auf der Startseite der Online + Collection der SKD. Screenshot vom 23. Januar 2023. [Quelle: <ref + type="bibliography" target="#skd_online_2023">Online Collection, + Staatliche Kunstsammlungen Dresden</ref>]<ref type="graphic" + target="#luecke_004"/> + </desc> + </graphic> + </figure> + <p>Die Einstiegsseite der <bibl> + <title type="desc">Online Collection</title> + </bibl> der SKD gibt Auskunft über die Anzahl der Objekte, die sich derzeit + in der online Sammlung befinden (vgl. <ref type="graphic" + target="#luecke_004">Abbildung 4</ref>).<note type="footnote">Vgl. <ref + type="bibliography" target="#skd_collection_2023">Staatliche + Kunstsammlungen Dresden. Online Collection 2023</ref>.</note> Stand + 23. Januar 2023 sind dies 345.378 Objektdatensätze. Damit ist zumindest ein + Teil der analogen Sammlung, die vermutlich mehr als drei Millionen Objekte + und Archivalien umfasst, digital für jeden zugänglich. Ein Vergleich der + beiden Zahlen lässt aber auch eine große Differenz zwischen dem analogen und + digital zugänglichen Bestand erkennen. Eine weitere Lücke zeigt sich auch im + Vergleich zwischen den digital veröffentlichten und digital ›nur‹ erfassten + Datensätzen, worüber die SKD gleich auf der Einstiegsseite der <bibl> + <title type="desc">Online Collection</title> + </bibl> informieren (vgl. <ref type="graphic" target="#luecke_004">Abbildung + 4</ref>). So wurden zwar bereits mehr als 1,7 Millionen Objekte in der + internen Museumsdatenbank <bibl> + <title type="desc">Daphne</title> + </bibl> erfasst, aber eben noch nicht alle veröffentlicht. Eine + Veröffentlichung im Netz bedarf z. B. noch einer Klärung der Bildrechte oder + wissenschaftlichen Kontextualisierung des Objekts.<note type="footnote">Vgl. + <ref type="bibliography" target="#skd_online_2023">Was ist die Online + Collection? 2023</ref>. Die Angaben zum Umfang des analogen Bestandes + sowie zur Erfassung und Veröffentlichung der Objekte im Netz sind einer + E-Mail vom 20. Februar 2023 entnommen, die die Autorin auf Anfrage hin + von den SKD erhalten hat. </note> + </p> + <p>Eine Diskrepanz zwischen analogem und digitalem Bestand lässt sich für die + meisten (deutschsprachigen) Museen manifestieren. Die Sammlung des Städel + Museums <quote>[…] umfasst […] rund 3.100 Gemälde, 660 Skulpturen, über + 5.000 Fotografien und über 100.000 Zeichnungen und Grafiken.</quote> + <note type="footnote"><ref type="bibliography" target="#staedel_museum_2023" + >Städelsches Kunstinstitut (Hg.) 2023a</ref>. </note> Das sind + insgesamt rund 108.760 Objekte aus dem frühen 14. Jahrhundert bis in die + Gegenwart.<note type="footnote">Vgl. <ref type="bibliography" + target="#staedel_museum_2023">Städelsches Kunstinstitut (Hg.) + 2023a</ref>.</note> Auch das Städel hat einen Teil seiner Sammlung ins + Netz gestellt, im Moment sind 31.681 Objekte online zugänglich, davon 1.608 + sogenannte ›Hauptwerke‹.<note type="footnote">Vgl. <ref type="bibliography" + target="#staedel_digisammlung_2023">Städelsches Kunstinstitut (Hg.) + 2023b</ref>. </note> Im Vergleich zum analogen Bestand wird auch hier + eine signifikante digitale Lücke erkennbar, denn weniger als ein Drittel der + Sammlung ist im Digitalen verfügbar. Eine noch größere Lücke zeigt sich im <bibl> + <title type="desc">Objektkatalog</title> + </bibl> des Germanischen Nationalmuseums in Nürnberg. Der Katalog beinhaltet + im Moment 171.804 Objekte aus der analogen Sammlung, die mit 1.3 Millionen + Objekten (dazu gehören auch die Graphische Sammlung und der + Bibliotheksbestand) den digitalen Bestand bei Weitem übersteigen.<note + type="footnote">Vgl. <ref type="bibliography" target="#gnm_fragen_2023" + >Germanisches Nationalmuseum (Hg.) 2023b</ref>.</note> + </p> + <p>Die genannten Beispiele verdeutlichen, dass es einen erheblichen Unterschied + zwischen analogem und digitalem Museumsbestand gibt. Die Angaben der SKD + (vgl. <ref type="graphic" target="#luecke_004">Abbildung 4</ref>) haben + zudem aufgezeigt, dass es zusätzlich eine Diskrepanz zwischen digital + erfassten und tatsächlich veröffentlichten Objekten gibt. In allen genannten + Fällen können die digitalen Lücken aber durch eine kontinuierliche + Digitalisierung der Bestände geschlossen werden. So schreibt die SKD: + <quote>Der Gesamtbestand der Museen der Staatlichen Kunstsammlungen + Dresden wird in einer umfangreichen Datenbank inventarisiert und + dokumentiert. Mehr als 1,2 Millionen Kunstwerke […] werden so mit den + zugehörigen Daten abgebildet und wissenschaftlich ausgewertet.</quote> + <note type="footnote">Vgl. <ref type="bibliography" + target="#skd_online_2023">Was ist die Online Collection? + 2023</ref>.</note> So ist es zukünftig durchaus möglich, dass die + digitalen Bestände den analogen entsprechen; dafür müssen allerdings erst + einmal ausreichend finanzielle und personelle Ressourcen und + Speicherkapazität zur Verfügung gestellt werden. </p> + <p>Die Wahl, was im Digitalen erscheinen darf und was nicht, ist nicht + willkürlich, sondern auf bestimmte Ursachen zurückzuführen. Fehlende + Ressourcen und Speicherkapazitäten sind dabei sicherlich entscheidende + Faktoren und führen dazu, dass bei der Digitalisierung erst einmal eine + Priorisierung erfolgt. So werden Hauptwerke einer Institution bevorzugt + digitalisiert; auch Werke, die unter Besuchenden populär oder von großem + wissenschaftlichem Interesse sind, werden priorisiert. In gewisser Weise + wird dem Objekt also im Vorfeld ein Wert zugesprochen, aufgrund dessen es + digitalisiert wird. Doch auch weitaus praktischere Gründe, wie Größe und + Material, spielen bei der Digitalisierung eine Rolle. Schließlich muss bei + der Betrachtung von digitalen Sammlungen immer von Bestandslücken + ausgegangen und Gründe hierfür hinterfragt werden. Dies ist vor allem dann + notwendig, wenn allgemeine Schlüsse aus der Betrachtung der digitalen + Sammlungen gezogen werden sollen. </p> + </div> + </div> + <div type="subchapter"> + <head>3.2 Fehlende Merkmale in Datenmodellen</head> + <p>Ontologien wie <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> ermöglichen die Modellierung von Daten anhand festgelegter formaler + Begriffssysteme.<note type="footnote">Vgl. <ref type="bibliography" + target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 162. + CIDOC CRM wird im Zuge des Beitrags referenziert, da es ein geeignetes + Begriffssystem für die Datenmodellierung im Bereich des Kulturerbes zur + Verfügung stellt (vgl. <ref type="bibliography" + target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 174; + <ref type="bibliography" target="#cidoc_crm_2022">CIDOC CRM. Conceptual + Reference Model 2022</ref>.</note> + <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> stellt dafür Definitionen und eine formale Struktur zur Beschreibung + von Konzepten in den Daten und Beziehungen untereinander zur Verfügung. Die + Ontologie wird von der CIDOC CRM Special Interest Group, die unter der Obhut + des International Council for Documentation (Komitee des International Council + of Museums) steht, entwickelt und betreut. Zur Arbeitsgruppe gehören private + und öffentliche Institutionen, die mit der Erforschung und Dokumentation der + Menschheitsgeschichte betraut sind.<note type="footnote">Vgl. <ref + type="bibliography" target="#cidoc_crm_2022">CIDOC CRM. Conceptual + Reference Model 2022</ref>.</note> + <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> besteht aus einem Basisstandard, der grundlegende Klassen und + Verbindungen für die Modellierung von Daten aus dem Bereich Kulturerbe vorgibt. + Hinzu kommen Spezialisierungsmodule, die den Ausbau des Standardmodells + ermöglichen und in Zusammenarbeit mit der jeweiligen Fachgemeinschaft + entwickelt werden.<note type="footnote">Vgl. <ref type="bibliography" + target="#cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model + 2022</ref>.</note> Die im April 2021 veröffentlichte offizielle Version des <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> gibt einen Überblick über die in der Ontologie enthaltenen Klassen und + Eigenschaften (vgl. <ref type="graphic" target="#luecke_005">Abbildung + 5</ref>).<note type="footnote">Vgl. <ref type="bibliography" + target="#cidoc_definition_2021">CIDOC CRM Special Interest Group + 2021</ref>. </note> Der Einsatz von Ontologien für die Datenmodellierung + führt dazu, dass </p> + <p> + <quote type="grosszitat">Informationen in ihrem Bedeutungskontext präzise erfasst und + maschinell verarbeitbar gemacht werden […]. Damit sind Ontologien vor + allem im Bereich der Integration heterogener Datenquellen, des Austauschs + und der Wiederverwendung von Wissenselementen sowie der Ermöglichung + logischer Schlussfolgerungen interessant […].</quote><note type="footnote"><ref type="bibliography" + target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. + 162.</note> + </p> + <p>Trotz dieser Chancen haben Datenmodelle im Allgemeinen und Ontologien im + Speziellen einen Nachteil: </p> + <p> + <quote type="grosszitat">Ein Modell ist nicht das Original und auch keine Kopie des Originals. + Anders als eine Kopie hat es nicht alle Merkmale des Originals, sondern + nur ausgewählte. Die Auswahl beruht auf Annahmen des Modellierers, + welche Merkmale für die intendierte Verwendung des Modells relevant + sind.</quote><note type="footnote"><ref type="bibliography" + target="#jannidis_humanities_2017">Jannidis et al. 2017</ref>, S. 100. + </note> + </p> + <p>Das Begriffssystem, das <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> zugrunde liegt, wurde innerhalb der CIDOC CRM Special Interest Group + entwickelt und von verschiedenen Akteuren mitgestaltet; es stellt eine + Schnittmenge der wichtigsten Konzepte aus dem Bereich des kulturellen Erbes + dar. Das Modell bildet deshalb ›nur‹ eine Teilmenge aller realweltlichen + Erscheinungen ab, die abhängig vom Anwendungskontext ist. Indem das Modell + nicht alle Merkmale abbildet, entlarvt es sich als lückenhaft. Obwohl die + Möglichkeit besteht, <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> durch kompatible, externe Typenhierarchien zu erweitern<note + type="footnote"> Vgl. <ref type="bibliography" + target="#cidoc_definition_2021">CIDOC CRM Special Interest Group + 2021</ref>, S. 27. </note> und damit der Versuch unternommen wird, ein + möglichst integratives Datenmodell zu schaffen, können auch hier zumeist nur + übergreifende Konzepte und Eigenschaften aufgenommen werden. </p> + + <figure> + <graphic xml:id="luecke_005" url=".../medien/luecke_005.png"> + <desc> + <ref type="graphic" target="#abb5">Abb. 5</ref>: Die Abbildung zeigt + beispielhaft die Kodierung für ›Johann Joachim Winkelmann sieht die + Laokoon-Skulptur‹ mit CIDOC CRM. Zudem sind einige im Begriffssystem der + Ontologie enthaltenen Klassen und Eigenschaften abgebildet. [Aus: <ref + type="bibliography" target="#cidoc_definition_2021">CIDOC CRM Special + Interest Group 2021</ref>, S. 36, fig. 2. CC BY 4.0]<ref + type="graphic" target="#luecke_005"/> + </desc> + </graphic> + </figure> + </div> + </div> + <div type="chapter"> + <head>4. Die Ursachen der Lücke </head> + <p> + <quote type="grosszitat">Soll auch ein ›digitales Gedächtnis‹ angeblich niemals vergessen, ist es + doch vor Fehlstellen und ›Gedächtnislücken‹ genauso wenig gefeit wie sein + rein ›analoges‹ Pendant: sei es durch unwiderrufliches Überschreiben, durch + Abschaltung, durch veraltete Hardware oder schlichtweg Desinteresse. Zudem + erbt es die ›analogen‹ Fehlstellen wie auch ›analogen‹ Vorurteile.</quote><note type="footnote"><ref type="bibliography" + target="#muennich_quellenverluste_2019">Münnich 2019</ref>. </note> + + </p> + <p>Die digitale Lücke findet häufig ihre Entsprechung im Analogen; vor allem + kriegerische Konflikte tragen zur Entstehung von Lücken bei. In ihrer Folge werden + Objekte oder Schriftgut zerstört, beschlagnahmt oder gestohlen. Die dadurch + entstandenen Lücken sind auch im digitalen Raum sichtbar, wie die Sammlung der <bibl> + <title type="desc">Vermissten Werke</title> + </bibl> der SKD zeigt.<note type="footnote">Vgl. <ref type="bibliography" + target="#skd_werke_2023">Vermisste Werke 2023</ref>.</note> Obige + Ausführungen zu möglichen Arten digitaler Lücken haben aber auch aufgezeigt, dass + die Ursachen digitaler Lücken nicht immer im Analogen zu suchen sind. Die + folgenden Abschnitte bündeln diese Ursachen noch einmal. </p> + <p>Technische Gründe und dadurch bedingte Limitationen generieren Lücken im + Digitalen. Fehlende Speicherkapazitäten können dazu führen, dass bei der + Digitalisierung der analogen Sammlungsbestände eine Priorisierung erforderlich + ist. So digitalisieren Museen z. B. Hauptwerke, um diese auf ihrer Webseite + werbewirksam präsentieren zu können. Die Bearbeiter*innen der <bibl> + <title type="desc">Datenbank CCP</title> + </bibl> entschieden sich dafür, aufgrund eines nicht ausreichenden Speicherumfangs + auf das Scannen von leeren Karteikartenrückseiten zu verzichten.<note + type="footnote"> Vgl. <ref type="bibliography" + target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note> Weitere + technisch bedingte Ursachen beziehen sich auf die Verwendung von standardisierten + Datenfeldern, die keine flexible Eingabe von Informationen erlauben und deshalb + die Aufnahme und Integration von Wissen behindern. Wie die Ausführungen zu + Übersetzungslücken gezeigt haben, produzieren im Umkehrschluss aber auch + Freitextfelder Lücken, da sie aufgrund fehlender Normen nicht automatisch + übersetzt werden. Der Wunsch nach einer Verknüpfung verschiedener Daten oder + maschinellen Verarbeitung verlangt den Einsatz von Datenmodellen, die die Daten in + eine eindeutige und explizite Form bringen.<note type="footnote">Vgl. <ref + type="bibliography" target="#jannidis_humanities_2017">Jannidis et al. + 2017</ref>, S. 100. </note> Obige Ausführungen haben beispielhaft die im + Bereich des kulturellen Erbes mehrheitlich eingesetzte Ontologie <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> vorgestellt.<note type="footnote"><ref type="bibliography" + target="#cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model + 2022</ref>.</note> Das der Ontologie zugrundeliegende Begriffssystem umfasst + dabei <quote>[…] Begrifflichkeiten[, die] in dem Gegenstandsbereich der + Museumssammlungen weiträumig geteilt [werden].</quote> + <note type="footnote"><ref type="bibliography" target="#jannidis_humanities_2017" + >Jannidis et al. 2017</ref>, S. 174.</note> Derzeit stellt <bibl> + <title type="desc">CIDOC CRM</title> + </bibl> eine Terminologie mit 99 Klassen und 198 Eigenschaften zur Verfügung, um + das in den Daten vorhandene Wissen angemessen repräsentieren zu können.<note + type="footnote">Vgl. <ref type="bibliography" target="#cidoc_definition_2021" + >CIDOC CRM Special Interest Group 2021</ref>.</note> Obwohl damit ein + Großteil der Dateninhalte und Merkmale erfasst werden können, beinhaltet das + Modell eben ›nur‹ eine Auswahl an ›weiträumig‹ geteilten Begriffen, die sich u. a. + an dem Verwendungszweck orientiert.<note type="footnote">Vgl. <ref + type="bibliography" target="#jannidis_humanities_2017">Jannidis et al. + 2017</ref>, S. 100. </note> Indem das resultierende Datenmodell eben nicht + alle Merkmale des Originals aufgreifen kann, offenbart es sich als lückenhaft und + Lücken generierend. </p> + <p>Neben technisch bedingten Gründen konnten noch weitere Ursachen für die Entstehung + von Lücken identifiziert werden. <quote>Publishing data online is also bound to + certain licenses and copyrights that institutions have for their images and + other digital materials.</quote> + <note type="footnote"><ref type="bibliography" target="#luther_digitization_2022" + >Luther 2022</ref>. </note> Rechtliche Restriktionen wie Lizenzen oder + Urheberrechte zählen zu den Hauptverursachern digitaler Lücken. Im Kontext der + Kunstgeschichte und Provenienzforschung sind dies häufig fehlende Abbildungen von + Kunstwerken, die aufgrund bestehender urheberrechtlicher Ansprüche nicht gezeigt + werden. In Deutschland besitzen Kunstschaffende sämtliche Rechte an ihren Werken + und können entsprechend darüber bestimmen, wie diese von Dritten genutzt werden + können.<note type="footnote">Vgl. <ref type="bibliography" + target="#bvbk_urheberrecht_2023">Bundesverband Bildender Künstlerinnen und + Künstler (Hg.) 2023</ref>.</note> Erst siebzig Jahre nach dem Tod des + Künstlers / der Künstlerin erlischt das Urheberrecht und die geschützten Werke + sind gemeinfrei (§ 64 UrhG). Die für diesen Beitrag betrachteten Datenbanken haben + unterschiedliche visuelle Lösungen gefunden, um diese Lücken zu kennzeichnen (vgl. + <ref type="graphic" target="#luecke_001">Abbildung 1</ref> und <ref + type="graphic" target="#luecke_002">Abbildung 2</ref>). </p> + <p>Vor allem im Kontext der Provenienzforschung wird eine Debatte über den Umgang mit + sensiblen Inhalten und im Besonderen mit rassistischen und diskriminierenden + Begriffen geführt. Das Beispiel der SKD hat gezeigt, wie aufgrund ethischer + Bedenken Lücken im Digitalen entstehen können. So werden problematische Begriffe + in Werktiteln oder Beschreibungen in der Datenbank durch Sternchen (****) ersetzt. + Der Nutzer / die Nutzerin kann schließlich selbst entscheiden, ob er / sie die + ausgeblendeten Begriffe sehen möchte und muss entsprechend die Ansicht ändern. + Damit haben die SKD demonstriert, welche digitalen Möglichkeiten für den Umgang + mit problematischen Begriffen zur Verfügung stehen, ohne diese ›einfach‹ aus dem + digitalen Raum zu verbannen. Nennenswert ist das Beispiel auch, da die digitale + Lücke an dieser Stelle nicht endgültig ist, sondern durch die Interaktion mit dem + Nutzenden geschlossen werden kann. Während Begriffe sichtbar gemacht werden + können, hat man sich bei einigen Datensätzen dazu entschieden, aufgrund ethischer + Bedenken einen Platzhalter anstatt einer Abbildung zu verwenden.<note + type="footnote">Vgl. <ref type="bibliography" target="#skd_leitlinien_2023" + >Ethische Leitlinien der Online Collection 2023</ref>.</note> Die dadurch + entstandene digitale Lücke ist nicht durch die Nutzenden der Datenbank aufzuheben. + <quote>Publishing data, images and digital materials online should also be + placed under considerations of an ethical distribution of information. Can this + data harm a community or people because it misrepresents information or leaves + certain perspectives, languages and knowledges out.</quote> + <note type="footnote"><ref type="bibliography" target="#luther_digitization_2022" + >Luther 2022</ref>. </note> Überlegungen hinsichtlich der Veröffentlichung + und Verbreitung von problematischen und sensiblen Inhalten – sei es in Bildern, + Texten oder Werktiteln – müssen künftig noch verstärkter in den Blick genommen + werden, vor allem im Kontext von Datenbanken. Obwohl auch im Analogen eine + Relevanz besteht, ist diese im Digitalen aufgrund der enormen Reichweite und + Geschwindigkeit, mit der Informationen reproduziert und verbreitet werden, um ein + Vielfaches gesteigert. </p> + <p>Neben ethischen Bedenken können auch strategische Gründe für die Entstehung von + digitalen Lücken verantwortlich sein: So haben sich die Verantwortlichen der <bibl> + <title type="desc"> Datenbank CCP</title> + </bibl> dafür entschieden, nur Informationen aus der <term type="dh" + >Restitutionskartei nach Münchener Nummer</term> in die Datenbank einzutragen, + weil diese die umfangreichsten Angaben zu den Kunstwerken enthält.<note + type="footnote">Vgl. <ref type="bibliography" + target="#enderlein_datenbank_2023">Enderlein / Flacke</ref>.</note> Auch + fehlende Provenienzangaben in Objektdatenbanken sind zum Teil auf strategische + Gründe zurückzuführen; so hat bereits Dorothee Haffner in <bibl> + <title type="desc">Provenienzforschung digital vernetzt</title> + </bibl> auf eine <quote>[…] [gewisse] Zögerlichkeit oder Besorgnis vieler + Museumsdirektor*innen […]</quote> + <note type="footnote"><ref type="bibliography" + target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S. 93.</note> + als Grund fehlender Provenienzen im Netz hingewiesen. Diese Zögerlichkeit mag + verschiedene Gründe haben: So können Personendatenschutzgründe<note + type="footnote">Vgl. <ref type="bibliography" + target="#haffner_provenienzforschung_2019">Haffner 2019</ref>, S. + 93.</note>, eine allgemeine Unsicherheit in Bezug auf die Art und Weise der + Darstellung von Provenienzinformationen oder eine Besorgnis um das eigene Image + dafür verantwortlich sein. Schließlich haben die Ausführungen zu den möglichen + Arten digitaler Lücken wiederholt auf einen Aspekt hingewiesen, der als eine + Hauptursache genannt werden muss: fehlende personelle und finanzielle Ressourcen! + Sie verhindern sowohl eine Anpassung überholter Datenbanksysteme, als auch den + Einsatz von KI-Technologien für die Übersetzung von Webinhalten. Schließlich führt + das Ressourcen-Problem auch dazu, dass viele Institutionen eine Entscheidung + treffen müssen, was digitalisiert werden soll oder eben nicht und deshalb zur + digitalen Lücke wird. </p> + + <figure> + <graphic xml:id="luecke_006" url=".../medien/luecke_006.png"> + <desc> + <ref type="graphic" target="#abb6">Abb. 6</ref>: Eine Typologie der + digitalen Lücke. Die Aufstellung listet die im Beitrag identifizierten + Lücken, Ursachen und weitere Eigenschaften. [Sabine Lang Februar 2023]<ref + type="graphic" target="#luecke_006"/> + </desc> + </graphic> + </figure> + <p>Die aus der Studie der Datenbanken und Datenmodellierung gewonnenen Erkenntnisse + hinsichtlich der Arten und Ursachen digitaler Lücken sind in der beigefügten + Typologie zusammengefasst (vgl. <ref type="graphic" target="#luecke_006">Abbildung + 6</ref>). Der entstandene Katalog ist dabei nicht als ein abgeschlossenes, + sondern als ein dynamisches System zu verstehen, das von Forschenden erweitert + werden soll.</p> + </div> + <div type="chapter"> + <head>5. Die digitale Lücke: eine Definition</head> + <p>Eine einheitliche Definition der digitalen Lücke im Kontext der Kunstgeschichte + und Provenienzforschung ist aufgrund der unterschiedlichen Arten und Ursachen + nicht möglich. Vielmehr können bestimmende Auffälligkeiten und Eigenschaften + aufgegriffen werden, die auch Bezug auf Definitionen der analogen Lücke nehmen. </p> + <p>Eine Lücke ist <quote>[…] eine Stelle, an der etwas fehlt, das dort sein sollte + […].</quote> + <note type="footnote"><ref type="bibliography" target="#goetz_luecke_2019">Götz in + Zusammenarbeit mit der Langenscheidt-Redaktion 2019</ref>, S. 721.</note> + Weiter markiert sie eine fehlende Sache, die eigentlich von Nutzen wäre; das + Fehlen wird deshalb als Mangel empfunden.<note type="footnote">Vgl. <ref + type="bibliography" target="#goetz_luecke_2019">Götz in Zusammenarbeit mit + der Langenscheidt-Redaktion 2019</ref>, S. 721.</note> Das Wörterbuch <bibl> + <title type="desc">Deutsch als Fremdsprache</title> + </bibl> definiert die Lücke als<quote> […] ›(durch ein fehlendes Stück + entstandener) Zwischenraum […] od. leere Stelle in einer Reihe […]‹ + […].</quote> + <note type="footnote"><ref type="bibliography" target="#kempcke_luecke_2000" + >Kempcke unter Mitarbeit von Barbara Seelig 2000</ref>, S. 639.</note> Zudem + beziehe sich die Lücke auf <quote>[…] ›etw., was im Bereich sonst vorhandener + Dinge fehlt und als Mangel angesehen wird‹ […].</quote> + <note type="footnote"><ref type="bibliography" target="#kempcke_luecke_2000" + >Kempcke unter Mitarbeit von Barbara Seelig 2000</ref>, S. 639.</note> + Daraus lassen sich für die Lücke wichtige Eigenschaften ableiten: Indem sie mit + einer ›Stelle‹ oder einem ›Zwischenraum‹ gleichgesetzt wird, erhält sie eine + räumliche Dimension. Die Lücke ist Teil einer Einheit und das Fehlen einer Sache + wird erst aufgrund dieser Zugehörigkeit sichtbar. Interessant ist, dass die Lücke + nach diesem Verständnis erst durch einen vergleichenden Blick in Erscheinung tritt + und deshalb immer auch ein Bezugsobjekt benötigt. Für eine Definition der + digitalen Lücke lassen sich viele dieser Eigenschaften übernehmen, wobei an + einigen Stellen Spezifizierungen notwendig sind. </p> + <p>Auch die digitale Lücke zeichnet sich durch eine Räumlichkeit aus; die Fehlstelle + wird, zumindest in Bezug auf Abbildungslücken, durch Platzhalter explizit gemacht + und beansprucht dadurch Platz im digitalen Raum. Zudem verlangt die Identifikation + der digitalen Lücke häufig einen komparativen Blick. Am Beispiel von Kirchners <bibl> + <title type="desc">Cyclamen</title> + </bibl> (1918–1919) in der Datenbank <bibl> + <title type="desc">Prometheus</title> + </bibl> wurde dies deutlich. Eine Informationslücke wird erst im Vergleich mit der + Ursprungsdatenbank (Bezugsobjekt) – in diesem Fall die digitale Sammlung des Met – + sichtbar. Obwohl auch die digitale Lücke Teil eines ansonsten sichtbaren Ganzen + ist (z. B. museale Sammlungsbestände), kann es vorkommen, dass Bezugsobjekte + fehlen und digitale Lücken deshalb nicht sichtbar werden (z. B. Bestandslücken, + Datenlöschung). Kann die digitale Lücke nicht identifiziert werden, so kann das + Fehlen einer Sache auch nicht als Mangel empfunden werden. </p> + <p>Das Studium verschiedener Datenbanken und der Datenmodellierung als standardisierter + Methode hat zudem weitere Erkenntnisse über die digitale Lücke identifiziert, die + im Folgenden festgehalten werden. Die analoge Lücke ist nicht gleich die digitale + Lücke: Analoge Lücken werden im Digitalen, durch z. B. die Zusammenführung + eigentlich entfernter Bestände oder die Kopie eines Datensatzes, behoben oder es + entstehen durch rechtliche Restriktionen oder den Einsatz von Datenmodellen + weitere Lücken im digitalen Raum. Im Unterschied zur analogen Lücke muss die + digitale Lücke nicht permanent sein und kann durch einfache Funktionalitäten vom + Betrachter / der Betrachterin behoben werden (vgl. <ref type="intern" + target="#hd6">Begriffslücken</ref>). Die Studie hat zudem verdeutlicht, dass + die digitale Lücke ein Resultat bewusster Entscheidungen ist. Was wird digital + erfasst und veröffentlicht und was nicht? Was wird entsprechend als wertvoll und + deshalb digitalisierungswürdig erachtet und was eben nicht? + Digitalisierungsprozesse sind – auch aufgrund fehlender personeller und + finanzieller Ressourcen – (immer auch) wertende Prozesse. </p> + </div> + <div type="chapter"> + <head>6. Abschließende Gedanken</head> + <p>Das Verfassen des Beitrags und die dafür notwendige intensive Auseinandersetzung + mit digitalen Lücken haben Fragen und daran anschließende Gedanken aufgeworfen, + die nun im abschließenden Teil des Beitrags aufgegriffen werden. </p> + <div type="subchapter"> + <head>6.1 Warum ist eine Auseinandersetzung mit Lücken vor allem im Digitalen + wichtig? </head> + <p>Eine Auseinandersetzung mit Lücken im Digitalen ist wichtig, da sie im + digitalen Raum oft unsichtbar sind. Die Ausführungen zu den einzelnen Typen + digitaler Lücken haben gezeigt, dass einige für die Nutzenden der Datenbank + unsichtbar sind oder zumindest erst im direkten Vergleich oder mit + entsprechendem Vorwissen über den ursprünglichen Zustand erkannt werden können. + Digitale Bestandslücken werden erst ersichtlich, wenn Nutzende Wissen über den + tatsächlichen analogen Bestand haben. Auch gelöschte Daten sind für Nutzende + zumeist unsichtbar, da sie durch keinen Platzhalter oder Hinweis markiert + werden. Schließlich sind auch die durch den Einsatz von Datenmodellen + entstandenen Lücken unsichtbar, da uns in den meisten Fällen ein Einblick in + den Modellierungsprozess fehlt. </p> + <p> + <bibl> + <title type="desc">Der Geograf</title> + </bibl> (1669) von Johannes Vermeer (1632–1675) ist eines der Hauptwerke der + Städelschen Sammlung und wird entsprechend in der <bibl> + <title type="desc">Digitalen Sammlung</title> + </bibl> des Museums präsentiert: Etliche Audio- und Videobeiträge und + ausführliche Metainformationen stehen Nutzenden der Datenbank zur Verfügung, + zudem werden durch Hinweise auf andere Werke oder in die Seite eingebettete + Verlinkungen Verweise und Verknüpfungen zu externen Inhalten hergestellt.<note + type="footnote">Vgl. <ref type="bibliography" target="#staedel_vermeer_2023" + >Vermeer, Der Geograf.</ref></note> Die Informationsfülle im Digitalen + erschwert die Sichtbarkeit der digitalen Lücke und damit ihre Identifikation + und Reflexion zusätzlich. Dies geschieht vor allem dadurch, dass der Blick + des*der Nutzenden ständig durch neue Inhalte und Angebote abgelenkt wird. Die + Möglichkeit, zwischen einzelnen Webseiten hin und her zu springen, verstärkt + diesen Effekt zusätzlich. Schließlich entsteht durch diese Informationsfülle + auch der Eindruck einer ›verführerischen Vollständigkeit‹.<note type="footnote" + >Der Begriff der ›verführerischen Vollständigkeit‹ geht auf eine + Beschäftigung mit digitalen Rekonstruktionen zurück: <quote>[D]igitale + Modelle, die heutzutage immer häufiger in wissenschaftlichen + Publikationen erscheinen, [vermitteln] oft eine verführerische + Vollständigkeit ohne Nachvollziehbarkeit des spekulativen Anteils + […].</quote> (<ref type="bibliography" target="#schaedler_fragment_2021" + >Schädler-Saub 2021</ref>, S. 35–36). </note> + </p> + <p>Im Zuge des Essays <bibl> + <title type="desc">Was warum bleibt</title> + </bibl> hat sich Klaus Brinkbäumer damit auseinandergesetzt, warum gewisse + Künstler*innen und Werke überdauern und andere nicht und was Voraussetzungen + für Nachruhm sind. Er kommt schließlich zur Schlussfolgerung, dass die im + Artikel aufgestellten Ruhmtheorien (Gefühl / Fantasie / Neugierde, Genialität / + Originalität, Mythos, Vergessen werden und anschließendes Wiederentdecken) + heute möglicherweise nicht mehr zutreffen.<note type="footnote">Vgl. <ref + type="bibliography" target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer + 2013</ref>, S. 122–123.</note> Ein Hauptgrund dafür sei, dass <quote>[…] + zu viel passiert, […] das Tempo unseres Lebens zu hoch für kollektive + Erinnerung ist, weil zwar alles archiviert und nichts mehr gelöscht wird, + aber trotzdem nichts bleibt.</quote> + <note type="footnote"><ref type="bibliography" + target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer 2013</ref>, S. + 123.</note> Damit beschreibt Brinkbäumer eine Eigenschaft, die sich auch im + Digitalen manifestiert: die Flüchtigkeit. Sie wird zusätzlich durch das <term + type="dh">Semantic Web</term>, die damit verbundene Verknüpfung der Inhalte + und eine dadurch mögliche schnelle Navigation durchs Netz verstärkt. Die + Flüchtigkeit trägt dazu bei – so das Argument – dass Lücken erst gar nicht in + Erscheinung treten und wahrgenommen werden können. Brinkbäumer attestiert + schließlich auch die Gefahr des Neuen; er tut dies im Kontext der Feststellung, + dass es zukünftig noch schwieriger oder unmöglich sein wird, Ruhm zu erreichen: + <quote>Wenn alles so schnell durch Neues ersetzt wird, wie es derzeit + geschieht […], dann fehlt dem Publikum die Muße, Dinge wirken zu lassen, + brennt sich nichts mehr ein, tauchen Kunstwerke auf, ab, und das nächste ist + da.</quote> + <note type="footnote"><ref type="bibliography" + target="#brinkbaeumer_kunstwerk_2013">Brinkbäumer 2013</ref>, S. + 123.</note> + </p> + <p>Neben der angesprochenen Flüchtigkeit besitzt das Netz weitere Eigenschaften, + die eine Auseinandersetzung mit Lücken notwendig machen. So ist das Internet + erst einmal endlos erweiterbar und zumindest in der Theorie von jedem oder + jeder nutzbar. Dies führt unweigerlich zu einem Kontrollverlust, der es + unmöglich macht zu überblicken, was mit der Lücke passiert und in welche neuen + Kontexte sie eingebettet wird. Schließlich ist eine Beschäftigung mit der Lücke + im digitalen Raum auch deshalb notwendig, weil sie durch digitale Verfahren + reproduziert und vervielfältigt werden kann und sich dadurch der Empfänger- und + damit verbunden der Wirkungskreis der Lücke erheblich vergrößert. </p> + </div> + <div type="subchapter"> + <head>6.2. Die Lücke als positives Phänomen?!</head> + <p>Die abschließenden Gedanken zur Lücke als positives Phänomen müssen an dieser + Stelle aus Platzgründen leider unvollständig bleiben. Sie sollen allerdings + Denkanstöße geben und in zukünftigen Forschungsarbeiten aufgegriffen werden. In + der 2021 erschienenen Publikation <bibl> + <title type="desc">Literaturwissenschaft: Einführung in ein + Sprachspiel</title> + </bibl> schreibt Bernhard Dotzler über Leerstellen im Kontext von Goethes + Briefroman <bibl> + <title type="desc">Die Leiden des jungen Werthers</title> + </bibl>.<note type="footnote">Vgl. <ref type="bibliography" + target="#dotzler_leerstellen_2021">Dotzler 2021</ref>. </note> + <quote>Eine Leerstelle lässt sich grob definieren als eine versteckt oder offen + markierte Abwesenheit. Ein ›Zwischenraum‹, der ›ausgefüllt‹ werden kann oder + muss. Eine Lücke, wo es gilt, ›einem Text das zu entnehmen, was dieser nicht + sagt (aber voraussetzt, anspricht, beinhaltet und miteinbezieht)‹.</quote> + <note type="footnote"><ref type="bibliography" + target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 154.</note> Die + Leerstelle in der Literatur fordert den Leser / die Leserin zur aktiven + Mitarbeit auf, denn nur so kann das Geschriebene Sinn ergeben.<note + type="footnote">Vgl. <ref type="bibliography" + target="#dotzler_leerstellen_2021">Dotzler 2021</ref>, S. 154.</note> Die + Lücke hat also das Potenzial, die Fantasie des*der Betrachtenden anzuregen und + eine Interaktion anzustoßen, die den*die passive*n Betrachtenden zu einem / + einer aktiven macht. Auch Lücken in digitalen Datenbanken können diese positive + Qualität haben und Fragen wie, ›Welche Sache fehlt überhaupt?‹ und ›Was sagt + uns die Lücke über bestehende gesellschaftliche Wert- oder Machtverhältnisse?‹ + aufwerfen. Auch die digitale Lücke hat somit das Potenzial, mit den + Betrachtenden in den Dialog zu treten. </p> + <p>Dotzler definiert auch die Vorgeschichte, die im Roman nicht ausgeführt wird, + als mögliche Leerstelle. Die Unbestimmtheit des Anfangs (Vorgeschichte und + ungeklärte Sprechsituation) weckt das Interesse des / der Lesenden und führt + dazu, dass dieser / diese weiterlesen will.<note type="footnote">Vgl. <ref + type="bibliography" target="#dotzler_leerstellen_2021">Dotzler + 2021</ref>, S. 153–154.</note> Damit hat die Leerstelle eine wichtige + Funktion für den Roman. Indem auch die digitale Lücke eine gewisse + Rätselhaftigkeit aufwirft, kann auch sie dazu beitragen, das Interesse des / + der Schauenden zu gewinnen und eine Beschäftigung mit den Inhalten einer + Datenbank anzustoßen. Dieses Potenzial meinen möglicherweise auch die SKD, wenn + sie im Kontext der Veränderung einiger Werktitel oder Ausblendung + diskriminierender Begriffe von einem <quote>[…] didaktischen Ansatz, der die + Historie des Begriffs nicht ausblendet, sondern sie im Gegenteil sichtbar + macht; da wird Bewusstsein geschaffen […</quote>]<note type="footnote"><ref + type="bibliography" target="#soltau_debatte_2021">Soltau + 2021</ref>.</note> sprechen. Damit kann die Lücke nicht nur Dinge + verschweigen, sondern, im Gegenteil, auf das Nichtexistierende aufmerksam + machen. Im Falle der SKD könnte eine Ausblendung der Begriffe den / die + Betrachtenden also erst auf deren Problematik hinweisen und eine Beschäftigung + mit der Thematik fördern. Denn: <quote>Often, with loss comes a recognition of + the significance and value of that which is absent or missing.</quote> + <note type="footnote"><ref type="bibliography" + target="#castriota_fragment_2021">Castriota / Marçal 2021</ref>, S. 74. + </note> + </p> + <p>Während der Recherche sind weitere mögliche Anknüpfungspunkte sichtbar + geworden, die in der poststrukturalistischen Sprachtheorie verankert sind. Im + Rahmen dieses Beitrags können sie nur genannt werden, eine tiefergehende + Auseinandersetzung muss Folgeforschung bleiben. Ein erster Anknüpfungspunkt + besteht in Jacques Derridas (1930–2004) Konzept der <term type="dh" + >différance</term>, das sich durch die Eigenschaft auszeichnet, <quote>[…] + den Sinn immer aufzuschieben und seine Präsenz unmöglich zu machen […]. Da + der Sinn niemals vollständig festgehalten werden kann, versucht das + logozentrische Denken, den Aufschub dadurch ungeschehen zu machen, dass es + die fehlende Präsenz ergänzt, in der Hoffnung, die Lücke, die der Aufschub + hinterlassen hat, vollständig zu besetzen.</quote> + <note type="footnote"><ref type="bibliography" + target="#muenkner_poststrukturalismus_2012">Münker / Roesler 2012</ref>, + S. 47. </note> Gilles Deleuze (1925–1995) thematisiert in seiner + Sprachphilosophie das Verhältnis von Sinn und Unsinn, wobei er letzteres als + ein ›leeres Feld‹ bezeichnet;<note type="footnote"> Vgl. <ref + type="bibliography" target="#muenkner_poststrukturalismus_2012">Münker / + Roesler 2012</ref>, S. 58.</note> auch dieses Verständnis könnte für eine + Lücken-Debatte interessant sein. Schließlich findet sich auch in den Schriften + von Jean-François Lyotard (1924–1998) ein möglicher Anknüpfungspunkt, nämlich + wenn er sich mit dem Schweigen auseinandersetzt, das er als <quote>Substitut + eines Satzes sieht[.]</quote> + <note type="footnote"><ref type="bibliography" + target="#muenkner_poststrukturalismus_2012">Münker / Roesler 2012</ref>, + S. 61.</note> + </p> + </div> + </div> + <div type="chapter"> + <head>7. Schluss</head> + <p>Was ist die digitale Lücke? Und welche Arten gibt es im Kontext der + Kunstgeschichte und Provenienzforschung? Basierend auf einer Studie verschiedener + Datenbanken und mithilfe der Datenmodellierung wurden + mögliche digitale Lücken identifiziert und auf Grundlage dieser eine Typologie + erstellt. Zu den möglichen Arten gehören digitale Abbildungs-, Informations-, oder + Bestandslücken. Dabei wurde bereits zu Beginn betont, dass ein vollständiger + Lücken-Katalog nicht zu leisten ist, denn <quote>[… je genauer man hinsieht, umso + deutlicher wird, dass Leerstellen nicht die Ausnahme, sondern der Normalfall + sind.</quote> + <note type="footnote"><ref type="bibliography" target="#dotzler_leerstellen_2021" + >Dotzler 2021</ref>, S. 162. Dotzler schreibt dies im Kontext einer + Untersuchung der Leerstelle in den Literaturwissenschaften, im Speziellen in + Bezug auf Goethes Briefroman Die Leiden des jungen Werther (vgl. <ref + type="bibliography" target="#dotzler_leerstellen_2021">Dotzler + 2021</ref>).</note> Eine Beschäftigung mit den Ursachen zeigte, dass neben + lückenhaften analogen Beständen auch andere Gründe zu Lücken im Digitalen führen: + dazu gehören u. a. rechtliche Restriktionen, ethische Bedenken oder fehlende + finanzielle und personelle Ressourcen. Die enorme Bedeutung fehlender Ressourcen + für die Entstehung von digitalen Lücken wurde im Vorfeld nicht vermutet und ist + eine wichtige Erkenntnis des Beitrags. Indem mehr Ressourcen für die + Digitalisierung, Aufbereitung der Daten, aber vor allem für die Pflege der + Datenbanken zur Verfügung gestellt werden – und das nicht nur in Form von + Drittmittelprojekten –, könnte die Anzahl der digitalen Lücken erheblich + verringert werden. </p> + <p>Die Motivation, einen Beitrag über die Lücke im Digitalen zu verfassen, basiert + auf einer Auseinandersetzung der Autorin mit der Abbildung von Provenienzangaben + und darin enthaltenen Lücken in online Sammlungen deutscher Museen. Diese zeigte, + dass Lücken nicht ausreichend markiert werden und keinem Standard folgen. Sodann + kam die Frage auf, warum eine Auseinandersetzung mit Lücken und deren Sichtbarkeit + besonders wichtig im Digitalen ist. Der Beitrag führt dafür mehrere Gründe an: + Viele digitale Lücken sind unsichtbar; die Informationsfülle und die dadurch + suggerierte ›verführerische Vollständigkeit‹ oder die Flüchtigkeit im Netz. Die + Lücke ist zumeist negativ konnotiert. Auf Grundlage dessen wurde im letzten + Abschnitt die daran anschließende Frage gestellt, ob die Lücke auch eine positive + Qualität hat. Dabei wurde vor allem Bezug auf die Literaturwissenschaften + genommen, wo die Lücke in Texten dazu dient, den Lesenden zur Mitarbeit + aufzufordern und gleichzeitig dessen Interesse zu wecken. </p> + <p>Als Nutzende von Datenbanken sind wir aufgefordert, auch auf das Fehlende zu + schauen und uns zu fragen, was fehlt und warum. Wer entscheidet, was zur digitalen + Lücke wird und welche Absichten verbergen sich dahinter? Es ist utopisch + anzunehmen, dass das Digitale in naher Zukunft lückenlos sein wird – und dieser + Zustand ist vielleicht auch gar nicht erstrebenswert. Damit wir uns aber der + digitalen Lücken bewusst werden und sie entsprechend bewerten können, müssen + Lücken explizit markiert und im Idealfall sogar erklärt und bewertet werden. Indem + der Beitrag Arten digitaler Lücken in der Kunstgeschichte und Provenienzforschung + und deren Ursachen benennt, will er für die Präsenz von Lücken im Netz + sensibilisieren und daran anschließend eine weitere disziplinübergreifende + Bearbeitung des Themas anstoßen. Auf Grundlage des Beitrags ist folgende + Folgeforschung denkbar: die Betrachtung weiterer Datenbanken außerhalb der + Kunstgeschichte und Provenienzforschung, auch außerhalb Deutschlands und damit + verbunden die Erweiterung der Typologie; eine Beschäftigung mit den Begriffen + Unsicherheit und Unschärfe; eine eingehende Auseinandersetzung mit positiven + Qualitäten der Lücke und den genannten möglichen Anknüpfungspunkten innerhalb der + poststrukturalistischen Sprachtheorie; und schließlich die Modellierung der Lücke + in der Informatik. </p> + </div> + <div type="bibliography"> + <head>Bibliografische Angaben</head> + <listBibl> + + <bibl xml:id="andraschke_hg_objekte_2020">Objekte im Netz. Wissenschaftliche + Sammlungen im digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner. + Bielefeld 2020. (= Digitale Gesellschaft, 33). PDF. [<ref + target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf" + >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl> + <bibl xml:id="andraschke_objekte_2020">Udo Andraschke / Sarah Wagner: Objekte im Netz. In: Objekte im Netz. Wissenschaftliche + Sammlungen im digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner. + Bielefeld 2020, S. 9–12. (= Digitale Gesellschaft, 33). PDF. [<ref + target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf" + >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl> + <bibl xml:id="bacon_vagueness_2018">Andrew Bacon: Vagueness and Thought. Oxford + 2018. <ptr type="gbv" cRef="1012187241"/></bibl> + <bibl xml:id="brinkbaeumer_kunstwerk_2013">Klaus Brinkbäumer: Was warum bleibt. + Welches Kunstwerk, welche Leistung von heute wird in 100 Jahren noch + unvergessen sein? In: Der Spiegel (2013), H. 1, S. 122–123. <ptr type="gbv" + cRef="320524949"/></bibl> + <bibl xml:id="castriota_fragment_2021">Brian Castriota / Hélia Marçal: Always + Already Fragment: Integrity, Deferral, and Possibility in the Conservation of + Cultural Heritage. In: Das Fragment im digitalen Zeitalter. Möglichkeiten und + Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula Schädler-Saub / + Angela Weyer. (Internationale Fachtagung ›Das Fragment im digitalen Zeitalter - + Möglichkeiten und Grenzen neuer Techniken in der Restaurierung‹, Hildesheim, + 07.08.–08.08.2021) Berlin 2021, S. 63–79. <ptr type="gbv" cRef="1748027042" + /></bibl> + <bibl xml:id="cidoc_definition_2021">Definition of the CIDOC Conceptual Reference + Model. Hg. von CIDOC CRM Special Interest Group. Version 7.1.1. Bd. 1. April + 2021. PDF. DOI: <ref target="https://doi.org/10.26225/FDZH-X261" + >10.26225/FDZH-X261</ref> + </bibl> + <bibl xml:id="criado_frauen_2020">Caroline Criado-Perez / Stephanie Singh: + Unsichtbare Frauen. Wie eine von Daten beherrschte Welt die Hälfte der + Bevölkerung ignoriert. München 2020. (= btb, 71887). <ptr type="gbv" + cRef="1665235292"/></bibl> + <bibl xml:id="daraban_figuren_2017">Adria Daraban: Figuren des Fragmentarischen. + Fragmentierung als ästhetisches Prinzip in der Architekturproduktion des 20. + Jahrhunderts. In: Mimetische Praktiken in der neueren Architektur. Prozesse und + Formen der Ähnlichkeitserzeugung. Hg. von Eva von Engelberg-DoÄkal / Markus + Krajewski / Frederike Lausch. Heidelberg 2017, S. 168–183. PDF. DOI: <ref + target="https://doi.org/10.11588/arthistoricum.221.291" + >10.11588/arthistoricum.221.291</ref> + </bibl> + <bibl xml:id="deinert_enteignet_2022">Enteignet, entzogen, verkauft. Zur + Aufarbeitung der Kulturgutverluste in SBZ und DDR. Hg. von Mathias Deinert / + Uwe Hartmann / Gilbert Lupfer. Berlin u. a. 2022. (= Provenire, 3) <ptr + type="gbv" cRef="1784949450"/></bibl> + <bibl xml:id="dmb_leitfaden_2011">Leitfaden für die Dokumentation von + Museumsobjekten. Hg. vom Deutschen Museumsbund e. V. Berlin 2011. PDF. [<ref + target="https://www.museumsbund.de/wp-content/uploads/2017/03/dmb-dokumentation.pdf" + >online</ref>] </bibl> + <bibl xml:id="dzk_leitfaden_2019">Leitfaden Provenienzforschung. Zur + Identifizierung von Kutlurgut, das während der nationalsozialistischen + Herrschaft verfolgungsbedingt entzogen wurde. Hg. vom Deutschen Zentrum + Kulturgutverluste / Arbeitskreis Provenienzforschung e.  V. / Arbeitskreis + Provenienzforschung und Restitution – Bibliotheken Deutscher Bibliotheksverband + e.  V. / Deutscher Museumsbund e.  V. / ICOM Deutschland e.  V. Berlin 2019. + PDF. [<ref + target="https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Download.pdf;jsessionid=AD3D42876F17B4B5C060A8A741861F66.m0?__blob=publicationFile&v=3https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Download.pdf" + >online</ref>] </bibl> + <bibl xml:id="dotzler_leerstellen_2021">Bernhard Dotzler: Leerstellen. In: + Literaturwissenschaft. Einführung in ein Sprachspiel. Hg. von Heinrich Bosse / + Ursula Renner. 3., aktualisierte Auflage. Baden-Baden 2021, S. 153–169. (= + intro: Literaturwissenschaft) <ptr type="gbv" cRef="1765493773"/></bibl> + <bibl xml:id="edenheiser_missing_2021">What’s Missing? Collecting and Exhibiting + Europe. Hg. von Iris Edenheiser / Elisabeth Tietmeyer / Susanne Boersma. Berlin + 2021. (= Schriftenreihe / Museum Europäischer Kulturen, 24) <ptr type="gbv" + cRef="1737792435"/></bibl> + <bibl xml:id="farrenkopf_logik_2021">Logik und Lücke: die Konstruktion des + Authentischen in Archiven und Sammlungen. Hg. von Michael Farrenkopf / Andreas + Ludwig / Achim Saupe / Jürgen Bacia. (Logik und Lücke. Zur Konstruktion des + Authentischen in Archiven und Sammlungen, München, 04.04.–05.04.2019). + Göttingen 2021. (= Wert der Vergangenheit, 2) <ptr type="gbv" cRef="1698174861" + /></bibl> + <bibl xml:id="freitag_unschaerfe_2018">Unschärfe: der Umgang mit fehlender + Eindeutigkeit. Hg. von Steffen Freitag / Michaela Geierhos / Rozbeh Asmani / + Judit I. Haug. Paderborn 2018. (= Nordrhein-Westfälische Akademie der + Wissenschaften und der Künste – Junges Kolleg) <ptr type="gbv" + cRef="1010711717"/></bibl> + <bibl xml:id="fricke_destroyed_2022">Destroyed – Disappeared – Lost – Never Were. + Hg. von Beate Fricke / Aden Kumler. University Park, PA 2022. (= ICMA books – + viewpoints) <ptr type="gbv" cRef="1789752264"/></bibl> + <bibl xml:id="geldmacher_luecken_2022">Elisabeth Geldmacher / Nadine Kulbe: + Unvermeidbar! Über Lücken in der NS-Raubgut-Forschung und Möglichkeiten, mit + ihnen umzugehen. In: Archivar 75 (2022), H. 1, S. 31–34. PDF. [<ref + target="https://www.archive.nrw.de/sites/default/files/media/files/Archivar_2022-1_Internet-NEU-28032022_Mod.pdf" + >online</ref>]</bibl> + <bibl xml:id="goetz_luecke_2019">›Lücke‹. In: Langenscheidt Großwörterbuch: + Deutsch als Fremdsprache. Das einsprachige Wörterbuch für alle, die Deutsch + lernen. Hg. von Dieter Götz in Zusammenarbeit mit der Langenscheidt-Redaktion. + München u. a. 2019, S. 721. <ptr type="gbv" cRef="1666222399"/></bibl> + <bibl xml:id="grossmann_challenge_2012">The Challenge of the Object. Die + Herausforderung des Objekts. Hg. von Georg Ulrich Großmann / Petra Krutisch. + (33. Internationaler Kunsthistoriker-Kongress, Nürnberg, 15.07.–20.07.2012). 4 + Bde. Nürnberg 2012 / 2013. <ptr type="gbv" cRef="721978991"/></bibl> + <bibl xml:id="haase_einfuehrung_2022">Sven Haase / Maike Hopp: Einführung in den + Themenschwerpunkt. In: Archivar 75 (2022), H.1, S. 6–10. PDF. [<ref + target="https://www.archive.nrw.de/sites/default/files/media/files/Archivar_2022-1_Internet-NEU-28032022_Mod.pdf" + >online</ref>]</bibl> + <bibl xml:id="haffner_provenienzforschung_2019">Dorothee Haffner: + Provenienzforschung digital vernetzt. Ergebnisse sichtbar machen. In: + Museumskunde 84 (2019), S. 90–97. PDF. [<ref + target="https://www.museumsbund.de/wp-content/uploads/2022/07/museumskunde-2019-1-online.pdf" + >online</ref>] </bibl> + <bibl xml:id="haffner_provenienzen_2020">Dorothee Haffner: Provenienzen in + Sammlungsdatenbanken. Digitale und virtuelle Chancen für die Vermittlung. In: + Provenienz & Forschung. Digitale Provenienzforschung. Hg. vom Deutschen + Zentrum Kulturgutverluste. Magdeburg 2020, S. 36–41. (= Provenienz & + Forschung, 2020.1) <ptr type="gbv" cRef="1699332177"/></bibl> + <bibl xml:id="hannemann_beruecksichtigung_2010">Jens Hannemann: Die + Berücksichtigung inhaltlicher und räumlicher Unschärfe bei der GIS-gestützten + Erstellung von Bodenkarten. Aachen 2010. <ptr type="gbv" cRef="1604658843" + /></bibl> + <bibl xml:id="jannidis_humanities_2017">Digital Humanities. Eine Einführung. Hg. + von Fotis Jannidis / Hubertus Kohle / Malte Rehbein. Stuttgart 2017. DOI: + 10.1007/978-3-476-05446-3 </bibl> + <bibl xml:id="kaiser_gedaechtnis_2021">Kulturelles Gedächtnis. Kriegsverluste + deutscher Museen. Wege und Biografien. Hg. von Britta Kaiser-Schuster. Wien u. + a. 2021. (= Studien zu kriegsbedingt verlagerten Kulturgütern, 3) <ptr + type="gbv" cRef="175730102X"/></bibl> + <bibl xml:id="kastens_modellierung_2018">Uwe Kastens / Hans Kleine Büning: + Modellierung: Grundlagen und formale Methoden. 4., erweiterte Auflage. München + 2018. DOI: 10.3139/9783446455399</bibl> + <bibl xml:id="kempcke_luecke_2000">›Lücke‹. In: Wörterbuch Deutsch als + Fremdsprache. Hg. von Günter Kempcke. Berlin u. a. 2000, S. 639. (= + De-Gruyter-Wörterbuch) <ptr type="gbv" cRef="306466562"/></bibl> + <bibl xml:id="knaus_lido_2019">Gudrun Knaus / Angela Kailus / Regine Stein: + LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen + Objekten. Hg. vom Deutschen Dokumentationszentrum für Kunstgeschichte – + Bildarchiv Foto Marburg / Christian Bracht. 2 Bde. Bd. 1: Graphik. Heidelberg + 2019. DOI: <ref target="https://doi.org/10.11588/arthistoricum.382.544" + >10.11588/arthistoricum.382.544</ref> + </bibl> + <bibl xml:id="knaus_lido_2022">Gudrun Knaus / Angela Kailus / Regine Stein: + LIDO-Handbuch für die Erfassung und Publikation von Metadaten zu kulturellen + Objekten. Hg. vom Deutschen Dokumentationszentrum für Kunstgeschichte – + Bildarchiv Foto Marburg / Christian Bracht. 2 Bde. Bd. 2: Malerei und Skulptur. + Heidelberg 2022. PDF. DOI: <ref + target="https://doi.org/10.11588/arthistoricum.1026" + >10.11588/arthistoricum.1026</ref> + </bibl> + <bibl xml:id="kohle_museen_2018">Hubertus Kohle: Museen digital. Eine + Gedächtnisinstitution sucht den Anschluss an die Zukunft. Heidelberg 2018. DOI: + <ref target="https://doi.org/10.17885/heiup.365.515" + >10.17885/heiup.365.515</ref> + <ptr type="gbv" cRef="1030477159"/></bibl> + <bibl xml:id="kocourek_leitfaden_2019">Jana Kocourek / Katja Lindenau / Ilse von + zur Mühlen / Johanna Poltermann: Leitfaden Provenienzforschung. Anhang. Berlin + 2019. [<ref + target="https://www.kulturgutverluste.de/Content/03_Recherche/DE/Leitfaden-Anlage-Download.pdf?__blob=publicationFile&v=3" + >online</ref>] </bibl> + <bibl xml:id="little_analysis_2019">Roderick J. A. Little / Donald B. Rubin: + Statistical Analysis with Missing Data. 3. Auflage. Hoboken, NJ 2019. DOI: + 10.1002/9781119482260</bibl> + <bibl xml:id="muenkner_poststrukturalismus_2012">Stefan Münker / Alexander + Roesler: Poststrukturalismus. 2., aktualisierte und erweiterte Auflage. + Stuttgart u.a. 2012. (= Sammlung Metzler, 322) <ptr type="gbv" cRef="716804581" + /></bibl> + <bibl xml:id="muennich_quellenverluste_2019">Stefan Münnich: Quellenverluste + (Deperdita) als methodologischer Unsicherheitsbereich für Editorik und + Datenmodellierung am Beispiel von Anton Weberns George-Lied op. 4 Nr. 5. In: + Die Modellierung des Zweifels – Schlüsselideen und -konzepte zur graphbasierten + Modellierung von Unsicherheiten. Hg. von Andreas Kuczera / Thorsten Wübbena / + Thomas Kollatz. Wolfenbüttel 2019. (= Zeitschrift für digitale + Geisteswissenschaften / Sonderbände, 4) HTML. DOI: <ref + target="https://doi.org/10.17175/sb004_005">10.17175/sb004_005</ref> + </bibl> + <bibl xml:id="nasarek_forschungsumgebung_2020">Robert Nasarek: Virtuelle + Forschungsumgebungen und Sammlungsräume. Objekte digital modellieren und + miteinander vernetzen. In: Objekte im Netz. Wissenschaftliche Sammlungen im + digitalen Wandel. Hg. von Udo Andraschke / Sarah Wagner. Bielefeld 2020, S. + 131–147. (= Digitale Gesellschaft, 33) PDF. [<ref + target="https://www.transcript-verlag.de/media/pdf/2b/c5/9e/oa97838394557157NBBTgznCZyNg.pdf" + >online</ref>] <ptr type="gbv" cRef="1737818639"/></bibl> + <bibl xml:id="ntoutsi_bias_2020">Eirini Ntoutsi / Pavlos Fafalios / Ujwal Gadiraju + / Vasileios Iosifidis / Wolfgang Nejdl / Maria-Esther Vidal / Salvatore + Ruggieri / Franco Turini / Symeon Papadopoulos / Emmanouil Krasanakis / Ioannis + Kompatsiaris / Katharina Kinder-Kurlanda / Claudia Wagner / Fariba Karimi / + Miriam Fernandez / Harith Alani / Bettina Berendt / Tina Kruegel / Christian + Heinze / Klaus Broelemann / Gjergji Kasneci / Thanassis Tiropanis / Steffen + Staab: Bias in Data-Driven Artificial Intelligence Systems. An Introductory + Survey. In: WIREs. Data mining and knowledge discovery 10 (2020), H. 3. + 03.02.2020. HTML. DOI: <ref target="https://doi.org/10.1002/widm.1356" + >10.1002/widm.1356</ref> + </bibl> + <bibl xml:id="fragment_zeitalter_2021">Das Fragment im digitalen Zeitalter. + Möglichkeiten und Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula + Schädler-Saub / Angela Weyer. (Internationale Fachtagung ›Das Fragment im + digitalen Zeitalter - Möglichkeiten und Grenzen neuer Techniken in der + Restaurierung‹, Hildesheim, 07.08.–08.08.2021) Berlin 2021. <ptr type="gbv" + cRef="1748027042"/></bibl> + <bibl xml:id="schaedler_fragment_2021">Ursula Schädler-Saub: Das Fragment zwischen + realer und virtueller Ergänzung. In: Das Fragment im digitalen Zeitalter. + Möglichkeiten und Grenzen neuer Techniken für die Restaurierung. Hg. von Ursula + Schädler-Saub / Angela Weyer. (Internationale Fachtagung ›Das Fragment im + digitalen Zeitalter - Möglichkeiten und Grenzen neuer Techniken in der + Restaurierung‹, Hildesheim, 07.08.–08.08.2021) Berlin 2021, S. 17–44. <ptr + type="gbv" cRef="1748027042"/></bibl> + <bibl xml:id="schaeffler_networks_2022">Networks of Care. Politiken des + (Er)haltens und (Ent)sorgens. Hg. von Anna Schäffler / Friederike Schäfer / + Nanne Buurman. Berlin 2022. <ptr type="gbv" cRef="1802544259"/></bibl> + <bibl xml:id="schawe_verluste_2019">Martin Schawe: Die Verluste der Bayerischen + Staatsgemäldesammlungen im Zweiten Weltkrieg. Wien u. a. 2019. (= Schriften der + Bayerischen Staatsgemäldesammlungen, 3) <ptr type="gbv" cRef="1040598935" + /></bibl> + <bibl xml:id="schenk_aufheben_2013">Dietmar Schenk: ›Aufheben, was nicht vergessen + werden darf‹. Archive vom alten Europa bis zur digitalen Welt. Stuttgart 2013. + (= Wissenschaftsgeschichte) <ptr type="gbv" cRef="740804855"/></bibl> + <bibl xml:id="schneider_kriegsverluste_2013">Nicole Schneider: Die Kriegsverluste + der Musiksammlungen deutscher Bibliotheken 1942–1945. Dissertation, Universität + Zürich. 2013. PDF. [<ref + target="https://www.blb-karlsruhe.de/files/user_upload/PDF/7_Textarchiv/2013_Schneider_Kriegsverluste.pdf" + >online</ref>] </bibl> + <bibl xml:id="soltau_debatte_2021">Hannes Soltau: Debatte um Umbenennung von + Kunstwerken. In Dresdner Museen findet weder ein ›Bildersturm‹ noch ›Zensur‹ + statt. In: Tagesspiegel. Beitrag vom 15.09.2021. [<ref + target="https://www.tagesspiegel.de/kultur/in-dresdner-museen-findet-weder-ein-bildersturm-noch-zensur-statt-4276738.html" + >online</ref>] </bibl> + <bibl xml:id="staud_datenmodellierung_2005">Josef L. Staud: Datenmodellierung und + Datenbankentwurf. Ein Vergleich aktueller Methoden. Berlin u.a. 2005. DOI: + 10.1007/b137949 <ptr type="gbv" cRef="524939284"/></bibl> + <bibl xml:id="steinaecker_ende_2021">Thomas von Steinaecker: Ende offen. Das Buch + der gescheiterten Kunstwerke. Frankfurt / Main 2021. <ptr type="gbv" + cRef="1756520453"/></bibl> + <bibl xml:id="syropoulos_vagueness_2021">Vagueness in the Exact Sciences. Impacts + in Mathematics, Physics, Chemistry, Biology, Medicine, Engineering and + Computing. Hg. von Apostolos Syropoulos / Basil K. Papadopoulos. Berlin 2021. + <ptr type="gbv" cRef="1756534578"/></bibl> + <bibl xml:id="syropoulos_introduction_2020">Apostolos Syropoulos / Theophanes + Grammenos: A Modern Introduction to Fuzzy Mathematics. Hoboken, New Jersey + 2020. (= STEM) <ptr type="gbv" cRef="1690994339"/></bibl> + <bibl xml:id="tuernich_provenienzforschung_2019">Ruth Türnich: Provenienzforschung + weiterdenken. Vermittlung von Provenienzrecherchen und Forschungsergebnissen. + In: rheinform. Information für die rheinischen Museen. Hg. vom LVR-Dezernat + Kultur und Landschaftliche Kulturpflege, Landesschaftsverband Rheinland (2019), + H. 2, S. 19–25. PDF. [<ref + target="https://rheinform.lvr.de/media/medienrheinform/archiv/rheinform_2-2019.pdf" + >online</ref>] </bibl> + <bibl xml:id="ullrich_geschichte_2009">Wolfgang Ullrich: Die Geschichte der + Unschärfe. Veränderte und ergänzte Neuausgabe. Berlin 2009. (= Wagenbachs + Taschenbuch, 626) <ptr type="gbv" cRef="602667321"/></bibl> + <bibl xml:id="wintergruen_netzwerkanalysen_2019">Dirk Wintergrün: Netzwerkanalysen + und semantische Datenmodellierung als heuristische Instrumente für die + historische Forschung. Dissertation, Friedrich-Alexander-Universität + Erlangen-Nürnberg. 2019. PDF. URN: <ref + target="https://nbn-resolving.org/urn:nbn:de:bvb:29-opus4-111899" + >urn:nbn:de:bvb:29-opus4-111899</ref> + </bibl> + </listBibl> + <div type="subchapter"> + <head>Internetquellen</head> + </div> + <div type="subchapter"> + <head>Blogbeiträge</head> + <listBibl> + <bibl xml:id="enderlein_datenbank_2023">Angelika Enderlein / Monika Flacke: Die + Datenbank des ›Central Collecting Point München‹. Datenbank zum ›Central + Collecting Point München‹, Deutsches Historisches Museum. Letzer Zugriff: + 13.01.2023. PDF. [<ref + target="https://www.dhm.de/datenbank/ccp/prj_dhm_ccp/ccp_einleitung_de.pdf" + >online</ref>] </bibl> + <bibl xml:id="luther_digitization_2022">Anne Luther: Digitization And Data + Management in Museums. In: Anne Luther. Blogbeitrag vom 23.10.2022. [<ref + target="http://anneluther.info/texts">online</ref>]</bibl> + <bibl xml:id="schmeisser_beckmann_2021">Iris Schmeisser: Die Beckmann Sammlung im + Städel. Eine wechselvolle Geschichte. In: Städelblog. Blogbeitrag vom + 05.02.2021. [<ref + target="https://blog.staedelmuseum.de/max-beckmann-sammlung-im-staedel/" + >online</ref>]</bibl> + </listBibl> + </div> + <div type="subchapter"> + <head>Webseiten</head> + <listBibl> + <bibl xml:id="bsgs_sammlung_2022">Sammlung. Hg. von den Bayerischen + Staatsgemäldesammlungen. Letzter Zugriff: 02.11.2022. [<ref + target="https://www.sammlung.pinakothek.de">online</ref>]</bibl> + <bibl xml:id="bvbk_urheberrecht_2023">Urheberrecht. In: Bundesverband Bildender + Künstlerinnen und Künstler. Hg. vom Bundesverband Bildender Künstlerinnen und + Künstler. Letzter Zugriff: 10.02.2023. [<ref + target="https://www.bbk-bundesverband.de/beruf-kunst/urheberrecht" + >online</ref>]</bibl> + <bibl xml:id="cidoc_crm_2022">CIDOC CRM. Conceptual Reference Model. Letzter + Zugriff: 10.11.2022. [<ref target="https://www.cidoc-crm.org">online</ref>] </bibl> + <bibl xml:id="cc_sa_2023">Creative-Commons, Attribution-ShareAlike 4.0 + International (CC BY-SA 4.0). Letzter Zugriff: 13.01.2023. [<ref + target="https://creativecommons.org/licenses/by-sa/4.0/" + >online</ref>]</bibl> + <bibl xml:id="dhm_datenbank_2009">Datenbank zum ›Central Collecting Point + München‹. Hg. vom Deutschen Historischen Museum. Juni 2009. [<ref + target="https://www.dhm.de/datenbank/ccp/">online</ref>] </bibl> + <bibl xml:id="mpi_decay_2022">Decay, Loss, and Conservation in Art History. 2022. + In: Bibliotheca Hertziana. Max-Planck-Institut für Kunstgeschichte. Letzter + Zugriff: 11.11.2022. [<ref + target="https://www.biblhertz.it/research-group-borgo">online</ref>] </bibl> + <bibl xml:id="ddk_bildindex_2022">Bildindex der Kunst & Architektur. Hg. vom + Deutschen Dokumentationszentrum für Kunstgeschichte – Bildarchiv Foto Marburg, + Philipps-Universität Marburg. Letzter Zugriff: 02.11.2022. [<ref + target="https://www.bildindex.de">online</ref>]</bibl> + <bibl xml:id="fek_datenbank_2010">Datenbank ›Entartete Kunst‹. Hg. von der + Forschungsstelle ›Entartete Kunst‹. 2010. [<ref + target="https://www.geschkult.fu-berlin.de/e/db_entart_kunst/datenbank" + >online</ref>] </bibl> + <bibl xml:id="skd_leitlinien_2023">Ethische Leitlinien der Online Collection + (Arbeitsprozess, diskriminierungsfreie Sprache, sensible Objekte). In: + Staatliche Kunstsammlungen Dresden. Online Collection. Letzter Zugriff: + 13.01.2023. [<ref target="https://skd-online-collection.skd.museum" + >online</ref>] </bibl> + <bibl xml:id="gnm_fragen_2023">Fragen und Antworten. In: Germanisches + Nationalmuseum. Hg. vom Germanischen Nationalmuseum Nürnberg (2023b). Letzter + Zugriff: 23.01.2023. [<ref + target="https://www.gnm.de/services/haeufige-fragen/">online</ref>]</bibl> + <bibl xml:id="gnm_objektkatalog_2023">Germanisches Nationalmuseum. Objektkatalog. + Hg. vom Germanischen Nationalmuseum (2023a). Letzter Zugriff: 04.01.2023. [<ref + target="https://objektkatalog.gnm.de">online</ref>]</bibl> + <bibl xml:id="brd_gesetz_2023">Gesetz über Urheberrecht und verwandte Schutzrechte + (Urheberrechtsgesetz). § 64 Allgemeines. Hg. von der Bundesrepublik + Deutschland, vertreten durch den Bundesminister der Justiz. Letzter Zugriff: + 13.01.2023. [<ref target="https://www.gesetze-im-internet.de/urhg/__64.html" + >online</ref>] </bibl> + <bibl xml:id="grundsaetze_2018">Grundsätze zur Eintragung und Löschung von + Meldungen in die Lost Art-Datenbank. Stand Mai 2018. PDF. [<ref + target="https://www.kulturgutverluste.de/Content/08_Downloads/DE/Grundsaetze-Eintragung-Loeschung-Lost-Art.pdf?__blob=publicationFile&v=4" + >online</ref>]</bibl> + <bibl xml:id="kulturgutverluste_2022">Kulturgutverluste / German Lost Art + Foundation: Lost Art und Löschungen. Kolloquium Provenienzforschung. YouTube. + 04.07.2022. [<ref target="https://www.youtube.com/watch?v=GSNMdFhKvWc" + >online</ref>] </bibl> + <bibl xml:id="kik_prometheus_2022">Prometheus. Das verteilte digitale Bildarchiv + für Forschung & Lehre. Hg. vom Kunsthistorischen Institut der Universität + zu Köln. Letzter Zugriff: 02.11.2022. [<ref + target="https://prometheus-bildarchiv.de">online</ref>] </bibl> + <bibl xml:id="kik_laura_2022">Laura: Diskriminierende Begriffe im Bildarchiv. In: + Prometheus. Das verteilte digitale Bildarchiv für Forschung & Lehre. Hg. + vom Kunsthistorischen Institut der Universität zu Köln. 23.09.2022. [<ref + target="https://prometheus-bildarchiv.de/blog/diskriminierende-begriffe-im-bildarchiv" + >online</ref>]</bibl> + <bibl xml:id="nfdi_2022">Nationale Forschungsdateninfrastruktur (NFDI). Letzter + Zugriff: 27.10.2022. [<ref target="https://www.nfdi.de/">online</ref>]</bibl> + <bibl xml:id="nfdifm_2022">NFDI for Memory (NFDI4Memory). 15.12.2022. [<ref + target="https://4memory.de">online</ref>] </bibl> + <bibl xml:id="skd_2023">Staatliche Kunstsammlungen Dresden. Letzter Zugriff: + 19.01.2023. [<ref target="https://www.skd.museum">online</ref>] </bibl> + <bibl xml:id="skd_eng_2023">Staatliche Kunstsammlungen Dresden [englische + Sprachversion]. Letzter Zugriff: 19.01.2023. [<ref + target="https://www.skd.museum/en/">online</ref>]</bibl> + <bibl xml:id="skd_collection_2023">Staatliche Kunstsammlungen Dresden. Online + Collection. Letzter Zugriff: 04.01.2023. [<ref + target="https://skd-online-collection.skd.museum">online</ref>]</bibl> + <bibl xml:id="staedel_museum_2023">Das Städel Museum. In: Städel Museum Frankfurt. + Hg. vom Städelschen Kunstinstitut (2023a). Letzter Zugriff: 23.01.2023. [<ref + target="https://www.staedelmuseum.de/de/das-staedel-museum">online</ref>] </bibl> + <bibl xml:id="staedel_digisammlung_2023">Digitale Sammlung. In: Städel Museum + Frankfurt. Hg. vom Städelschen Kunstinstitut (2023b). Letzter Zugriff: + 23.01.2023. [<ref target="https://sammlung.staedelmuseum.de">online</ref>] </bibl> + <bibl xml:id="sdzk_art_2000">Lost Art-Datenbank. Hg. von der Stiftung Deutsches + Zentrum Kulturgutverluste (2000a). April 2000. [<ref + target="https://www.lostart.de">online</ref>] </bibl> + <bibl xml:id="sdzk_ueber_2000">Über die Lost Art-Datenbank. In: Lost + Art-Datenbank. Hg. von der Stiftung Deutsches Zentrum Kulturgutverluste + (2000b). April 2000. [<ref target="https://www.lostart.de">online</ref>] </bibl> + <bibl xml:id="sdzk_art_2023">Lost Art-Datenbank. Anleitung für öffentliche + Einrichtungen zur Publikation von Such- und Fundmeldungen in die Lost + Art-Datenbank. Hg. von der Stiftung Zentrum Kulturgutverluste. Letzter Zugriff: + 19.01.2023. PDF. [<ref + target="https://www.lostart.de/de/media/35058/download?attachment" + >online</ref>]</bibl> + <bibl xml:id="met_collection_2020">The Metropolitan Museum of Art Collection API. + GitHub. Letzte Aktualisierung: 17.11.2020. [<ref + target="https://metmuseum.github.io/#object">online</ref>] </bibl> + <bibl xml:id="skd_werke_2023">Vermisste Werke. In: Staatliche Kunstsammlungen + Dresden. Online Collection. Letzter Zugriff: 14.01.2023. [<ref + target="https://skd-online-collection.skd.museum/Kollektion?id=965" + >online</ref>] </bibl> + <bibl xml:id="mww_verschwinden_2022">›Verschwinden‹. Vom Umgang mit materialen + & medialen Verlusten in Archiv und Bibliothek. In: Forschungsverbund + Marbach Weimar Wolfenbüttel. Letzter Zugriff: 14.11.2022. [<ref + target="https://www.mww-forschung.de/midterm-tagung">online</ref>] </bibl> + <bibl xml:id="skd_online_2023">Was ist die Online Collection? In: Staatliche + Kunstsammlungen Dresden. Online Collection. Letzter Zugriff: 23.01.2023. [<ref + target="https://skd-online-collection.skd.museum/Ueber">online</ref>]</bibl> + <bibl xml:id="ul_kassation_2023">Was ist eigentlich ›Kassation‹? In: + Universitätsarchiv Leipzig. Letzter Zugriff: 09.02.2023. [<ref + target="https://service.archiv.uni-leipzig.de/was-ist-eigentlich-kassation/" + >online</ref>] </bibl> + </listBibl> + </div> + <div type="subchapter"> + <head>Datenbankobjekte</head> + <listBibl> + <bibl xml:id="bsg_beckmann_2023">Max Beckmann, Bildnisstudie Martha Beckmann im + Profil nach links, 1900. In: Sammlung. Hg. von den Bayerischen + Staatsgemäldesammlungen. Sammlung Moderne Kunst in der Pinakothek der Moderne + München. Inventarnummer: 16521. Letzter Zugriff: 13.01.2023. [<ref + target="https://www.sammlung.pinakothek.de/de/artwork/ZMLJRNVLJv" + >online</ref>] </bibl> + <bibl xml:id="art_beckmann_2011">Max Beckmann, Blumenstrauß in einer Vase. In: + Lost Art-Datenbank. Hg. von der Stiftung Deutsches Zentrum Kulturgutverluste. + Suchmeldung. Lost Art-ID: 437961. 28.06.2011. [<ref + target="https://www.lostart.de/en/Verlust/437961">online</ref>] </bibl> + <bibl xml:id="staedel_beckmann_2023">Max Beckmann, The Synagogue in Frankfurt am + Main, 1919. In: Digitale Sammlung. Städel Museum Frankfurt. Hg. vom Städelschen + Kunstinstitut. Inventarnummer: SG 1239. Letzter Zugriff: 17.01.2023. [<ref + target="https://www.staedelmuseum.de/go/ds/sg1239">online</ref>] </bibl> + <bibl xml:id="bsg_istvan_2023">István Béla Farkas, Max-Beckmann-Medaille, 1978. + In: Sammlung. Hg. von den Bayerischen Staatsgemäldesammlungen. Inventarnummer: + 0. Letzter Zugriff: 13.01.2023. [<ref + target="https://www.sammlung.pinakothek.de/de/artwork/7yxYrQ5LYm" + >online</ref>] </bibl> + <bibl xml:id="art_kirchner_2007">Ernst Ludwig Kirchner, Umschlagzeichnung zu + Boßharts ›Neben der Heerstraße‹. In: Lost Art-Datenbank. Hg. von der Stiftung + Deutsches Zentrum Kulturgutverluste. Suchmeldung. Lost Art-ID: 397844. 2007. + [<ref target="https://www.lostart.de/en/Verlust/397844">online</ref>] </bibl> + <bibl xml:id="kik_kirchner_2023">Ernst Ludwig Kirchner, Cyclamen, 1918–1919. In: + Prometheus. Das verteilte digitale Bildarchiv für Forschung & Lehre. Hg. + vom Kunsthistorischen Institut der Universität zu Köln. Letzter Zugriff: + 03.03.2023. [<ref target="https://prometheus-bildarchiv.de/de/">online</ref>] </bibl> + <bibl xml:id="met_kirchner_2012">Ernst Ludwig Kirchner, Cyclamen, 1918–1919. In: + The Met Collection. Modern and Contemporary Art. Zugangsnummer: 2018.212. + Letzter Zugriff: 03.03.2023. [<ref + target="https://www.metmuseum.org/art/collection/search/490131" + >online</ref>] </bibl> + <bibl xml:id="skd_studer_2023">Johann Gotthelf Studer (Münzmeister): Taler + (Speciestaler, sogenannter ***kopftaler), 1828, Sachsen. In: Staatliche + Kunstsammlungen Dresden. Online Collection. Inventarnummer: AGB12058. Letzter + Zugriff: 24.02.2023. [<ref + target="https://skd-online-collection.skd.museum/Details/Index/1466101" + >online</ref>] </bibl> + <bibl xml:id="staedel_vermeer_2023">Johannes Vermeer, Der Geograf, 1669. In: + Digitale Sammlung. Städel Museum Frankfurt. Hg. vom Städelschen Kunstinstitut. + Inventarnummer: 1149. Letzter Zugriff: 11.02.2023. [<ref + target="https://www.staedelmuseum.de/go/ds/1149">online</ref>] </bibl> + </listBibl> + </div> + </div> + <div type="abbildungsnachweis"> + <head>Abbildungsverzeichnis</head> + <desc type="graphic" xml:id="abb1"> Abbildungslücken in der Online-Sammlung der + BStGS. Ausschnitt aus der Ergebnisliste für die Suche mit ›Max Beckmann‹. [Quelle: + <ref type="bibliography" target="#bsgs_sammlung_2022">Bayerische + Staatsgemäldesammlungen (Hg.) 2022</ref>]<ref type="graphic" + target="#luecke_001"/></desc> + <desc type="graphic" xml:id="abb2">Abbildungslücken im Bildindex. Ausschnitt aus der + Ergebnisliste für die werkbezogene Suche mit ›Max Beckmann‹. [Quelle: <ref + type="bibliography" target="#ddk_bildindex_2022">Deutsches + Dokumentationszentrum für Kunstgeschichte (Hg.) 2022</ref>]<ref type="graphic" + target="#luecke_002"/></desc> + <desc type="graphic" xml:id="abb3">Anzeige des Disclaimers (nach Klick auf die + Asterisken) auf einer Objektansicht innerhalb der Online Collection der SKD. + [Quelle: Johann Gotthelf Studer (Münzmeister): Taler (Speciestaler, sogenannter + ***kopftaler), 1828, <ref type="bibliography" target="#skd_collection_2023" + >Staatliche Kunstsammlungen Dresden. Online Collection 2023</ref>]<ref + type="graphic" target="#luecke_003"/></desc> + <desc type="graphic" xml:id="abb4">Tagesaktuelle Zahlenangaben zum Erfassungsstand + auf der Startseite der Online Collection der SKD. Screenshot vom 23. Januar 2023. + [Quelle: <ref type="bibliography" target="#skd_online_2023">Online Collection, + Staatliche Kunstsammlungen Dresden</ref>]<ref type="graphic" + target="#luecke_004"/></desc> + <desc type="graphic" xml:id="abb5">Die Abbildung zeigt beispielhaft die Kodierung für + ›Johann Joachim Winkelmann sieht die Laokoon-Skulptur‹ mit CIDOC CRM. Zudem sind + einige im Begriffssystem der Ontologie enthaltenen Klassen und Eigenschaften + abgebildet. [Aus: <ref type="bibliography" target="#cidoc_definition_2021">CIDOC + CRM Special Interest Group 2021</ref>, S. 36, fig. 2. CC BY 4.0]<ref + type="graphic" target="#luecke_005"/></desc> + <desc type="graphic" xml:id="abb6">Eine Typologie der digitalen Lücke. Die + Aufstellung listet die im Beitrag identifizierten Lücken, Ursachen und weitere + Eigenschaften. [Sabine Lang Februar 2023]<ref type="graphic" target="#luecke_006" + /></desc> + + </div> + </div> + </body> + </text> +</TEI> diff --git a/2023_003_lang/luecke_2023_001.png b/2023_003_lang/luecke_2023_001.png new file mode 100644 index 0000000000000000000000000000000000000000..8ce8929a5dbefa569eb961430aa8fa9d12c1b503 Binary files /dev/null and b/2023_003_lang/luecke_2023_001.png differ diff --git a/2023_003_lang/luecke_2023_002.png b/2023_003_lang/luecke_2023_002.png new file mode 100644 index 0000000000000000000000000000000000000000..c4ebb7373ff6e0fe0050ca66d23a70a1ab3f0750 Binary files /dev/null and b/2023_003_lang/luecke_2023_002.png differ diff --git a/2023_003_lang/luecke_2023_003.png b/2023_003_lang/luecke_2023_003.png new file mode 100644 index 0000000000000000000000000000000000000000..c31cb5b81d47407688962507209efaa2b276808e Binary files /dev/null and b/2023_003_lang/luecke_2023_003.png differ diff --git a/2023_003_lang/luecke_2023_004.png b/2023_003_lang/luecke_2023_004.png new file mode 100644 index 0000000000000000000000000000000000000000..1086b84f00775438dcc831dbb0a2d1528d58c962 Binary files /dev/null and b/2023_003_lang/luecke_2023_004.png differ diff --git a/2023_003_lang/luecke_2023_005.png b/2023_003_lang/luecke_2023_005.png new file mode 100644 index 0000000000000000000000000000000000000000..f49d9d65b1dc5f0c3bc6c38abe8bb7b0ad63508f Binary files /dev/null and b/2023_003_lang/luecke_2023_005.png differ diff --git a/2023_003_lang/luecke_2023_006.png b/2023_003_lang/luecke_2023_006.png new file mode 100644 index 0000000000000000000000000000000000000000..dc5cd873657e4e17500c2966d6907aea63703272 Binary files /dev/null and b/2023_003_lang/luecke_2023_006.png differ