diff --git a/2022_007_andresen_et_al/nachnutzung_2021_001.png b/2022_007_andresen_et_al/nachnutzung_2021_001.png
new file mode 100644
index 0000000000000000000000000000000000000000..1d5381a9a66f4fad0892208b67820c93d4dd5d80
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_001.png differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_002.png b/2022_007_andresen_et_al/nachnutzung_2021_002.png
new file mode 100644
index 0000000000000000000000000000000000000000..263009def221a6788b3959e95c28ec0542616126
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_002.png differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_003.png b/2022_007_andresen_et_al/nachnutzung_2021_003.png
new file mode 100644
index 0000000000000000000000000000000000000000..c093abe1a8e4aec8d9e92f8a6b1230d623e5f6a2
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_003.png differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_004.png b/2022_007_andresen_et_al/nachnutzung_2021_004.png
new file mode 100644
index 0000000000000000000000000000000000000000..9a125f6a068076c5ad2c9544e8c88a224a84b9e2
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_004.png differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_005.png b/2022_007_andresen_et_al/nachnutzung_2021_005.png
new file mode 100644
index 0000000000000000000000000000000000000000..8f70d439b75314812c6fcea479bb2b9c23b7d659
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_005.png differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_v1_0.pdf b/2022_007_andresen_et_al/nachnutzung_2021_v1_0.pdf
new file mode 100644
index 0000000000000000000000000000000000000000..20c7a4d01c1557c52882033494005e18f339092a
Binary files /dev/null and b/2022_007_andresen_et_al/nachnutzung_2021_v1_0.pdf differ
diff --git a/2022_007_andresen_et_al/nachnutzung_2021_v1_0.xml b/2022_007_andresen_et_al/nachnutzung_2021_v1_0.xml
new file mode 100644
index 0000000000000000000000000000000000000000..3314aff7313f87c95e57eb4f4994ae456ac9e441
--- /dev/null
+++ b/2022_007_andresen_et_al/nachnutzung_2021_v1_0.xml
@@ -0,0 +1,1839 @@
+<?xml version="1.0" encoding="utf-8"?>
+<?xml-model href="https://www.zfdg.de/sites/default/files/schema/tei_zfdg.rnc" type="application/relax-ng-compact-syntax"
+    ?>
+<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html"
+   xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xlink="http://www.w3.org/1999/xlink"
+   xmlns:xhtml="http://www.w3.org/1999/xhtml">
+   <teiHeader>
+      <fileDesc>
+         <titleStmt>
+            <title>
+               <biblStruct>
+                  <analytic>
+                     <title level="a">VorzÃ¼ge von AuszÃ¼gen â€“ Urheberrechtlich geschÃ¼tzte Texte in
+                        den digitalen Geisteswissenschaften (nach-)nutzen</title>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Melanie</forename>
+                                 <surname>Andresen</surname>
+                              </name>
+                              <email>melanie.andresen@ims.uni-stuttgart.de</email>
+                              <idno type="gnd">1143061535</idno>
+                              <idno type="orcid">0000-0002-3913-1273</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤t Stuttgart, Institut fÃ¼r Maschinelle
+                           Sprachverarbeitung</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Markus</forename>
+                                 <surname>GÃ¤rtner</surname>
+                              </name>
+                              <email>markus.gaertner@ims.uni-stuttgart.de</email>
+                              <idno type="gnd">1268973939</idno>
+                              <idno type="orcid">0000-0002-2687-4350</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤t Stuttgart, Institut fÃ¼r Maschinelle
+                           Sprachverarbeitung</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Sibylle</forename>
+                                 <surname>Hermann</surname>
+                              </name>
+                              <email>sibylle.hermann@ub.uni-stuttgart.de</email>
+                              <idno type="gnd">1073989070</idno>
+                              <idno type="orcid">0000-0001-9239-8789</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤tsbibliothek Stuttgart</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Janina</forename>
+                                 <surname>Jacke</surname>
+                              </name>
+                              <email>janina.jacke@uni-goettingen.de</email>
+                              <idno type="gnd">108423968X</idno>
+                              <idno type="orcid">0000-0001-7217-3136</idno>
+                           </persName>
+                        </resp>
+                        <orgName>Georg August UniversitÃ¤t GÃ¶ttingen, Seminar fÃ¼r Deutsche
+                           Philologie</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Nora</forename>
+                                 <surname>Ketschik</surname>
+                              </name>
+                              <email>nora.ketschik@ims.uni-stuttgart.de</email>
+                              <idno type="gnd">1268974390</idno>
+                              <idno type="orcid">0000-0001-8758-5432</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤t Stuttgart, Institut fÃ¼r Maschinelle
+                           Sprachverarbeitung</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Felicitas</forename>
+                                 <surname>Kleinkopf</surname>
+                              </name>
+                              <email>felicitas.kleinkopf@kit.edu</email>
+                              <idno type="gnd">1268974757</idno>
+                              <idno type="orcid">0000-0001-8670-2668</idno>
+                           </persName>
+                        </resp>
+                        <orgName>Karlsruher Institut fÃ¼r Technologie, Institut fÃ¼r Informations- und
+                           Wirtschaftsrecht, Zentrum fÃ¼r Angewandte Rechtswissenschaft</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Jonas</forename>
+                                 <surname>Kuhn</surname>
+                              </name>
+                              <email>jonas.kuhn@ims.uni-stuttgart.de</email>
+                              <idno type="gnd">1064354289</idno>
+                              <idno type="orcid">0000-0003-2860-5960</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤t Stuttgart, Institut fÃ¼r Maschinelle
+                           Sprachverarbeitung</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>
+                           <persName>
+                              <name role="marc_aut">
+                                 <forename>Axel</forename>
+                                 <surname>Pichler</surname>
+                              </name>
+                              <email>axel.pichler@alumni.uni-graz.at</email>
+                              <idno type="gnd">14316130X</idno>
+                              <idno type="orcid">0000-0002-9177-7645</idno>
+                           </persName>
+                        </resp>
+                        <orgName>UniversitÃ¤t Stuttgart, Institut fÃ¼r Maschinelle
+                           Sprachverarbeitung</orgName>
+                     </respStmt>
+
+                     <idno type="doi">10.17175/2022_007</idno>
+                     <idno type="ppn">1816418234</idno>
+                     <idno type="zfdg">2022.007</idno>
+                     <idno type="url">https://www.zfdg.de/node/362</idno>
+                     <date when="2022-11-03">03.11.2022</date>
+                  </analytic>
+                  <monogr>
+                     <title level="j">Zeitschrift fÃ¼r digitale Geisteswissenschaften</title>
+                     <respStmt>
+                        <resp>Publiziert von</resp>
+                        <orgName role="marc_pbl">Herzog August Bibliothek</orgName>
+                     </respStmt>
+                     <respStmt>
+                        <resp>Transformation der Word Vorlage nach TEI</resp>
+                        <persName/>
+                        <name role="marc_trc">
+                           <surname>Baumgarten</surname>
+                           <forename>Marcus</forename>
+                           <idno type="gnd">1192832655</idno>
+                        </name>
+                     </respStmt>
+                     <availability status="free">
+                        <p>Available at <ref target="https://www.zfdg.de">https://www.zfdg.de</ref>
+                        </p>
+                     </availability>
+                     <biblScope unit="year">2022</biblScope>
+                     <biblScope unit="artikel">0a</biblScope>
+                  </monogr>
+               </biblStruct>
+            </title>
+         </titleStmt>
+         <editionStmt>
+            <edition>Elektronische Ausgabe nach TEI P5</edition>
+         </editionStmt>
+         <publicationStmt>
+            <distributor>
+               <name>
+                  <orgName>Herzog August Bibliothek WolfenbÃ¼ttel</orgName>
+               </name>
+            </distributor>
+            <idno type="doi">10.17175/zfdg.01</idno>
+            <idno type="ppn">0819494402</idno>
+            <authority>
+               <name>Herzog August Bibliothek</name>
+               <address>
+                  <addrLine>Lessingplatz 1</addrLine>
+                  <addrLine>38304 WolfenbÃ¼ttel</addrLine>
+               </address>
+            </authority>
+            <authority>
+               <name>Forschungsverbund Marbach Weimar WolfenbÃ¼ttel</name>
+               <address>
+                  <addrLine>Burgplatz 4</addrLine>
+                  <addrLine>99423 Weimar </addrLine>
+               </address>
+            </authority>
+            <availability status="free">
+               <p> Sofern nicht anders angegeben </p>
+               <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence>
+            </availability>
+            <availability status="free">
+               <p> Available at <ref target="workID">https://www.zfdg.de; (c) Forschungsverbund
+                     MWW</ref>
+               </p>
+            </availability>
+         </publicationStmt>
+         <sourceDesc>
+            <p>Einreichung als Fachartikel in der ZfdG durch die Autor*innen</p>
+         </sourceDesc>
+      </fileDesc>
+      <encodingDesc>
+         <editorialDecl><p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch TEI-Oxgarage und
+            XSLT-Skripten</p>
+            <p>Medienrechte liegen bei den Autor*innen</p>
+            <p xml:lang="de">Lektorat des Textes durch die Redaktion in Person von <persName>Caroline Jansky</persName>.</p>
+             <p>All links checked<date when="2022-09-22">06.09.2022</date>
+            </p>
+         </editorialDecl>
+      </encodingDesc>
+      <profileDesc>
+         <creation>Einreichung als Artikel der Zeitschrift fÃ¼r digitale
+            Geisteswissenschaften</creation>
+         <langUsage>
+            <language ident="de">Text in Deutsch</language>
+            <language ident="de">Abstract in Deutsch</language>
+            <language ident="en">Abstract in Englisch</language>
+         </langUsage>
+         <textClass>
+            <keywords scheme="gnd">
+               <term>Urheberrecht<ref target="4062127-3"/>
+               </term>
+
+               <term>Data Mining<ref target="4428654-5"/>
+               </term>
+
+               <term>Infrastruktur<ref target="4026944-9"/>
+               </term>
+               <term>Open Science<ref target="1197084231"/>
+               </term>
+               <term>Digital Humanities<ref target="1038714850"/>
+               </term>
+               <term>Forschungsdaten<ref target="1098579690"/>
+               </term>
+
+            </keywords>
+         </textClass>
+      </profileDesc>
+      <revisionDesc>
+         <change/>
+      </revisionDesc>
+   </teiHeader>
+   <text>
+      <body>
+         <div>
+            <div type="abstract">
+               <argument xml:lang="de">
+                  <p>Um urheberrechtlichen EinschrÃ¤nkungen beim Austausch zu Forschungsergebnissen
+                     von vornherein aus dem Weg zu gehen, konzentrieren sich viele digitale
+                     Geisteswissenschaftler*innen auf gemeinfreie Texte. Zur Ãœberwindung dieser
+                     problematischen Beschneidung des Gegenstandsbereichs schlagen SchÃ¶ch et al.
+                     2020 sogenannte abgeleitete Textformate vor, die digitale Analyseverfahren
+                     unterstÃ¼tzen, den Text jedoch aus urheberrechtlicher Perspektive hinreichend
+                     verfremden. Das Projekt XSample entwickelt eine komplementÃ¤re LÃ¶sung, die die
+                     Berechtigung zur Weitergabe von AuszÃ¼gen aus geschÃ¼tzten Texten (im Klartext)
+                     nutzt. Der forschungsgesteuerte Ansatz ermÃ¶glicht Gruppen, die an einer
+                     Nachnutzung interessiert sind, eine Optimierung des maximal erlaubten
+                     Auszugsvolumens entlang eigener Forschungsfragen. </p>
+               </argument>
+               <argument xml:lang="en">
+                  <p>In order to avoid copyright restrictions on the exchange of research results
+                     from the outset, many researchers in the digital humanities focus on texts in
+                     the public domain. To overcome this problematic limitation of the subject
+                     matter, SchÃ¶ch et al. 2020 propose so-called derived text formats that support
+                     digital analysis procedures but sufficiently alienate the text from a copyright
+                     perspective. The XSample project is developing a complementary solution that
+                     leverages permission to share excerpts from copyrighted text (in plain text).
+                     The research-driven approach allows groups interested in reuse to optimize the
+                     maximum allowed excerpt volume along their own research questions.</p>
+               </argument>
+            </div>
+            <div type="chapter">
+               <head>1. Einleitung</head>
+               <p>Die korpusorientierte Forschung an Texten und anderen Materialien in den digitalen
+                  Geisteswissenschaften ist durch das deutsche Urheberrecht eingeschrÃ¤nkt, das die
+                  Weitergabe von Forschungsdaten zu geschÃ¼tzten Werken und deren Archivierung nur in
+                  engen Grenzen erlaubt.<note type="footnote"> Die Namen der Autor*innen sind in den
+                     Verfasserangaben alphabetisch aufgelistet. Im Projekt befanden sich juristische
+                     Fragestellungen im Arbeitsschwerpunkt von Felicitas Kleinkopf; Markus GÃ¤rtner
+                     befasste sich mit der technischen Umsetzung der Infrastruktur; das erste
+                     Nutzungsszenario wurde von Melanie Andresen und Axel Pichler, das zweite von
+                     Janina Jacke und Nora Ketschik bearbeitet; Sibylle Hermann koordinierte die
+                     Projektarbeit und die Anbindung an die bibliothekarische Infrastruktur; Jonas
+                     Kuhn war fÃ¼r konzeptionelle Fragen verantwortlich. Die textuelle Darstellung in
+                     diesem Artikel wurde gemeinschaftlich von den Projektbeteiligten des <term
+                        type="figure">XSample</term>-Projekts, auch Ã¼ber die ZustÃ¤ndigkeitsgrenzen
+                     im Projekt hinweg, erstellt. </note> Die Restriktionen erschweren die
+                  Einhaltung der guten wissenschaftlichen Praxis sowie der <term type="dh"
+                     >FAIR-Prinzipien</term> fÃ¼r Forschungsdateninfrastrukturen.<note
+                     type="footnote"> Die FAIR-Prinzipien formulieren vier
+                     zentrale Anforderungen an Forschungsdaten: Sie sollten Findable, Accessible,
+                     Interoperable und Reusable sein, siehe <ref type="bibliography" target="#wilkinson_fair_2016">Wilkinson et al. 2016</ref>.</note> In
+                  vielen Projekten wird deshalb aus pragmatischen GrÃ¼nden gÃ¤nzlich darauf
+                  verzichtet, urheberrechtlich geschÃ¼tzte Texte einzubeziehen. Nicht selten bedeutet
+                  dies, dass zeitgenÃ¶ssische Texte â€“ und mit ihnen bestimmte Fragestellungen â€“
+                  nahezu vollstÃ¤ndig ausgeblendet werden (mÃ¼ssen).<note type="footnote"> Der Schutz
+                     von Texten durch das deutsche Urheberrecht endet siebzig Jahre nach Tod der
+                     Autor*innen, sodass kein direkter Zusammenhang zwischen Publikationsjahr und
+                     dem Ende des urheberrechtlichen Schutzes besteht. </note> Eine so weitreichende
+                  Beschneidung des Gegenstandsbereichs fÃ¼hrt jedoch nicht nur zu Verzerrungen der
+                  Forschungslandschaft, die aus geisteswissenschaftlich-fachlichen GrÃ¼nden
+                  problematisch sind, sie hat hÃ¤ufig auch zur Folge, dass sich die Entwicklung
+                  algorithmischer Verfahren mit sehr kleinen DatensÃ¤tzen und / oder einer heterogenen
+                  Kombination von Quellen behelfen muss. </p>
+               <p>SelbstverstÃ¤ndlich besteht fÃ¼r Forscher*innen die MÃ¶glichkeit, fÃ¼r die Forschung
+                  auf geschÃ¼tzten Texten in Verhandlungen mit den Rechteinhaber*innen zu treten.
+                  Optimal ist, wenn im Vorfeld eine Lizenzvereinbarung ausgehandelt werden kann, die
+                  eine unbegrenzte Weitergabe der geschÃ¼tzten Texte an Dritte zu Forschungszwecken
+                  einschlieÃŸt; dies gelingt jedoch nicht in allen FÃ¤llen und erfordert einen
+                  erheblichen Aufwand und zeitlichen Vorlauf in Bezug auf jede zu verwendende
+                  Datenquelle. Damit ist das Vorgehen mit der Praxis datenintensiver
+                  Computermodellierung nur bedingt vereinbar, bei der etwa explorative Experimente
+                  zu unterschiedlichen Erweiterungen der Datenbasis nur bei einem Bruchteil der
+                  Daten eine lÃ¤ngerfristige Weiterverfolgung bewirken.</p>
+               <p>Dieser Artikel sieht ein Desiderat fÃ¼r die digitalen Geisteswissenschaften â€“ sei
+                  es bei der ErschlieÃŸung eines Gegenstandsbereichs oder bei der Methodenentwicklung
+                  â€“ darin, eine Forschungsdateninfrastruktur einzurichten, die ein exploratives
+                  Vorgehen unterstÃ¼tzt, sodass die Urheberrechtsfrage nicht lÃ¤nger per se ein
+                  Ausschlusskriterium fÃ¼r die Verwendung eines Textes oder eines Textkorpus ist.
+                  Neben dem langfristigen (politischen) Ziel einer verbesserten urheberrechtlichen
+                  Ausgangslage fÃ¼r die Forschung sollte dafÃ¼r der bestehende rechtliche Korridor fÃ¼r
+                  eine Weitergabe von Forschungsergebnissen zu geschÃ¼tzten Texten ausgenutzt
+                  werden.</p>
+               <p>SchÃ¶ch et al. schlagen zum Umgang mit der bestehenden Rechtslage eine
+                  Konvertierung der Texte in sogenannte abgeleitete Formate vor, welche fÃ¼r eine
+                  Reihe von digitalen Analyseverfahren geeignet sind, die den Text jedoch aus
+                  urheberrechtlicher Perspektive hinreichend verfremden.<note type="footnote"> Vgl.
+                     <ref type="bibliography" target="#schoech_textformate_2020">SchÃ¶ch et al. 2020</ref>.</note> Diese abgeleiteten Textformate halten beispielsweise
+                  fÃ¼r Textsegmente wie Kapitel oder Abschnitte lediglich die HÃ¤ufigkeit der
+                  enthaltenen EinzelwÃ¶rter oder <term type="dh">n-Gramme</term> (also kurzen
+                  Wortsequenzen) fest. GÃ¤ngige Verfahren der Makroanalyse,<note type="footnote">
+                     Vgl. <ref type="bibliography" target="#jockers_methods_2012">Jockers 2013</ref>. </note> die etwa lexikalische Indikatoren fÃ¼r die Dynamik
+                  des Textverlaufs heranziehen, kÃ¶nnen auf dieser Basis zur Anwendung kommen. Der
+                  Urheberrechtsschutz wird dabei durch den Aufbruch der Textstruktur aufgehoben,
+                  sodass Restriktionen zur Archivierung, Weitergabe und VerÃ¶ffentlichung der
+                  DatensÃ¤tze nicht mehr zum Tragen kommen. Das Konzept der abgeleiteten Textformate
+                  leistet somit einen groÃŸen Beitrag zur Replizierbarkeit von Forschung und
+                  Nachnutzbarkeit von Forschungsdaten.</p>
+               <p>Allerdings stÃ¶ÃŸt das Konzept der abgeleiteten Formate dort an seine Grenzen, wo
+                  die eigentliche Textgestalt forschungsrelevant wird. Dies ist nicht nur bei einer
+                  Mikroanalyse, also etwa beim <term type="dh">Close Reading</term>, der Fall
+                  (welches ohne Frage einen urheberrechtlich geklÃ¤rten Gesamtzugriff auf den Text
+                  voraussetzt). Vor dem Hintergrund geisteswissenschaftlicher Fragestellungen macht
+                  hÃ¤ufig auch die Interpretation von Ergebnissen einer aggregierenden Makroanalyse
+                  den Zugriff auf einige relevante Textpassagen in ihrer Gesamtgestalt erforderlich. </p>
+               <p>Das <term type="figure">XSample</term>-Projekt hat daher einen Ansatz entwickelt,
+                  der komplementÃ¤r zum Konzept der abgeleiteten Textformate eingesetzt werden kann
+                  (vgl.<ref type="graphic" target="#nachnutzung_2021_001"> Abbildung 1</ref>). Dieser
+                  Ansatz nutzt das bestehende Recht zur Weitergabe von prozentual begrenzten
+                  AuszÃ¼gen geschÃ¼tzter Werke zu Zwecken der wissenschaftlichen Forschung (<ref target="https://www.gesetze-im-internet.de/urhg/__60c.html">Â§Â 60c
+                     UrhG</ref>) und Ã¼bertrÃ¤gt dies auf die Herausgabe von KorpusauszÃ¼gen. Der erlaubte
+                  Umfang dieser AuszÃ¼ge betrÃ¤gt zwar in der Regel nur 15 Prozent eines Werks, der
+                  XSample-Ansatz ermÃ¶glicht jedoch eine dynamische, auf das individuelle
+                  Forschungsanliegen zugeschnittene Auswahl der â€ºhilfreichsten 15 Prozentâ€¹. Hierzu
+                  kÃ¶nnen Nachnutzer*innen in Suchanfragen auf den Texten und gegebenenfalls
+                  vorhandenen Annotationen genau spezifizieren, welche Teile des Korpus fÃ¼r sie
+                  relevant sind. Auf diese Weise werden die rechtlichen MÃ¶glichkeiten in einer
+                  zielfÃ¼hrenden Art und Weise ausgeschÃ¶pft und nachhaltige Forschung mit
+                  urheberrechtlich geschÃ¼tzten Texten begÃ¼nstigt, ohne den Urheberrechtsschutz
+                  aufzuheben. Insbesondere kÃ¶nnen auch Forschungsfragen bearbeitet werden, die den
+                  RÃ¼ckgriff auf den exakten Wortlaut ausgewÃ¤hlter Textpassagen und umfangreichere
+                  Kontexte erfordern. Eine besondere Rolle nehmen dabei die
+                  Forschungsinfrastruktureinrichtungen ein, die Wissenschaftler*innen auf
+                  institutioneller Ebene unterstÃ¼tzen, indem sie ihnen digitale Werkzeuge, die z.Â B.
+                  der Verwaltung und VerÃ¶ffentlichung ihrer Forschungsdaten dienen, zur VerfÃ¼gung
+                  stellen. Zu diesen Forschungsinfrastruktureinrichtungen zÃ¤hlen heute vorwiegend
+                  die wissenschaftlichen Bibliotheken. Das im Projekt entwickelte Tool wird
+                  exemplarisch an die lokale Infrastruktur der UniversitÃ¤t Stuttgart und das dort
+                  vorhandene Forschungsdatenrepositorium angebunden. Die im Projekt entwickelte
+                  Software steht frei zur VerfÃ¼gung, sodass sie und die nÃ¶tige Infrastruktur anderen
+                  Forschungsinfrastruktureinrichtungen bereitgestellt werden kÃ¶nnen.</p>
+               <figure>
+                  <graphic xml:id="nachnutzung_2021_001" url=".../medien/nachnutzung_2021_001.png">
+                     <desc>
+                        <ref type="graphic" target="#abb1">Abb. 1</ref>: In XSample entwickeltes
+                        Auszugskonzept. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                           target="#nachnutzung_2021_001"/>
+                     </desc>
+                  </graphic>
+               </figure>
+               <p>Der vorliegende Beitrag geht in <ref type="intern" target="#hd2">Kapitel 2</ref>
+                  zunÃ¤chst auf die rechtlichen Grundlagen ein, die fÃ¼r Verfahren des <term type="dh"
+                     >Text- und Data-Mining</term> (TDM)<note type="footnote"> Unter TDM versteht
+                     das Urheberrecht <quote>die automatisierte Analyse von einzelnen oder mehreren
+                        digitalen oder digitalisierten Werken, um daraus Informationen insbesondere
+                        Ã¼ber Muster, Trends und Korrelationen zu gewinnen</quote> (<ref target="https://www.gesetze-im-internet.de/urhg/__44b.html">Â§Â§Â 44b Abs. 1</ref>,
+                        <ref target="https://www.gesetze-im-internet.de/urhg/__60d.html">60d Abs. 1 UrhG</ref>). Unterschieden wird rechtlich zwischen der eigentlichen
+                     automatisierten Analyse, die urheberrechtlich freigestellt ist, und den dafÃ¼r
+                     notwendigen Vorbereitungsschritten, die wiederum urheberrechtlich relevant
+                     sind. Unter das gesetzgeberische VerstÃ¤ndnis von TDM kann ein GroÃŸteil
+                     textbasierter Forschung gefasst werden, auch wenn die Forscher*innen ihre
+                     Analyse selbst mÃ¶glicherweise nicht als Text- und Data-Mining bezeichnen
+                     wÃ¼rden.</note> gelten und die Rahmenbedingungen fÃ¼r das hier prÃ¤sentierte
+                  Auszugskonzept schaffen. <ref type="intern" target="#hd6">Kapitel 3</ref> stellt
+                  dar, wie die VerfÃ¼gbarmachung von individuell zugeschnittenen TextauszÃ¼gen
+                  innerhalb des rechtlichen Rahmens technisch umgesetzt werden kann. Dabei werden
+                  insbesondere die unterschiedlichen Akteur*innen in den Blick genommen sowie Schritte
+                  der Datenvorbereitung und verschiedene MÃ¶glichkeiten der Auszugsgenerierung
+                  vorgestellt. AnschlieÃŸend werden in <ref type="intern" target="#hd12">Kapitel
+                     4</ref> zwei Nutzungsszenarien prÃ¤sentiert, die im Kontext konkreter
+                  Forschungsfragen ausfÃ¼hren, inwieweit abgeleitete Textformate und / oder das
+                  Auszugskonzeptkonzept fÃ¼r die Reproduktion ihrer Forschung und die Nachnutzung
+                  ihrer Daten praktikabel sind. Das erste Nutzungsszenario widmet sich der
+                  Wissenschaftssprache der geisteswissenschaftlichen FÃ¤cher Literaturwissenschaft,
+                  Linguistik und Philosophie und erstellt dazu ein Korpus aus insgesamt 135
+                  urheberrechtlich geschÃ¼tzten Zeitschriftenartikeln. Das zweite Nutzungsszenario
+                  beschÃ¤ftigt sich mit dem PhÃ¤nomen des unzuverlÃ¤ssigen ErzÃ¤hlens, das in einem
+                  ersten Zugang anhand eines Korpus aus acht deutschsprachigen fiktionalen
+                  ErzÃ¤hlungen aus dem 19. bis zum 21. Jahrhundert untersucht wird, die teilweise dem
+                  Urheberrecht unterliegen. Nach Abschluss der Forschung sollen die Daten fÃ¼r die
+                  ÃœberprÃ¼fung der Ergebnisse und zur Nachnutzung in weiteren Projekten zur VerfÃ¼gung
+                  gestellt werden. Das Fazit in <ref type="intern" target="#hd15">Kapitel 5</ref>
+                  fasst die Ergebnisse zusammen und leitet praktische Handlungsempfehlungen und
+                  Desiderate ab.</p>
+            </div>
+            <div type="chapter">
+               <head>2. Urheberrechtliche Rahmenbedingungen fÃ¼r das Text- und Data-Mining </head>
+
+               <p>Bei der Beforschung insbesondere neuerer Texte und Korpora mÃ¼ssen sich die
+                  digitalen Geisteswissenschaften mit Fragen des Urheberrechts auseinandersetzen.
+                  Der urheberrechtliche Rahmen fÃ¼r die Forschung mit TDM hat sich in den letzten
+                  Jahren mehrfach geÃ¤ndert, was es zusÃ¤tzlich erschwert, aus
+                  geisteswissenschaftlicher Perspektive zu Ã¼berblicken, wie bzw. in welchem Umfang
+                  mit geschÃ¼tzten Werken geforscht werden darf. Die letzten Ã„nderungen ergaben sich
+                  im Juni 2021, als die <term type="dh">Richtlinie zum Urheberrecht im digitalen
+                     Binnenmarkt</term> (Digital Single Market-, kurz DSM-Richtlinie) im <term type="dh"
+                     >Urheberrechtsgesetz</term> (UrhG) umgesetzt wurde. Um einen kurzen Ãœberblick
+                  Ã¼ber die Entwicklung der Gesetzeslage zu geben, wird nachfolgend (<ref
+                     type="intern" target="#hd3">Kapitel 2.1</ref>) skizziert, in welchem Umfang
+                  VervielfÃ¤ltigungen (<ref target="https://www.gesetze-im-internet.de/urhg/__16.html">Â§Â 16 UrhG</ref>) und Ã¶ffentliche ZugÃ¤nglichmachungen (<ref target="https://www.gesetze-im-internet.de/urhg/__19a.html">Â§Â 19a UrhG</ref>)
+                  fÃ¼r die Erstellung und (gemeinsame) Beforschung von Korpora im Kontext von TDM in
+                  den verschiedenen Gesetzesfassungen erlaubt waren bzw. sind.<note type="footnote">
+                     Einen umfassenderen Ãœberblick Ã¼ber die Detailfragen des Forschungsprozesses
+                     bieten zum alten Recht <ref type="bibliography" target="#dreier_urhg_2018">Dreier / Schulze 2018</ref>, Â§Â 60d; 
+                        <ref type="bibliography" target="#kleinkopf_text_2021">Kleinkopf et al. 2021</ref>;
+                           vorwiegend auch <ref type="bibliography" target="#schoech_textformate_2020">SchÃ¶ch et al. 2020</ref>, Randnummer 5â€“14; zu Â§Â 60d in seiner neuen Fassung,
+                              vgl. <ref type="bibliography" target="#dreier_urhg_2022">Dreier in Dreier / Schulze 2022</ref>, Â§Â 44b und Â§Â 60d; 
+                                 <ref type="bibliography" target="#raue_freistellung_2021">Raue 2021</ref>; 
+                                    <ref type="bibliography" target="#kleinkopf_bildung_2021">Kleinkopf / PflÃ¼ger 2021</ref>, S. 645â€“647; 
+                     eine Betrachtung auf EU-Ebene bieten 
+                                          <ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner et
+                     al. 2021</ref>, S. 11â€“13.</note> Daran anschlieÃŸend werden Fragen nach der
+                  ZugÃ¤nglichmachung und Nachnutzbarkeit von Korpora sowie mÃ¶gliche LÃ¶sungsansÃ¤tze
+                  diskutiert (<ref type="intern" target="#hd4">Kapitel 2.2.</ref>), darunter
+                  insbesondere die rechtliche Grundlage fÃ¼r das in diesem Artikel vorgestellte
+                  Auszugskonzept. AbschlieÃŸend werden die wesentlichen Anforderungen an
+                  Forschungsinfrastruktureinrichtungen zusammengefasst, die sich aus den
+                  juristischen Rahmenbedingungen ergeben (<ref type="intern" target="#hd5">Kapitel
+                     2.3</ref>).</p>
+               <div type="subchapter">
+                  <head>2.1. Die Gesetzesentwicklung</head>
+
+                  <p>Bis zum 1. MÃ¤rz 2018 enthielt das UrhG keine gesonderte Erlaubnis, Werke zu
+                     Zwecken des TDM zu nutzen. Deswegen waren TDM-Analysen an urheberrechtlich
+                     geschÃ¼tzten Werken nur insoweit mÃ¶glich, wie die Werke nicht kopiert oder
+                     weitergegeben wurden: Diese Handlungen sind nach den Regelungen in Â§Â§Â 16, 19a
+                     UrhG urheberrechtlich relevant, die das ausschlieÃŸliche Recht des Urhebers
+                     enthalten, sein Werk zu vervielfÃ¤ltigen und es Ã¶ffentlich zugÃ¤nglich zu machen.
+                     Eine ausdrÃ¼ckliche Erlaubnis<note type="footnote"> Erlaubnisnormen werden im
+                        deutschen Urheberrecht als <quote>Schranken</quote> bzw.
+                           <quote>Schrankenbestimmungen</quote> bezeichnet.</note> dieser Handlungen
+                     wurde im Jahr 2018 durch das Gesetz zur Angleichung des Urheberrechts an die
+                     aktuellen Erfordernisse der Wissensgesellschaft (UrhWissG) mit einem neuen
+                     Â§Â 60d UrhG geschaffen. Unter der Voraussetzung des rechtmÃ¤ÃŸigen Zugriffs
+                     erlaubt Â§Â 60d UrhG der nicht-kommerziellen wissenschaftlichen Forschung seither
+                     die VervielfÃ¤ltigung (Â§Â 16 Abs. 1 UrhG) und die Ã¶ffentliche ZugÃ¤nglichmachung
+                     (Â§Â 19a UrhG) geschÃ¼tzter Werke zu Zwecken des TDM. Seitdem existiert im
+                     deutschen Urheberrecht erstmalig eine explizite Erlaubnis, geschÃ¼tzte Werke fÃ¼r
+                     das TDM auch umfangreich zu verarbeiten. DefizitÃ¤r war bereits zu jenem
+                     Zeitpunkt, dass die Korpora zwar bei bestimmten Einrichtungen, darunter auch
+                     den in diesem Artikel adressierten Forschungsinfrastruktureinrichtungen,
+                     aufbewahrt werden durften, aber keine MÃ¶glichkeit bestand, die Korpora zu
+                     Zwecken von Anschlussforschungen nachzunutzen.</p>
+                  <p>Aufgrund des <term type="dh">Gesetzes zum Urheberrecht im digitalen
+                        Binnenmarkt</term> vom 7. Juni 2021<note type="footnote"> Bundesgesetzblatt Jahrgang
+                        2021 Teil I Nr. 27, ausgegeben zu Bonn am 4. Juni 2021.</note> hat sich der
+                     Rechtsrahmen ein weiteres Mal verÃ¤ndert. Seitdem darf Forschung mit TDM auch zu
+                     anderen Zwecken als zur nicht-kommerziellen wissenschaftlichen Forschung (diese
+                     ist weiterhin in Â§Â 60d UrhG geregelt), z.Â B. in Unternehmen oder in der Presse,
+                     praktiziert werden, wenn auch in eingeschrÃ¤nktem Umfang (Â§Â 44b UrhG). Die
+                     Erlaubnis ist dabei nach wie vor an den rechtmÃ¤ÃŸigen Zugang gebunden. Dieser
+                     rechtmÃ¤ÃŸige Zugang liegt dann vor, wenn die genutzten Texte in Buchform
+                     vorliegen, im Internet frei abrufbar sind oder als E-Books lizenziert
+                        wurden.<note type="footnote"> Vertraglich oder technisch darf das TDM im
+                        Rahmen wissenschaftlicher Zwecke (Â§Â 60d UrhG) auch im Grundsatz nicht
+                        ausgeschlossen werden (<ref target="https://www.gesetze-im-internet.de/urhg/__60g.html">Â§Â 60g Abs. 1</ref>, <ref target="https://www.gesetze-im-internet.de/urhg/__95b.html">95b Abs. 1, 3 UrhG</ref>). Etwas anderes gilt
+                        fÃ¼r kommerzielles TDM im Rahmen des Â§Â 44b UrhG oder fÃ¼r die Sicherung der
+                        FunktionsfÃ¤higkeit technischer Systeme (Â§Â 60d Abs. 6 UrhG).</note> Â§Â 60d
+                     UrhG wurde auÃŸerdem um Befugnisse zugunsten von sogenannten
+                     Kulturerbe-Einrichtungen erweitert. Neu ist auch, dass jedenfalls fÃ¼r
+                     VervielfÃ¤ltigungen im Rahmen von TDM nunmehr keine VergÃ¼tung mehr anfÃ¤llt
+                     (<ref target="https://www.gesetze-im-internet.de/urhg/__60h.html">Â§Â 60h Abs. 2 Nr. 3 UrhG</ref>). Diese war zuvor durch die jeweiligen Einrichtungen
+                     zu tragen.</p>
+               </div>
+               <div>
+                  <p></p>
+                  <p></p>
+               </div>
+               <div type="subchapter">
+                  <head>2.2. Die Erlaubnisse fÃ¼r Forschungsinfrastruktureinrichtungen</head>
+
+                  <p>Â§Â 60d UrhG in seiner aktuellen Fassung erlaubt es u.Â a. Forschungs- und
+                     sogenannten Kulturerbe-Einrichtungen, dazu zÃ¤hlen auch die in diesem Aufsatz
+                     adressierten Forschungsinfrastruktureinrichtungen, vollstÃ¤ndige Werke zu
+                     Zwecken des TDM zu vervielfÃ¤ltigen (Abs. 1 bis 3) und die VervielfÃ¤ltigungen
+                     (d.Â h. nicht die unverÃ¤nderten Ursprungsmaterialien) fÃ¼r die gemeinsame
+                     wissenschaftliche Forschung bestimmt abgegrenzten Personenkreisen sowie
+                     einzelnen Dritten zur ÃœberprÃ¼fung der wissenschaftlichen Forschung Ã¶ffentlich
+                     zugÃ¤nglich zu machen (Abs. 4 S. 1). Die ZugÃ¤nglichmachung ist jeweils zu
+                     beenden, wenn die gemeinsame Forschung oder die ÃœberprÃ¼fung abgeschlossen ist
+                     (Abs. 4 S. 2).</p>
+                  <p>Die Befugnis zur Weitergabe der Korpora wÃ¤hrend der Forschungsarbeiten ist also
+                     deutlich enger gefasst, als es ein allgemeiner Verweis auf die Ã¶ffentliche
+                     ZugÃ¤nglichmachung (Â§Â 19a UrhG) zur Folge hÃ¤tte: Sie erlaubt die Ã¶ffentliche
+                     ZugÃ¤nglichmachung eines Werks in einer Weise, dass es <quote>Mitgliedern der
+                        Ã–ffentlichkeit von Orten und zu Zeiten ihrer Wahl zugÃ¤nglich ist</quote>.
+                     Das bedeutet, dass das Werk Personen zugÃ¤nglich gemacht wird, die der
+                     Ã–ffentlichkeit angehÃ¶ren, d.Â h. zu denen keine persÃ¶nliche Beziehung existiert,
+                     vgl. <ref target="https://www.gesetze-im-internet.de/urhg/__15.html">Â§Â 15 Abs. 3 UrhG</ref>, und die einer <quote>unbestimmten Zahl potentieller
+                        Adressaten</quote> und einer <quote>ziemlich groÃŸen Zahl von
+                           Personen</quote> angehÃ¶ren.<note type="footnote"> Dreier in <ref type="bibliography" target="#dreier_urhg_2022">Dreier /
+                        Schulze 2022</ref>, Â§Â 15 Randnummer 38 mit Verweis auf den EuGH.</note> Die Erlaubnis,
+                     Korpora wÃ¤hrend der TDM-Forschungsarbeiten weiterzugeben (Â§Â 60d Abs. 4 S. 1
+                     UrhG), bezieht sich hingegen nur auf bestimmt abgegrenzte, d.Â h. weiter
+                     eingegrenzte Personenkreise, die der Ã–ffentlichkeit angehÃ¶ren. Bei
+                     Forschungsgruppen handelt es sich in der Regel nicht um eine
+                     Ã–ffentlichkeit,<note type="footnote"> Vgl. <ref type="bibliography" target="#raue_freistellung_2021">Raue 2021</ref>, S. 799.</note>
+                     weswegen es auf diese Erlaubnis in den meisten FÃ¤llen nicht ankommt.</p>
+                  <p>Die TDM-Korpora dÃ¼rfen gemÃ¤ÃŸ Â§Â 60d UrhG so lange aufbewahrt werden, wie es fÃ¼r
+                     die Forschung oder fÃ¼r ÃœberprÃ¼fungszwecke erforderlich ist. Die Dauer erfasst
+                     im Regelfall die von der guten wissenschaftlichen Praxis geforderten zehn
+                     Jahre,<note type="footnote"> Vgl. Leitlinien zur Sicherung der guten wissenschaftlichen Praxis, 
+                        <ref type="bibliography" target="#dfg_leitlinien_2019">Deutsche Forschungsgemeinschaft 2019</ref>,
+                         Leitlinie 17.</note> sie kann im Einzelfall aber auch kÃ¼rzer oder lÃ¤nger bemessen
+                     sein. Aufgrund der Wissenschaftsfreiheit unterliegt die EinschÃ¤tzung der
+                     Aufbewahrungsdauer den Forschenden und ist nur eingeschrÃ¤nkt Ã¼berprÃ¼fbar.<note
+                        type="footnote"> Vgl. <ref type="bibliography" target="#raue_freistellung_2021">Raue 2021</ref>, S. 799.</note>
+                  </p>
+                  <p>Eine Erlaubnis, die Korpora zur Aufbewahrung an
+                     Forschungsinfrastruktureinrichtungen weiterzugeben, ist nicht mehr ausdrÃ¼cklich
+                     enthalten. Die WeitergabemÃ¶glichkeit kann allenfalls mittels einer extensiven
+                     Auslegung aus der GesetzesbegrÃ¼ndung abgeleitet werden, denn diese scheint von
+                     einer Aufbewahrung durch Kulturerbe-Einrichtungen auszugehen:<note
+                        type="footnote"> Vgl. <ref type="bibliography" target="#kleinkopf_bildung_2021">Kleinkopf / PflÃ¼ger 2021</ref>, S. 647.</note>
+                     <quote>Hiernach kann auch eine dauerhafte Speicherung erforderlich und folglich
+                        zulÃ¤ssig sein, insbesondere, wenn sie durch Kulturerbe-Einrichtungen und
+                        nicht durch die Forschungseinrichtung selbst erfolgt</quote>.<note
+                           type="footnote"> <ref target="https://dserver.bundestag.de/btd/19/274/1927426.pdf">Bundestagsdrucksache 19/27426</ref>, S. 97.</note> MÃ¶glich ist aber in jedem
+                     Fall, die TDM-Projekte gleich von Beginn an auf zentralen Bibliotheksservern
+                     bzw. einrichtungsÃ¼bergreifenden Servern anzusiedeln, sodass dort die
+                     Archivierung ohne eine gesonderte Ãœbermittlung erfolgen kann. Dann bewegt man
+                     sich im Rahmen dessen, was die GesetzesbegrÃ¼ndung ausdrÃ¼cklich enthÃ¤lt, und
+                     vermeidet gleichzeitig, das Korpus erneut zu vervielfÃ¤ltigen (Â§Â 16 UrhG).</p>
+                  <p>Unklar ist aber weiterhin, ob zu Zwecken von Anschlussforschungen auf die
+                     Korpora zugegriffen werden kann. GemÃ¤ÃŸ Â§Â 60d Abs. 5 UrhG dÃ¼rfen die Korpora
+                     (nach dem Gesetz jedoch nicht die unverÃ¤nderten Ursprungsdaten)<note
+                        type="footnote"> Etwas anderes kann gelten, wenn die Ursprungsdaten
+                        entsprechend lizenziert sind, vgl. dazu auch <ref
+                           type="intern" target="#hd8">Kapitel 3.2</ref>.</note> so lange aufbewahrt
+                     werden, wie es fÃ¼r Zwecke der ÃœberprÃ¼fung der QualitÃ¤t der wissenschaftlichen
+                     Forschung oder fÃ¼r die Forschung selbst erforderlich ist. Das impliziert, dass
+                     es auch abseits der ÃœberprÃ¼fung wissenschaftliches Interesse an den Korpora
+                     geben kann. Auch die DSM-Richtlinie setzt voraus, dass nach Abschluss der
+                     Forschungsarbeiten bzw. wÃ¤hrend der Langzeitarchivierung noch Interesse an
+                     weiterer Beforschung der Korpora bestehen kann:<note type="footnote"> Vgl.
+                        <ref type="bibliography" target="#kleinkopf_bildung_2021">Kleinkopf / PflÃ¼ger 2021</ref>, S. 647.</note>
+                     <quote>Die Nutzung zum Zwecke der wissenschaftlichen
+                        Forschung auÃŸerhalb des Text und Data Mining, etwa die Begutachtung unter
+                        wissenschaftlichen Fachkollegen und gemeinsame Forschungsarbeiten, sollte
+                        nach wie vor unter die Ausnahme oder BeschrÃ¤nkung im Sinne von Artikel 5
+                        Absatz 3 Buchstabe a der Richtlinie 2001/29/EG fallen, sofern diese
+                        Bestimmung anwendbar ist.</quote>
+                     <note type="footnote"> ErwÃ¤gungsgrund 15 S. 5 <ref type="bibliography" target="#DSM-Richtlinie_2019">DSM-Richtlinie</ref>.</note> FÃ¼r eine
+                     Nachnutzung der Korpora kommen neben den von SchÃ¶ch et al. vorgestellten
+                     abgeleiteten Textformaten sogenannte <term type="dh">Closed-Room-ZugÃ¤nge</term>
+                     <note type="footnote"> Vgl. <ref type="bibliography" target="#schoech_textformate_2020">SchÃ¶ch et al. 2020</ref>, Randnummer 4 f.</note> (<ref target="https://www.gesetze-im-internet.de/urhg/__60e.html">Â§Â§Â 60e Abs. 4</ref>,
+                     <ref target="https://www.gesetze-im-internet.de/urhg/__60f.html">60f UrhG</ref>) und die Erlaubnis der auszugsweisen Nutzung zu Zwecken der
+                     wissenschaftlichen Forschung (Â§Â 60c UrhG) in Betracht. Nachfolgend werden diese
+                     beiden Optionen dargestellt und gegeneinander abgewogen.</p>
+                  <p>Â§Â§Â 60e Abs. 4, 60f UrhG erlauben es Bibliotheken und anderen
+                     Kulturerbe-Einrichtungen wie Ã¶ffentlich zugÃ¤nglichen Museen, ihren Nutzer*innen
+                     Werke aus ihrem Bestand an Terminals in ihren RÃ¤umen fÃ¼r deren Forschung oder
+                     private Studien zugÃ¤nglich zu machen (sogenannte <term type="dh"
+                        >Terminal-Schranke</term>). Die Nutzer*innen dÃ¼rfen sogenannte <term
+                        type="dh">Anschlusskopien</term>
+                     <note type="footnote"> Der Terminus â€ºAnschlusskopieâ€¹ meint, dass sich die
+                        Erlaubnis der Erstellung einer zehnprozentigen Kopie von Nutzer*innen an die
+                        Erlaubnis der Einrichtung, Werke an Terminals zugÃ¤nglich zu machen,
+                        anschlieÃŸt; vgl. dazu auch Dreier in <ref type="bibliography" target="#dreier_urhg_2022">Dreier / Schulze 2022</ref>, Â§Â 60e Randnummer
+                        21-24.</note> im Umfang von zehn Prozent erstellen. Einzelne Werke geringen
+                        Umfangs<note type="footnote"> Unter â€ºgeringem Umfangâ€¹ werden gemeinhin 25
+                           Seiten verstanden, vgl. Dreier in <ref type="bibliography" target="#dreier_urhg_2022">Dreier / Schulze 2022</ref>, Â§Â 60c Randnummer 15,
+                           Â§Â 60a Randnummer 22; <ref target="https://dserver.bundestag.de/btd/18/123/1812329.pdf">Bundestagsdrucksache 18/12329</ref>, S. 35.</note> wie BeitrÃ¤ge aus
+                     wissenschaftlichen Zeitschriften dÃ¼rfen hingegen vollstÃ¤ndig genutzt werden.
+                     Auf Grundlage des Â§Â 60e Abs. 4 UrhG kann also durch Kulturerbe-Einrichtungen
+                     Vollzugriff gewÃ¤hrt werden, auÃŸerdem kÃ¶nnen die Anschlusskopien
+                     interessengerecht erstellt werden. Ein entscheidender Nachteil an Â§Â 60e Abs. 4
+                     UrhG ist gleichwohl, dass jedenfalls der erste Zugriff auf die Werke nur an
+                     Terminals vor Ort erfolgen kann (sogenannte Closed-room-ZugÃ¤nge).<note
+                        type="footnote"> Vgl. <ref type="bibliography" target="#schoech_textformate_2020">SchÃ¶ch et al. 2020</ref>, Randnummer 5.</note>
+                  </p>
+                  <p>Anders verhÃ¤lt es sich mit Â§Â 60c UrhG, der Erlaubnisnorm fÃ¼r Zwecke der
+                     nicht-kommerziellen wissenschaftlichen Forschung, auf den sich das hier
+                     vorgestellte Konzept stÃ¼tzt. Â§Â 60c UrhG basiert auf Art. 5 Abs. 3 lit. a
+                     InfoSoc-Richtlinie, der den EU-Mitgliedsstaaten ermÃ¶glicht, in ihrem nationalen
+                     Urheberrecht Erlaubnisse von VervielfÃ¤ltigungen und Ã¶ffentlicher
+                     ZugÃ¤nglichmachung <quote>fÃ¼r Zwecke der wissenschaftlichen Forschung, sofern â€“
+                        auÃŸer in FÃ¤llen, in denen sich das als unmÃ¶glich erweist â€“ die Quelle,
+                        einschlieÃŸlich des Namens des Urhebers, wann immer das mÃ¶glich ist,
+                        angegeben wird und soweit das zur Verfolgung nicht kommerzieller Zwecke
+                        gerechtfertigt ist</quote> vorzusehen. </p>
+                  <p>Â§Â 60c Abs. 1 Nr. 1 UrhG erlaubt es, zu Zwecken der nicht-kommerziellen
+                     wissenschaftlichen Forschung bis zu 15 Prozent von Werken und auch vollstÃ¤ndige
+                     Werke geringen Umfangs zu vervielfÃ¤ltigen und an bestimmt abgegrenzte
+                     Personenkreise fÃ¼r deren eigene wissenschaftliche Forschung Ã¶ffentlich
+                     zugÃ¤nglich zu machen, d.Â h. weiterzugeben. Auf dieser Grundlage kÃ¶nnen
+                     geschÃ¼tzte Werke auf individuelle Anfrage teils vollstÃ¤ndig, teils
+                     auszugsweise, weitergegeben werden, auch digital und ohne Ortsbindung. Nicht
+                     erlaubt ist allerdings, Werke fÃ¼r eine gesamte Einrichtung frei abrufbar zu
+                        stellen.<note type="footnote"> Das entsprÃ¤che einer Einstellung in ein
+                        UniversitÃ¤ts-Intranet, diese ist jedoch gerade nicht erlaubt, vgl. Dreier in
+                           <ref type="bibliography" target="#dreier_urhg_2022">Dreier / Schulze 2022</ref>, Â§Â 60c Randnummer 9; <ref target="https://dserver.bundestag.de/btd/15/008/1500837.pdf">Bundestagsdrucksache 15 / 837</ref>, S. 34.</note>
+                  </p>
+                  <p>Wenn Forschende also nach Â§Â 60c UrhG Texte auszugsweise zur Nachnutzung
+                     erhalten und diese anschlieÃŸend fÃ¼r TDM im Sinne des Â§Â 60d UrhG nutzen, werden
+                     zwei Erlaubnisnormen, die auf unterschiedlichen Richtlinien beruhen (nÃ¤mlich
+                     einerseits der InfoSoc-Richtlinie und andererseits der DSM-Richtlinie),
+                     miteinander kombiniert. Das ist rechtlich mÃ¶glich.<note type="footnote"> Nach
+                        der <ref type="bibliography" target="#DSM-Richtlinie_2019">DSM-Richtlinie</ref> ist es zulÃ¤ssig, weitere Nutzungen der TDM-Korpora auf
+                        die Ã¤ltere InfoSoc-Richtlinie zu stÃ¼tzen, das besagt zum einen
+                        ErwÃ¤gungsgrund 15 S. 5 und zum anderen Art. 24 Abs. 2, 25 <ref type="bibliography" target="#DSM-Richtlinie_2019">DSM-Richtlinie</ref>. Auch die
+                        Rechtsprechung hat bereits in der Vergangenheit urheberrechtliche
+                        Erlaubnisnormen miteinander kombiniert, wenn ihre jeweiligen Voraussetzungen
+                        erfÃ¼llt sind, EuGH GRUR 2014, 1078 â€“ TU Darmstadt / Ulmer; BGH GRUR 2015,
+                        1101 â€“ Elektronische LeseplÃ¤tze II; so bereits <ref type="bibliography" target="#kleinkopf_text_2021">Kleinkopf et al. 2021</ref>, S.
+                        198f.</note>
+                  </p>
+                  <p>Daneben entspricht die Nachnutzbarkeit auf Grundlage des Â§Â 60c UrhG auch den
+                     Interessen der Urheber*innen, das gilt insbesondere deswegen, weil Â§Â 60c UrhG
+                     vergÃ¼tungspflichtig ist (Â§Â 60h UrhG) und dadurch ein finanzieller Ausgleich fÃ¼r
+                     die Rechteinhaber*innen hergestellt wird, schlieÃŸlich ist fÃ¼r eine Nutzung gemÃ¤ÃŸ
+                     Â§Â 60d UrhG ein rechtmÃ¤ÃŸiger Zugang erforderlich, der zumeist einen finanziellen
+                     Ausgleich fÃ¼r den*die Urheber*in enthÃ¤lt. Â§Â 60c UrhG setzt diesen rechtmÃ¤ÃŸigen Zugang
+                     allerdings nicht voraus. Die VergÃ¼tung stellt also einen Ausgleich der
+                     urheberrechtlichen Interessen her. Insgesamt ermÃ¶glicht Â§Â 60c UrhG insofern
+                     eine flexiblere Korpus-Nachnutzung als Â§Â§Â 60e Abs. 4, 60f UrhG, weswegen sich
+                     das in XSample entwickelte Konzept auf Â§Â 60c UrhG stÃ¼tzt.</p>
+               </div>
+               <div type="subchapter">
+                  <head>2.3. Rahmenbedingungen fÃ¼r das Auszugskonzept</head>
+
+                  <p>Zusammenfassend orientiert sich das hier vorgestellte Auszugskonzept an
+                     folgenden rechtlichen EinschrÃ¤nkungen, die von
+                     Forschungsinfrastruktureinrichtungen, die Korpora mit geschÃ¼tzten Texten bereitstellen mÃ¶chten, zu prÃ¼fen sind:</p>
+                  <p>
+                     <hi rend="italic">Einbeziehung der Forschungsinfrastruktureinrichtungen</hi>:
+                     Forschungsinfrastruktureinrichtungen, die die Korpora aufbewahren und
+                     gegebenenfallsbereitstellen, sollten von Beginn an in die Projektkonzeptionen
+                     integriert werden.</p>
+                  <p>
+                     <hi rend="italic">Aufbewahrungsdauer</hi>: Forscher*innen, die die Korpora
+                     bereitstellen mÃ¶chten, sollten eine der Forschung angemessenen
+                     Aufbewahrungsdauer fÃ¼r die Korpora vorschlagen. Wenn diese von den von der DFG
+                     vorgeschlagenen zehn Jahren<note type="footnote"> Leitlinien zur Sicherung
+                        der guten wissenschaftlichen Praxis, <ref type="bibliography" target="#dfg_leitlinien_2019">Deutsche Forschungsgemeinschaft 2019</ref>, Leitlinie 17.</note> abweicht,
+                     sollte eine explizite BegrÃ¼ndung erfolgen.</p>
+                  <p>
+                     <hi rend="italic">Inhalt der Korpora</hi>: Die gespeicherten und gegebenenfalls
+                     bereitgestellten Korpora dÃ¼rfen nicht die unverÃ¤nderten Ursprungsdaten
+                     enthalten, es sei denn, die betreffende Einrichtung hat hierzu entsprechende
+                     Lizenzen erworben.</p>
+                  <p>
+                     <hi rend="italic">Nachnutzung</hi>: Nachnutzer*innen mÃ¼ssen nicht-kommerzielle,
+                     wissenschaftliche Zwecke verfolgen. Die KorpusauszÃ¼ge dÃ¼rfen nur bestimmt
+                     abgegrenzten Personenkreisen zugÃ¤nglich gemacht werden, d.Â h. auf individuelle
+                     Anfrage. </p>
+                  <p>
+                     <hi rend="italic">Umfang der KorpusauszÃ¼ge</hi>: KorpusauszÃ¼ge dÃ¼rfen maximal
+                     15 Prozent ganzer Werke betragen, kurze Werke wie z.Â B. AufsÃ¤tze aus
+                     Zeitschriften (maximal 25 Seiten) kÃ¶nnen dagegen vollstÃ¤ndig herausgegeben
+                     werden.</p>
+               </div>
+            </div>
+            <div type="chapter">
+               <head>3. Technische Umsetzung</head>
+
+               <p>Wie im <ref type="intern" target="#hd2">vorigen Kapitel</ref> beschrieben, bedient
+                  sich der in XSample verfolgte Ansatz der rechtlichen Erlaubnis, AuszÃ¼ge bis zu
+                  einem Umfang von 15 Prozent eines Werks fÃ¼r Forschungszwecke weiterzugeben. Dieses
+                  Auszugskonzept wurde im Rahmen des Projekts prototypisch implementiert und zielt
+                  insbesondere darauf ab, den Nutzer*innen die fÃ¼r ihre Forschungsfrage
+                  â€ºhilfreichstenâ€¹ AuszÃ¼ge zu liefern. Die technische Umsetzung wird im Folgenden
+                  umrissen. HierfÃ¼r werden zunÃ¤chst die Workflow-Akteur*innen (<ref type="intern"
+                     target="#hd7">Kapitel 3.1</ref>) und die im Workflow eingesetzten
+                  Serverkomponenten (<ref type="intern" target="#hd8">Kapitel 3.2</ref>) vorgestellt.
+                  Im Anschluss werden die Vorbereitungsschritte fÃ¼r die Erstellung eines Auszugs
+                     (<ref type="intern" target="#hd9">Kapitel 3.3</ref>) sowie verschiedene
+                  MÃ¶glichkeiten der Auszugsgenerierung (<ref type="intern" target="#hd10">Kapitel
+                     3.4</ref>) erlÃ¤utert. FÃ¼r letztere liegt der Fokus auf der Verwendung im Korpus
+                  enthaltener Annotationen, um mittels Suchanfragen AuszÃ¼ge zu erhalten, die optimal
+                  auf die BedÃ¼rfnisse der Nachnutzer*innen zugeschnitten sind. AbschlieÃŸend wird die
+                  Nachhaltigkeit und Nachnutzbarkeit der hier vorgestellten Infrastruktur
+                  thematisiert (<ref type="intern" target="#hd11">Kapitel 3.5</ref>).</p>
+               <div type="subchapter">
+                  <head>3.1 Workflow-Akteur*innen</head>
+
+                  <p>XSample unterscheidet zwischen drei Akteur*nnen im Workflow: Erstens den
+                     Infrastrukturbetreiber*innen, zweitens den Datenanbieter*innen / -lieferant*innen und
+                     drittens den Nachnutzer*innen. Infrastrukturbetreiber*innen gehÃ¶ren zu den oben
+                     adressierten Forschungsinfrastruktureinrichtungen und bieten die
+                     infrastrukturelle Komponente zur Ablage und Verwaltung der verschiedenen im
+                     Workflow anfallenden Daten. Eine zentrale Bedeutung kommt hierbei der
+                     Authentifizierung von Nutzer*innen und einem feingranularen Rechtemanagement
+                     zu, um die beschriebenen rechtlichen Bedingungen (z.Â B. ZugriffsbeschrÃ¤nkung
+                     fÃ¼r bestimmt abgegrenzte Personenkreise) erfÃ¼llen zu kÃ¶nnen. Neben der reinen
+                     Datenablage dient das zugrundeliegende Repositorium mit seiner WeboberflÃ¤che
+                     gleichzeitig als zentraler Einstiegspunkt fÃ¼r die weiteren beteiligten
+                     Akteur*innen. Als Datenlieferant*innen werden im XSample-Kontext sÃ¤mtliche
+                     Personen oder Personenkreise bezeichnet, welche (gemÃ¤ÃŸ Â§Â 60d UrhG) TDM auf
+                     geschÃ¼tzten Werken zum Zwecke nicht-kommerzieller Forschung durchfÃ¼hren und die
+                     dabei erzeugten Korpora zur Nachnutzung durch XSample verfÃ¼gbar machen mÃ¶chten.
+                     Die Gruppe der Nachnutzer*innen schlieÃŸlich beinhaltet die nach Â§Â 60c UrhG
+                     bestimmt abgegrenzten Personenkreise, denen auszugsweise Zugang zu geschÃ¼tzten
+                     Werken zum Zwecke nicht-kommerzieller Forschung gewÃ¤hrt werden darf.</p>
+               </div>
+               <div type="subchapter">
+                  <head>3.2 Infrastruktur: Repositorium und Auszugsgenerierung</head>
+
+                  <p>Innerhalb des XSample-Workflows kommen zwei getrennte Serverkomponenten zum
+                     Einsatz: das Repositorium und die Auszugsgenerierung. Beide stehen unter der
+                     Verwaltung der Infrastrukturbetreiber*innen und verfÃ¼gen Ã¼ber jeweils eigene
+                     WeboberflÃ¤chen.</p>
+                  <p>Das Repositorium dient vorwiegend der Ablage und Verwaltung der Korpus- und
+                     eventuell Ursprungsdaten und wird innerhalb des Prototyps durch eine
+                     Dataverse-Instanz realisiert. Die <ref target="https://dataverse.org/"
+                        >Dataverse</ref> Software ist ein Open-Source-Projekt auf Basis des <ref
+                        target="https://github.com/jakartaee/faces">JSF-Frameworks</ref> mit einer
+                     aktiven Community aus Entwickler*innen und regelmÃ¤ÃŸigen Nutzer*innen. Dataverse
+                     bietet die MÃ¶glichkeit, abgelegte Daten auf verschiedene Weise zu organisieren
+                     oder zu gruppieren, und verfÃ¼gt Ã¼berdies Ã¼ber eine Rechteverwaltung, die es
+                     erlaubt, bis auf die Ebene einzelner DatensÃ¤tze zu entscheiden, ob ein komplett
+                     Ã¶ffentlicher Zugang (<term type="dh">Public Domain</term>), das Teilen mit
+                     einzelnen Individuen oder Gruppen (<term type="dh">Shared Domain</term>), oder
+                     eine fÃ¼r andere uneinsehbare Ablage (<term type="dh">Private Domain</term>)
+                     gewÃ¼nscht ist. Dies ist im Kontext von XSample besonders relevant, da zwar
+                     wÃ¤hrend eines laufenden Forschungsprojekts Â§Â 60d UrhG das Teilen der Daten
+                     innerhalb von Forschungsgruppen und zu ÃœberprÃ¼fungszwecken erlaubt (Shared
+                     Domain), allerdings nach Projektende diese in ihrer Gesamtheit nicht mehr
+                     (ausdrÃ¼cklich) Ã¶ffentlich zugÃ¤nglich gemacht oder geteilt werden dÃ¼rfen
+                     (Private Domain). ZusÃ¤tzlich unterscheidet Dataverse zwischen der
+                     Auffindbarkeit von Ressourcen und dem direkten Zugriff auf dieselben. Somit
+                     lassen sich die Metadaten als eigenstÃ¤ndiger Datensatz verÃ¶ffentlichen, wÃ¤hrend
+                     die eigentlichen Dateien innerhalb des Datensatzes aber vor jeglichem direkten
+                     Zugriff abgeschirmt sind.</p>
+                  <p>Neben dem Repositorium stellt die Auszugsgenerierung als eigener Server die
+                     zweite Komponente im XSample-Workflow dar. Sie leitet Nutzer*innen auf einer
+                     WeboberflÃ¤che durch die individuelle Auszugskonfiguration und stellt am Ende
+                     des XSample-Workflows die im Auszug enthaltenen Daten als Download zur
+                     VerfÃ¼gung. Dieser Server basiert ebenfalls auf JSF und kommuniziert mit der
+                     Dataverse-Instanz Ã¼ber eine Webschnittstelle, um auf dort abgelegte Ressourcen
+                     und Metadaten zuzugreifen. Um auf nicht-Ã¶ffentliche DatensÃ¤tze zugreifen zu
+                     kÃ¶nnen, benÃ¶tigt der XSample-Server einen eigenen Account fÃ¼r das entsprechende
+                     Dataverse, der allerdings nur Leserechte beinhalten muss, denn der
+                     XSample-Server selbst schreibt oder modifiziert keine Daten im Repositorium.
+                     Zur Integration des Servers in die bestehende Dataverse-Infrastruktur wird
+                     dieser in der Dataverse-Instanz als sogenanntes <ref
+                        target="https://guides.dataverse.org/en/latest/api/external-tools.html"
+                        >external tool</ref> registriert. Diese Schnittstelle in Dataverse
+                     ermÃ¶glicht es, fÃ¼r bestimmte Dateitypen oder DatensÃ¤tze externe Server zu
+                     registrieren, die den Nutzer*innen dann als zusÃ¤tzliche Optionen neben Download
+                     oder Betrachtung angezeigt werden (vgl.<ref type="graphic"
+                        target="#nachnutzung_2021_002"> Abbildung 2</ref>). Dies ermÃ¶glicht eine
+                     Integration der XSample-Komponenten, ohne Code-Modifikationen an Dataverse
+                     vornehmen zu mÃ¼ssen, und erlaubt Ã¼berdies, komplett auf eine eigene
+                     Authentifizierung von Nutzer*innen von Seiten des XSample-Servers zu
+                     verzichten, da diese bereits bei Dataverse vorgeschaltet ist. Auf diese Weise
+                     werden die zur Nachverfolgung der Nutzer*innen nÃ¶tigen Daten bei der
+                     Weiterleitung zum XSample-Server sogleich mit Ã¼bermittelt.</p>
+               </div>
+               <div type="subchapter">
+                  <head>3.3 Datenaufbereitung fÃ¼r die Auszugsgenerierung</head>
+
+                  <p>Bevor AuszÃ¼ge aus einem Korpus generiert werden kÃ¶nnen, sind mehrere
+                     Vorbereitungsschritte notwendig:</p>
+                  <p>
+                     <hi rend="italic">ZulÃ¤ssige Formate</hi>: Alle fÃ¼r die AuszÃ¼ge zu verwendenden
+                     Dateien des Korpus mÃ¼ssen in einem nicht Ã¶ffentlich zugreifbaren Bereich
+                     (Private Domain) des Repositoriums abgelegt werden. Im Kontext der
+                     Prototypenimplementierung ist bisher nur eine begrenzte Anzahl von Formaten fÃ¼r
+                     Ursprungsdaten (PDF, EPUB oder TXT) und Annotationen (TEI-Subset und
+                     <term type="dh">CoNLL</term>-Ã¤hnliche tabellarische Formate) vorgesehen. Werden unverÃ¤nderte
+                     Ursprungsdaten eingegliedert, ist von Seiten der Infrastrukturbetreiber*innen
+                     und Datenanbieter*innen auch zu prÃ¼fen, ob fÃ¼r die verwendeten Werke
+                     Archivierungsrechte oder Lizenzen mit Ã¤quivalenten Berechtigungen vorliegen,
+                     wie in <ref type="intern" target="#hd5">Kapitel 2.3</ref> beschrieben.</p>
+                  <p>
+                     <hi rend="italic">Alignierung</hi>: Neben den reinen Annotationen im Korpus
+                     muss auch eine Abbildung einzelner Annotationen auf die zugrunde liegenden
+                     Segmente der Ursprungsdaten geliefert werden, um beide innerhalb von XSample
+                     alignieren zu kÃ¶nnen. Da beispielsweise im Fall von Dateien im PDF-Format
+                     AuszÃ¼ge zwangslÃ¤ufig als Sammlung vollstÃ¤ndiger Seiten erzeugt werden und die
+                     Zusammensetzung der AuszÃ¼ge mittels Suchanfragen auf Basis der Annotationen
+                     gesteuert werden kann, mÃ¼ssen diese Annotationen (bzw. die dazugehÃ¶rigen
+                     Suchergebnisse) auf die ursprÃ¼nglichen Seiten abbildbar sein. Aktuell sieht der
+                     XSample-Prototyp fÃ¼r diese Alignierung entweder die Verwendung zusÃ¤tzlicher
+                     Annotationsebenen direkt im Korpus vor, oder aber das Erstellen und Mitliefern
+                     zusÃ¤tzlicher tabellarischer Dateien, welche eine simple Abbildung relevanter
+                     Segmentierungseinheiten seitens der Annotationen (z.Â B. SÃ¤tze) auf die primÃ¤ren
+                     Segmente der Ursprungsdaten enthÃ¤lt. AbhÃ¤ngig vom jeweiligen Projektinhalt und
+                     dem Anteil manueller Vorverarbeitung kann dieser Vorbereitungsschritt eine
+                     groÃŸe HÃ¼rde darstellen. Dies sollte schon frÃ¼hzeitig im Projekt eingeplant
+                     werden, damit die notwendigen und nicht selten â€ºformat-fremdenâ€¹<note
+                        type="footnote"> Metainformationen wie Seitenzahlen auf der Ebene von SÃ¤tzen
+                        oder einzelnen Worten im Text sind in etablierten Annotationsschemata oder
+                        Formaten in der Regel nicht vorgesehen und erfordern somit zusÃ¤tzlichen Aufwand, bzw.
+                        spezielle Anpassungen.</note> Informationen nicht im Forschungsprozess
+                     verloren gehen und entweder durch manuellen Zusatzaufwand oder Anpassung
+                     automatischer Verarbeitungsschritte wiederhergestellt werden mÃ¼ssen. Die Ablage
+                     der Alignierungsinformationen erfolgt analog zu obigen Ursprungs- und
+                     Annotationsdateien in einem nicht-Ã¶ffentlichen Bereich.</p>
+                  <p>
+                     <hi rend="italic">Erzeugung eines Manifests</hi>: Als letztes muss ein
+                     sogenanntes XSample-Manifest (siehe Beispielcode unten) erzeugt und im
+                     Repositorium abgelegt werden. Dieses Manifest ist eine Datei im <ref
+                        target="https://json-ld.org/">JSON-LD</ref> Format, die Metadaten zu den
+                     einzelnen fÃ¼r die weitere Verarbeitung relevanten Ressourcen im Korpus enthÃ¤lt.
+                     PrimÃ¤r bestehen diese Informationen aus Angaben zum Ablageort, Format und
+                     Umfang einzelner Dateien. Daneben sind aber auch Informationen zu
+                     Rechteinhaber*innen der einzelnen Werke im Korpus enthalten, damit der
+                     XSample-Server bei der Auszugsgenerierung der Namensnennungspflicht nachkommen
+                     kann. Im Manifest kann zusÃ¤tzlich ein fixer Bereich fÃ¼r die statische
+                     Auszugsgenerierung festgelegt werden. Dies erlaubt es Datenlieferant*innen
+                     beispielsweise, besonders interessante Passagen als Teil des Standard-Auszugs
+                     zu definieren. Der Umfang des statisch definierten Auszugs muss nicht
+                     zwangslÃ¤ufig die vollen 15 Prozent ausschÃ¶pfen, wenn interessante Inhalte auch
+                     in AuszÃ¼gen geringeren Umfangs prÃ¤sentiert werden kÃ¶nnen. Somit kÃ¶nnen
+                     Nachnutzer*innen den Rest ihrer Quote beispielsweise fÃ¼r zielgerichtete
+                     Varianten der Auszugserstellung nutzen. Derzeit erfolgt die Erstellung eines
+                     XSample-Manifests komplett hÃ¤ndisch. Als zukÃ¼nftige Erweiterung ist ein
+                     Assistent geplant, der Datenlieferant*innen auf der XSample-Webseite dabei
+                     helfen soll, Inhalte fÃ¼r Manifeste zu definieren, ohne direkt im JSON-LD-Format
+                     schreiben zu mÃ¼ssen. Im Gegensatz zu den restlichen Dateien muss das Manifest
+                     Ã¶ffentlich auffindbar sein (Shared oder Public Domain), um den Nachnutzer*innen
+                     als Einstiegspunkt fÃ¼r die Auszugsgenerierung zu dienen. Da Dataverse fÃ¼r
+                     verÃ¶ffentlichte Ressourcen DOIs (<term type="dh">Digital Object
+                        Identifier</term>) vergibt und ein breites Spektrum an deskriptiven
+                     Metadaten unterstÃ¼tzt, kann ein Manifest auch zu Zitationszwecken oder
+                     allgemein zur Verlinkung des damit verbundenen Korpus genutzt werden. Es
+                     fungiert somit als Ã¶ffentlicher Platzhalter fÃ¼r die nicht direkt einsehbaren
+                     geschÃ¼tzten Korpusinhalte.</p>
+                  <p>Beim folgenden Beispiel handelt es sich um ein Manifest mit Informationen zu
+                     PrimÃ¤rdaten im Repositorium, Rechteinhaber*innen und voreingestellten Werten fÃ¼r die
+                     statische Auszugsgenerierung. Das beschriebene Beispielkorpus ist eine
+                     100-seitige PDF-Datei (verlinkt im <code>"xmp:primaryData"</code>-Block), bei
+                     der die ersten 10 Prozent im Falle von statischer Auszugsgenerierung geliefert
+                     werden sollen (spezifiziert im <code>"xmp:staticExcerpt"</code>-Block). Aus
+                     PlatzgrÃ¼nden ist der <code>"xmp:manifests"</code>-Block fÃ¼r zusÃ¤tzliche
+                     Korpus-Metadaten ohne Inhalt dargestellt: </p>
+                  <p>
+                     <code>{ "@type": "xmp:manifest", "@context":
+                        "http://www.uni-stuttgart.de/xsample/json-ld/manifest", "xmp:description":
+                        "Plain manifest with no customization (first 10%)", "xmp:corpora": [ {
+                        "@type": "xmp:corpus", "xmp:primaryData": { "@type": "xmp:dataverseFile",
+                        "xmp:segments": 100, "xmp:sourceType": "xmp:pdf", "xmp:id": 26 },
+                        "xmp:legalNote": { "@type": "xmp:legalNote", "xmp:author": "The XSample
+                        Team", "xmp:title": "XSample Test Corpus", "xmp:publisher": "The XSample
+                        Project", "xmp:year": 2021 }, "xmp:description": "100 page test corpus",
+                        "xmp:id": "root" } ], "xmp:staticExcerpt": { "@type": "xmp:span",
+                        "xmp:begin": 0, "xmp:end": 10, "xmp:spanType": "xmp:relative" },
+                        "xmp:manifests": []}</code>
+                  </p>
+                  <p>Sind alle Vorbereitungsschritte abgeschlossen, kÃ¶nnen Nachnutzer*innen Ã¼ber die
+                     Dataverse-OberflÃ¤che (<ref type="graphic" target="#nachnutzung_2021_002">Abbildung
+                        2</ref>) eine Zugriffsanfrage auf die XSample-Manifeste stellen. Wenn diese
+                     durch die Infrastrukturbetreiber*innen akzeptiert wird, dÃ¼rfen die
+                     Nachnutzer*innen auf den XSample-Server (<ref type="graphic"
+                        target="#nachnutzung_2021_003">Abbildung 3</ref>) weitergeleitet werden, wo die
+                     eigentliche Konfiguration und Erstellung der AuszÃ¼ge erfolgt. Da einzelnen
+                     Nutzer*innen nach Â§Â 60c UrhG jeweils nur maximal 15 Prozent eines geschÃ¼tzten
+                     Werkes ausgegeben werden dÃ¼rfen und diese Obergrenze auch Ã¼ber wiederholte
+                     Anfragen hinweg eingehalten werden muss, bedarf es einer sehr genauen
+                     Protokollierung bereits ausgegebener AuszÃ¼ge. Zu diesem Zweck werden die
+                     eindeutig identifizierbaren Dataverse-Accounts verwendet, was wiederum zur
+                     Folge hat, dass zur Nutzung des XSample-Services zwingend ein Account im
+                     jeweils verknÃ¼pften Dataverse-Repositorium notwendig ist und unregistrierte
+                     Dritte keinen Zugriff erhalten kÃ¶nnen.</p>
+                  <figure>
+                     <graphic xml:id="nachnutzung_2021_002"
+                        url=".../medien/nachnutzung_2021_002.png">
+                        <desc>
+                           <ref type="graphic" target="#abb2">Abb. 2</ref>: Dataverse-OberflÃ¤che fÃ¼r
+                           ein XSample-Manifest. Rechts unten kann die Weiterleitung auf den
+                           XSample-Server angestoÃŸen werden. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref
+                              type="graphic" target="#nachnutzung_2021_002"/>
+                        </desc>
+                     </graphic>
+                  </figure>
+               </div>
+
+               <div type="subchapter">
+                  <head>3.4 Auswahl der AuszÃ¼ge</head>
+                  <figure>
+                     <graphic xml:id="nachnutzung_2021_003"
+                        url=".../medien/nachnutzung_2021_003.png">
+                        <desc>
+                           <ref type="graphic" target="#abb3">Abb. 3</ref>: Startseite des
+                           XSample-Servers nach Weiterleitung aus dem zugehÃ¶rigen Dataverse und
+                           Validierung der Manifest-Datei. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                              target="#nachnutzung_2021_003"/>
+                        </desc>
+                     </graphic>
+                  </figure>
+                  <p>Nach der Weiterleitung auf den XSample-Server erfolgt zunÃ¤chst eine Validierung
+                     des Manifests auf formale Korrektheit und VerfÃ¼gbarkeit der verlinkten
+                     (Korpus-)Ressourcen. AnschlieÃŸend haben Nutzer*innen die MÃ¶glichkeit, zwischen
+                     drei Arten der Auszugsgenerierung (vgl. <ref type="graphic"
+                        target="#nachnutzung_2021_003">Abbildung 3</ref>, unten links) auszuwÃ¤hlen: Als
+                     simpelste LÃ¶sung kann ein statisch definierter Auszug (beispielsweise die
+                     ersten 10 Prozent oder ein anderer im Manifest definierter Abschnitt) gewÃ¤hlt
+                     werden. Wird mehr Kontrolle Ã¼ber die Zusammensetzung des Auszugs gewÃ¼nscht,
+                     bietet die zweite Alternative (vgl.<ref type="graphic" target="#nachnutzung_2021_004"
+                        > Abbildung 4</ref>) die MÃ¶glichkeit, die Auszugsgrenzen innerhalb der
+                     Ursprungsdaten frei zu definieren (z.Â B. die Seiten 20 bis 33). Auch hier wird
+                     eine zusammenhÃ¤ngende Sequenz an Seiten / Segmenten geliefert.</p>
+                  <figure>
+                     <graphic xml:id="nachnutzung_2021_004"
+                        url=".../medien/nachnutzung_2021_004.png">
+                        <desc>
+                           <ref type="graphic" target="#abb4">Abb. 4</ref>: Grafische OberflÃ¤che zur
+                           flexiblen Auswahl der Auszugsgrenzen. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref
+                              type="graphic" target="#nachnutzung_2021_004"/>
+                        </desc>
+                     </graphic>
+                  </figure>
+
+                  <p>Die ersten beiden Verfahren der Auszugsgenerierung bieten den Nachnutzer*innen
+                     verhÃ¤ltnismÃ¤ÃŸig wenig FlexibilitÃ¤t bei der Auswahl der Textausschnitte, sodass
+                     sie fÃ¼r bestimmte Forschungsanliegen ungeeignet sind. Dies ist insbesondere
+                     dann der Fall, wenn sich die Nutzer*innen nur fÃ¼r sehr spezifische PhÃ¤nomene
+                     oder Passagen interessieren. Um dem gerecht zu werden, wird als dritte
+                     Alternative eine Korpusanfrageschnittstelle<note type="footnote"> Vgl. <ref type="bibliography" target="#gaertner_corpus_2020">GÃ¤rtner
+                        2020</ref>.</note> integriert, die Suchanfragen auf Basis der im Korpus
+                     enthaltenen Annotationen ermÃ¶glicht. Dadurch lassen sich beispielsweise gezielt
+                     bestimmte syntaktische Konstruktionen finden<note type="footnote"> Sofern
+                        entsprechende Annotationen vorliegen.</note>, die dann als Kandidaten fÃ¼r
+                     die Auszugserstellung genutzt werden (vgl. <ref type="graphic"
+                        target="#nachnutzung_2021_005">Abbildung 5</ref>). Basierend auf diesen
+                     Suchergebnissen und den Alignierungsinformationen werden die auszugebenden
+                     Segmente der PrimÃ¤rdaten (zumeist Seiten) bestimmt. Somit lÃ¤sst sich
+                     sicherstellen, dass die AuszÃ¼ge optimal auf die individuellen BedÃ¼rfnisse der
+                     Nutzer*innen zugeschnitten sind.</p>
+                  <figure>
+                     <graphic xml:id="nachnutzung_2021_005"
+                        url=".../medien/nachnutzung_2021_005.png">
+                        <desc>
+                           <ref type="graphic" target="#abb5">Abb. 5</ref>: Exemplarische OberflÃ¤che
+                           zur Auszugsgenerierung mittels Suchanfrage basierend auf enthaltenen
+                           Annotationen. Die Verteilung der Suchergebnisse Ã¼ber das Korpus wird
+                           direkt visualisiert und Nutzer*innen anschlieÃŸend die MÃ¶glichkeit
+                           gegeben, die fÃ¼r sie relevanten Segmente exakt auszuwÃ¤hlen. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic" target="#nachnutzung_2021_005"/>
+                        </desc>
+                     </graphic>
+                  </figure>
+               </div>
+               <div type="subchapter">
+                  <head>3.5 Nachhaltigkeit</head>
+
+                  <p>Um eine langfristige Nachnutzung des XSample-Servers zu gewÃ¤hrleisten, muss
+                     dieser dauerhaft an der UniversitÃ¤tsbibliothek Stuttgart (in ihrer Rolle als
+                     Forschungsinfrastruktureinrichtung) als Dienst zur VerfÃ¼gung stehen. Wie in
+                        <ref type="intern" target="#hd8">Kapitel 3.2</ref> beschrieben, wird an der
+                     UniversitÃ¤t Stuttgart ein Datenrepositorium auf Basis von Dataverse eingesetzt.
+                     Das Datenrepositorium der UniversitÃ¤t Stuttgart (<ref target="https://darus.uni-stuttgart.de/">DaRUS</ref>) steht bereits als
+                     etablierter Dienst zur VerfÃ¼gung. Mit dem XSample-Server zur Auszugsgenerierung
+                     kommt ein weiterer Dienst hinzu, der ebenfalls gewartet und weiterentwickelt
+                     werden muss. Bisher lÃ¤uft dieser Dienst nicht im Produktivbetrieb, eine
+                     Verstetigung wird angestrebt. Dazu wird gerade im
+                     Forschungsdatenmanagement-Team ein Betriebskonzept fÃ¼r Code-Output von
+                     Forschungsprojekten erarbeitet. WÃ¤hrend der Projektphase sollen die technischen
+                     AbhÃ¤ngigkeiten und notwendigen Informationen Ã¼ber den Code dokumentiert werden,
+                     darÃ¼ber hinaus muss eine fachliche Ansprechperson benannt werden, die auch noch
+                     nach Projektende inhaltlich Auskunft geben kann. In einer zweiten Phase nach
+                     Projektende startet eine BewÃ¤hrungsphase, in der evaluiert wird, ob der Dienst
+                     genutzt wird. In dieser Phase finden notwendige Wartungen statt. Damit soll
+                     verhindert werden, dass die Anwendung nach Projektende nicht mehr weiter
+                     nutzbar ist. Da aber nicht alle Dienste weiterentwickelt und gepflegt werden
+                     kÃ¶nnen, werden nur diejenigen weiterhin angeboten, die sich bewÃ¤hrt haben.</p>
+                  <p>Die Software fÃ¼r den Prototypen ist open-source Ã¶ffentlich verfÃ¼gbar und kann
+                     somit auch von anderen Einrichtungen genutzt werden, um eine eigene Instanz des
+                     XSample-Servers zu betreiben. Neben einem laufenden Dataverse-Server wird
+                     lediglich eine SQL-basierte Datenbank benÃ¶tigt, um den XSample-Server in
+                     bestehende Infrastruktur integrieren zu kÃ¶nnen. Die Anforderungen an
+                     Rechenleistung und Speicherplatz fÃ¼r den Prototypen sind hierbei
+                     Ã¼berschaubar.</p>
+                  <p>Zwar ist der aktuelle Prototyp auf die Schnittstelle zu Dataverse beschrÃ¤nkt,
+                     der XSample-Workflow lÃ¤sst sich aber auf beliebige Repositoriensoftware mit
+                     Ã¤hnlichen Eigenschaften Ã¼bertragen. Entsprechend kann mit mÃ¤ÃŸigem Aufwand auch
+                     der XSample-Server angepasst werden, um mit anderen Repositorien interagieren
+                     zu kÃ¶nnen. Etwas komplexer gestaltet sich die UnterstÃ¼tzung zusÃ¤tzlicher
+                     Formate, da hierbei sichergestellt werden muss, dass sowohl die Implementierung
+                     des XSample-Servers selbst als auch die Korpusanfrageschnittstelle im
+                     Hintergrund ein gegebenes Format lesen kÃ¶nnen. Im Falle der Auszugskomponente
+                     im XSample-Server kommt noch das Schreiben der im Auszug enthaltenen Daten im
+                     entsprechenden Format hinzu. </p>
+               </div>
+            </div>
+            <div type="chapter">
+               <head>4. Nutzungsszenarien</head>
+
+               <p>Der Bedarfsermittlung und Erprobung der XSample-Infrastruktur dienen zwei
+                  AnwendungsfÃ¤lle aus Linguistik und Literaturwissenschaft, anhand derer die
+                  konkrete Umsetzung vor dem Hintergrund mÃ¶glicher (Nach-)Nutzungsszenarien
+                  veranschaulicht wird. Der Fokus liegt dabei auf den jeweiligen Vor- und Nachteilen
+                  des Auszugsverfahrens im Vergleich zum Prinzip der abgeleiteten Textformate.</p>
+               <div type="subchapter">
+                  <head>4.1 Erstes Nutzungsszenario: Wissenschaftssprache</head>
+
+                  <p>Das erste Nutzungsszenario beschÃ¤ftigt sich mit den Wissenschaftssprachen der
+                     Disziplinen Literaturwissenschaft, Linguistik und Philosophie. Es handelt sich
+                     dabei um die Replikation einer Studie<note type="footnote"> Bei der
+                        Originalstudie handelt es sich um <ref type="bibliography" target="#andresen_sprachbeschreibung_2022">Andresen 2022</ref>.</note> zur Frage, wie sich
+                     die Wissenschaftssprachen von Linguistik und Literaturwissenschaft voneinander
+                     unterscheiden. Als Datengrundlage der Originalstudie dienen jeweils 30
+                     Dissertationen aus den beiden FÃ¤chern. Die Unterschiede zwischen den beiden
+                     Teilkorpora werden in einem datengeleiteten Verfahren mithilfe von maschinellem
+                     Lernen ermittelt. Daran anschlieÃŸend erfolgt eine Interpretation der
+                     deutlichsten Unterschiede vor dem Hintergrund wissenschaftstheoretischer
+                     Merkmale der beiden Disziplinen. In der Replikationsstudie werden im
+                     Wesentlichen zwei Modifikationen vorgenommen: Erstens erfolgt eine VerÃ¤nderung
+                     der Variable â€ºTextsorteâ€¹ von Dissertationen hin zu Zeitschriftenartikeln.
+                     WÃ¤hrend die Autor*innen von Dissertationen mit ihren Texten zwar ihre
+                     Beherrschung der fachtypischen Wissenschaftssprache nachweisen, durchlaufen
+                     Zeitschriftenartikel in der Regel mehr Schritte der QualitÃ¤tssicherung. Sie
+                     werden auÃŸerdem von der Fachgemeinschaft breiter rezipiert, sodass sie auch als
+                     reprÃ¤sentativer fÃ¼r die jeweilige fachspezifische Wissenschaftssprache gelten
+                     kÃ¶nnen. Zweitens wird die Datengrundlage um die Philosophie als drittes
+                     geisteswissenschaftliches Fach erweitert. Dadurch werden Literaturwissenschaft
+                     und Linguistik nochmals aus einer neuen Perspektive beleuchtet, nÃ¤mlich im
+                     Kontrast zur Philosophie. AuÃŸerdem ist mit der Hinzunahme des dritten Faches
+                     ein Schritt dahingehend getan, Aussagen Ã¼ber die Wissenschaftssprache der
+                     Geisteswissenschaften im Allgemeinen zu treffen.</p>
+                  <p>Das Korpus umfasst insgesamt 135 Zeitschriftenartikel, jeweils 45 pro Fach.
+                     Alle Texte werden automatisch mit Lemmata, Wortarten und syntaktischen
+                     Dependenzen annotiert. FÃ¼r den XSample-Workflow werden die annotierten Texte im
+                     CoNLL-Format an der UniversitÃ¤tsbibliothek Stuttgart
+                     gespeichert. Die Ursprungsdaten im PDF-Format werden gemeinsam mit den
+                     Annotationen im Repositorium aufbewahrt. Um sicherzustellen, dass von den
+                     annotierten Daten wieder auf die PDF-Seiten der Ursprungsdaten geschlossen
+                     werden kann, mÃ¼ssen hierbei Informationen zur Alignierung der beiden
+                     Dateiformate gespeichert werden. Im Falle dieses Nutzungsszenarios erfolgt dies
+                     in Form einer einfachen Tabelle fÃ¼r jedes Dokument, die fÃ¼r jeden fortlaufend
+                     nummerierten Satz verzeichnet, auf welcher Seite oder welchen Seiten im
+                     PDF-Dokument er zu finden ist. </p>
+                  <p>Im Fokus der Replikationsstudie stehen EinzelwÃ¶rter und Wortartentags (<term
+                        type="dh">Unigramme</term>), wÃ¤hrend die vorausgehende Studie<note
+                           type="footnote"> Vgl. <ref type="bibliography" target="#andresen_sprachbeschreibung_2022">Andresen 2022</ref>.</note> einen besonderen Schwerpunkt auf
+                     Sequenzen legt, die entlang der syntaktischen Dependenzen im Satz gebildet
+                     werden. Hiervon abgesehen orientiert sich die Replikationsstudie in
+                     methodischer Hinsicht eng am Original: Im ersten Schritt werden die Merkmale
+                     mit den grÃ¶ÃŸten Unterschieden zwischen den Teilkorpora auf datengeleitete Weise
+                     ermittelt. Zu diesem Zweck wird mit dem maschinellen Lernverfahren der <term
+                        type="dh">Support-Vector-Machine</term> (SVM) ein Klassifikator trainiert,
+                     der jeweils zwischen Texten aus zwei der drei Disziplinen unterscheiden soll.
+                     Die lineare SVM bietet die MÃ¶glichkeit, auf die Koeffizienten zuzugreifen, die
+                     fÃ¼r jedes Merkmal ausdrÃ¼cken, wie hilfreich es fÃ¼r die Klassifikationsaufgabe
+                     war. Anhand dieser Koeffizienten wird ein Feature-Ranking wie in <ref
+                        type="graphic" target="#tab01">Tabelle 1</ref> erstellt, das die
+                     grÃ¶ÃŸten Unterschiede zwischen den Teilkorpora (im Sinne der SVM) darstellt. Der
+                     zweite Schritt der Analyse besteht dann in der Interpretation dieses
+                     Feature-Rankings. Welche sprachlichen Unterschiede verbergen sich hinter den
+                     Merkmalen und (wie) kÃ¶nnen sie anhand wissenschaftstheoretischer Merkmale der
+                     Disziplinen erklÃ¤rt werden? WÃ¤hrend der erste Schritt rein datengeleitet
+                     arbeitet, muss fÃ¼r die Interpretation auf unterschiedliche Ressourcen
+                     zurÃ¼ckgegriffen werden: Erstens ist der erneute RÃ¼ckgriff auf das Korpus
+                     notwendig, um verstehen zu kÃ¶nnen, wie das Merkmal in den Texten verwendet
+                     wird. Zweitens muss Wissen Ã¼ber die wissenschaftstheoretischen Merkmale der
+                     Disziplinen sowie bereits vorhandene empirische Erkenntnisse zu den
+                     vorliegenden PhÃ¤nomenen herangezogen werden, um die Daten in einen funktionalen
+                     Zusammenhang setzen und gegebenenfalls erklÃ¤ren zu kÃ¶nnen.</p>
+                  <table>
+                     <row>
+                        <cell>Rang</cell>
+                        <cell>Philosophie</cell>
+                        <cell>Score</cell>
+                        <cell>Literaturwissenschaft</cell>
+                     </row>
+                     <row>
+                        <cell>1</cell>
+                        <cell/>
+                        <cell>-77,07</cell>
+                        <cell>ADJA</cell>
+                     </row>
+                     <row>
+                        <cell>2</cell>
+                        <cell>PPER</cell>
+                        <cell>38,19</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>3</cell>
+                        <cell/>
+                        <cell>-34,98</cell>
+                        <cell>NE</cell>
+                     </row>
+                     <row>
+                        <cell>4</cell>
+                        <cell/>
+                        <cell>-33,23</cell>
+                        <cell>VVFIN</cell>
+                     </row>
+                     <row>
+                        <cell>5</cell>
+                        <cell>PDAT</cell>
+                        <cell>29,00</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>6</cell>
+                        <cell>FM</cell>
+                        <cell>20,20</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>7</cell>
+                        <cell>VAFIN</cell>
+                        <cell>17,55</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>8</cell>
+                        <cell>KON</cell>
+                        <cell>14,84</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>9</cell>
+                        <cell>PDS</cell>
+                        <cell>12,39</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>10</cell>
+                        <cell>PROAV</cell>
+                        <cell>12,10</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>11</cell>
+                        <cell/>
+                        <cell>-11,65</cell>
+                        <cell>PRF</cell>
+                     </row>
+                     <row>
+                        <cell>12</cell>
+                        <cell>PPOSAT</cell>
+                        <cell>11,18</cell>
+                        <cell/>
+                     </row>
+                     <row>
+                        <cell>13</cell>
+                        <cell/>
+                        <cell>-10,73</cell>
+                        <cell>ART</cell>
+                     </row>
+                     <row>
+                        <cell>14</cell>
+                        <cell/>
+                        <cell>-10,16</cell>
+                        <cell>VVPP</cell>
+                     </row>
+                     <row>
+                        <cell>15</cell>
+                        <cell/>
+                        <cell>-8,10</cell>
+                        <cell>VVINF</cell>
+                     </row>
+                     <trailer xml:id="tab01">
+                        <ref type="intern" target="#tab1">Tab. 1</ref>: Die distinktivsten
+                        Wortarten fÃ¼r die Unterscheidung von Philosophie und Literaturwissenschaft
+                        im Sinne der SVM. Das verwendete Tagset ist das STTS (<ref type="bibliography" target="#schiller_guidelines_1999">Schiller et al.
+                        1999</ref>). [Andresen 2022] <ref type="graphic"
+                           target="#nachnutzung_2021_t1"/>
+                     </trailer>
+                  </table>
+
+                  <p>Diese Schritte werden im Folgenden am Beispiel der Analyse der Verwendung des
+                     Pronomens <term type="figure">wir</term> in den drei Disziplinen
+                     veranschaulicht. Im Zuge dessen wird auch diskutiert, welche Daten zur
+                     ÃœberprÃ¼fung und Re-Validierung der Analyseresultate vonnÃ¶ten sind.</p>
+                  <p>
+                     <ref type="graphic" target="#tab01">Tabelle 1</ref> zeigt das Ranking
+                     der 15 distinktivsten Wortarten fÃ¼r den Vergleich von Philosophie und
+                     Literaturwissenschaft. WÃ¤hrend sich aus diesen Ergebnissen zahlreiche relevante
+                     RÃ¼ckschlÃ¼sse auf die Unterschiede zwischen den Wissenschaftssprachen der beiden
+                     Disziplinen ziehen lassen, wird hier nur ein Merkmal in den Fokus genommen: Im
+                     Vergleich mit der Literaturwissenschaft zeichnet sich die Philosophie durch
+                     eine hohe Verwendungsfrequenz von Personalpronomen (PPER) aus. Der zusÃ¤tzliche
+                     RÃ¼ckgriff auf die <term type="dh">Token</term>-Ebene zeigt, dass dieser
+                     Unterschied insbesondere durch die Pronomen <term type="figure">wir</term> und
+                        <term type="figure">es</term> erzeugt wird. Dies wird hier zum Anlass
+                     genommen, die fachspezifische (bzw. gegebenenfalls auch
+                     zeitschriften-spezifische) <term type="figure">wir</term>-Verwendung
+                     differenzierter zu betrachten. Zu diesem Zwecke wurde aus jedem Korpus eine
+                     Stichprobe von 100 SÃ¤tzen, in denen <term type="figure">wir</term> verwendet
+                     wird, nach dem Zufallsprinzip ausgewÃ¤hlt und manuell klassifiziert. Dabei wurde
+                     auf die Klassifikation von <term type="figure">wir</term>-Verwendungen im
+                     deutschsprachigen akademischen Diskurs von Kresta<note type="footnote"> Vgl.
+                        <ref type="bibliography" target="#kresta_realisierungsformen_1995">Kresta 1995</ref>, S.130â€“147, vgl. auch 
+                        <ref type="bibliography" target="#steinhoff_textkompetenz_2007">Steinhoff 2007</ref>, S. 206f.</note>
+                     zurÃ¼ckgegriffen. Kresta unterscheidet vier Gebrauchsweisen von <term
+                        type="figure">wir</term> in deutschsprachigen akademischen Texten: Das
+                     Pronomen wird verwendet, </p>
+                  <list type="unordered">
+                     <item>a.) um auf die tatsÃ¤chlichen Verfasser*innen eines Textes zu verweisen
+                           (Autor*innen-<term type="figure">wir</term>), </item>
+                     <item>b.) um ein Kollektiv, bestehend aus Verfasser*innen und Leser*innen eines
+                        Textes, zu bezeichnen (Teamwork-<term type="figure">wir</term>), </item>
+                     <item>c.) zur Bezeichnung fachspezifischer Kollektiva aus akademischen
+                        Verfasser*innen und Leser*innen (Fachkreis-<term type="figure">wir</term>)
+                        sowie </item>
+                     <item>d.) um auf alle Menschen zu referieren (Gemeinschafts-<term type="figure"
+                           >wir</term>).</item>
+                  </list>
+                  <p>Die Stichproben zeigen (vgl. <ref type="graphic" target="#tab02"
+                        >Tabelle 2</ref>) in den Texten fachspezifische Muster der <term
+                        type="figure">wir</term>-Verwendungen: So sind sich die
+                     literaturwissenschaftlichen und philosophischen Texte darin Ã¤hnlich, dass in
+                     beiden Gruppen die Verwendung des Gemeinschafts-<term type="figure">wir</term>
+                     dominiert, wÃ¤hrend in den linguistischen AufsÃ¤tzen die Verwendung des
+                        Autor*innen-<term type="figure">wir</term> vorherrscht. Die Dominanz des
+                        Autor*innen-<term type="figure">wir</term> in der Linguistik lÃ¤sst sich
+                     dadurch erklÃ¤ren, dass die Texte tatsÃ¤chlich mehrheitlich von mehreren
+                     Autor*innen verfasst wurden (siehe Beispiel 1). Diese Praxis scheint in der
+                     Linguistik weitaus Ã¼blicher zu sein als in den anderen beiden FÃ¤chern. Die
+                     Ã„hnlichkeit von Philosophie und Literaturwissenschaft in ihrer Verwendung des
+                        Gemeinschafts-<term type="figure">wir</term> mag hingegen verwundern, da die
+                     beiden FÃ¤cher hÃ¤ufig ihre formal-sprachlichen Unterschiede betonen.
+                     Insbesondere in der Philosophie dient die Kennzeichnung eines philosophischen
+                     Ansatzes als â€ºliterarischâ€¹ oft der Kritik am philosophischen Gehalt
+                        desselben.<note type="footnote"> Vgl. zum Beispiel JÃ¼rgen Habermasâ€™ Kritik
+                        an der <bibl>
+                           <title type="desc">Einebnung des Gattungsunterschiedes zwischen
+                              Philosophie und Literatur</title>
+                        </bibl>, <ref type="bibliography" target="#habermas_diskurs_1998">Habermas 1988</ref>, S. 217.</note> Eine Auswertung der konkreten
+                     Belegstellen zeigt jedoch, dass es sich in den beiden FÃ¤chern um
+                     unterschiedlich geartete Manifestationen des Gemeinschafts-<term type="figure"
+                        >wir</term> handelt, die man wiederum mit landlÃ¤ufigen Kennzeichen der
+                     beiden FÃ¤cher in Verbindung bringen kann: So dominiert in der Stichprobe aus
+                     der Philosophie ein Gebrauch des Gemeinschafts-<term type="figure">wir</term>
+                     der letztendlich auf die grundlegenden Bedingungen des menschlichen Denkens und
+                     Handelns abzielt, wie das Beispiel 2 belegt. In der Stichprobe aus der
+                     Literaturwissenschaft, deren zentralen TÃ¤tigkeiten die LektÃ¼re und
+                     Interpretation von Texten sind, wird in 31 der 54 Verwendungen des
+                        Gemeinschafts-<term type="figure">wir</term> genau auf jene Praxis
+                     verwiesen, indem eine Art â€ºideale*r Leser*inâ€¹ konstituiert wird (siehe Beispiel
+                     3), weswegen in diesem Fall auch vom Leser*innen-<term type="figure">wir</term>
+                     gesprochen werden kann.</p>
+                  <table>
+                     <row>
+                        <cell/>
+                        <cell>Linguistik</cell>
+                        <cell>Philosophie</cell>
+                        <cell>Literaturwissenschaft</cell>
+                     </row>
+                     <row>
+                        <cell>Autor*innen-<term type="figure">wir</term>
+                        </cell>
+                        <cell>58</cell>
+                        <cell>7</cell>
+                        <cell>11</cell>
+                     </row>
+                     <row>
+                        <cell>Teamwork-<term type="figure">wir</term>
+                        </cell>
+                        <cell>32</cell>
+                        <cell>31</cell>
+                        <cell>16</cell>
+                     </row>
+                     <row>
+                        <cell>Fachkreis-<term type="figure">wir</term>
+                        </cell>
+                        <cell>3</cell>
+                        <cell>10</cell>
+                        <cell>17</cell>
+                     </row>
+                     <row>
+                        <cell>Gemeinschafts-<term type="figure">wir</term>
+                        </cell>
+                        <cell>7</cell>
+                        <cell>48</cell>
+                        <cell>54</cell>
+                     </row>
+                     <row>
+                        <cell> davon: Leser*innen-<term type="figure">wir</term>
+                        </cell>
+                        <cell/>
+                        <cell/>
+                        <cell>(31)</cell>
+                     </row>
+                     <row>
+                        <cell>Sonstige</cell>
+                        <cell>â€“</cell>
+                        <cell>4</cell>
+                        <cell>2</cell>
+                     </row>
+                     <trailer xml:id="tab02">
+                        <ref type="intern" target="#tab2">Tab. 2</ref>: Manuelle Kategorisierung
+                        der wir-Verwendung in einer Stichprobe von 100 Instanzen pro Disziplin. [Pichler 2022] <ref type="graphic" target="#nachnutzung_2021_t2"/>
+                     </trailer>
+                  </table>
+
+                  <p>Folgende Textausschnitte sollen als Beispiele fÃ¼r die nach Fachrichtung
+                     unterschiedlichen <term type="figure">wir</term>-Verwendungen dienen: </p>
+                  <list type="ordered">
+                     <item>Im Folgenden werden <hi rend="bold">wir </hi>die Datengrundlage nÃ¤her
+                        erlÃ¤utern und anschlieÃŸend kurz auf die von uns verwendeten
+                        korpuspragmatischen Analysewerkzeuge eingehen. (Lin_16)</item>
+                     <item>Diese FÃ¤higkeit wird im Gegenteil schrittweise erlernt bzw. angeeignet â€“
+                        so wie <hi rend="bold">wir </hi>z.Â B. unsere Muttersprache lernen oder
+                        aneignen â€“ nÃ¤mlich durch einen Prozess der â€ºunbewussten induktiven
+                        Schlussfolgerungâ€¹, die auf RegelmÃ¤ÃŸigkeiten oder Assoziationen unter unseren
+                        Sinneswahrnehmungen zurÃ¼ckzufÃ¼hren ist. (Philo_33)</item>
+                     <item>Zugespitzt kÃ¶nnte man sagen, dass der Begriff â€ºliterarische PrÃ¤senzâ€¹ ein
+                        Widerspruch in sich ist, weil die ErzÃ¤hlung zwar von den PrÃ¤senzerfahrungen
+                        ihrer Figuren erzÃ¤hlen kann, doch diese stets allein auf der Ebene der
+                        histoire â€ºprÃ¤sentâ€¹ sind, prÃ¤sent also fÃ¼r den ErzÃ¤hler â€“ doch <hi
+                           rend="bold">wir</hi>, die Leser, sind nicht der ErzÃ¤hler; [...]
+                        (Lit_03)</item>
+                  </list>
+                  <p>Vor dem Hintergrund mÃ¶glicher Nachnutzungsszenarien lassen sich fÃ¼r das erste
+                     Nutzungsszenario verschiedene Datenbedarfe feststellen, die mit
+                     unterschiedlichen Phasen der Analyse verbunden sind: FÃ¼r die datengeleitete
+                     Ermittlung distinktiver Merkmale ist es ausreichend, wenn die Texte nur in Form
+                     von n-Gramm-Frequenzen, also in einem abgeleiteten Format, vorliegen. Auf der
+                     Grundlage von z.Â B. Wortartenfrequenzen kann dieser Teil der Analyse direkt
+                     reproduziert werden.<note type="footnote"> Der Schritt von den Originaldaten zu
+                        den Frequenzdaten kann weder auf Grundlage dieser Daten noch basierend auf
+                        AuszÃ¼gen Ã¼berprÃ¼ft werden. Das ist bedauerlich, da bereits in dieser Phase
+                        richtungsweisende Entscheidungen getroffen werden (Findet eine
+                        Lemmatisierung statt? Werden StoppwÃ¶rter ausgeschlossen? Werden bestimmte
+                        Teile der Originaltexte nicht einbezogen? etc.).</note> AuÃŸerdem ist es etwa
+                     mÃ¶glich, die distinktiven Merkmale auf den gleichen Daten mithilfe anderer
+                     Verfahren zu ermitteln und methodische Vergleiche anzustellen. NaturgemÃ¤ÃŸ wird
+                     die weiterfÃ¼hrende Analyse auf genau solche Frequenzen eingeschrÃ¤nkt, die auch
+                     zur VerfÃ¼gung gestellt werden. Eine flexible Anpassung der n-Gramme (etwa ihrer
+                     LÃ¤nge oder der Art ihrer Generierung) ist nicht ohne weiteres mÃ¶glich, im
+                     GroÃŸen und Ganzen werden die Bedarfe dieser Analysephase aber durch abgeleitete
+                     Textformate gedeckt.</p>
+                  <p>Geht es hingegen um die Interpretation der Daten, reichen Frequenzinformationen
+                     nicht mehr aus. Um das PhÃ¤nomen zu verstehen und gegebenenfalls erklÃ¤ren zu
+                     kÃ¶nnen, ist es notwendig, konkrete Verwendungen im Korpus mitsamt ihrem Kontext
+                     zu sichten. Die notwendige KontextgrÃ¶ÃŸe hÃ¤ngt dabei von der Natur des
+                     untersuchten PhÃ¤nomens ab. FÃ¼r die <term type="figure">wir</term>-Analyse
+                     wurden pro Fach 100 zufÃ¤llige SÃ¤tze untersucht. Ein zumindest
+                     stichprobenartiger Zugriff auf Volltextdaten, wie er durch den XSample-Ansatz
+                     ermÃ¶glicht wird, ist zentral, um geisteswissenschaftlich fundierte Aussagen
+                     treffen und nachvollziehbar machen zu kÃ¶nnen.</p>
+               </div>
+               <div>
+                  <p></p>
+                  <p></p>
+                  <p></p>
+                  <p></p>
+               </div>
+               <div type="subchapter">
+                  <head>4.2 Zweites Nutzungsszenario: UnzuverlÃ¤ssiges ErzÃ¤hlen</head>
+
+                  <p>Der zweite Anwendungsfall setzt sich mit dem PhÃ¤nomen des unzuverlÃ¤ssigen
+                     ErzÃ¤hlens (genauer: mit faktenbezogener UnzuverlÃ¤ssigkeit) auseinander, das in
+                     einigen literarischen ErzÃ¤hlungen auftritt. Faktenbezogenes unzuverlÃ¤ssiges
+                     ErzÃ¤hlen liegt in einem fiktionalen Text dann vor, wenn die ErzÃ¤hlinstanz
+                     unzutreffende, zweifelhafte oder in relevanter Hinsicht unvollstÃ¤ndige Aussagen
+                     Ã¼ber die Fakten oder Ereignisse der erzÃ¤hlten Welt tÃ¤tigt.<note type="footnote"
+                        > Vgl. <ref type="bibliography" target="#martinez_einfuehrung_2009">MartÃnez / Scheffel 2009</ref>, S. 100; 
+                           <ref type="bibliography" target="#kindt_erzaehlen_2008">Kindt 2008</ref>, S. 48.</note>
+                  </p>
+                  <p>Im Gegensatz zum ersten Anwendungsfall handelt es sich beim zweiten nicht um
+                     eine Replikationsstudie, sondern um eine Pilotstudie zu einem kÃ¼rzlich
+                     gestarteten, auf drei Jahre ausgelegten Forschungsprojekt (<ref
+                        target="https://dfg-spp-cls.github.io/projects_en/2020/01/24/TP-Caution/"
+                        >CAUTION</ref>), das der Untersuchung der Schluss- und
+                     Argumentationsprozesse bei der Identifikation unzuverlÃ¤ssigen ErzÃ¤hlens durch
+                     Literaturwissenschaftler*innen bzw. Leser*innen gewidmet ist. UnzuverlÃ¤ssiges
+                     ErzÃ¤hlen gilt in der Literaturwissenschaft einerseits als stark
+                     interpretationsabhÃ¤ngiges PhÃ¤nomen,<note type="footnote"> Vgl. <ref type="bibliography" target="#yacobi_reliability_1981">Yacobi 1981</ref>;
+                        <ref type="bibliography" target="#nuenning_unreliable_1999">NÃ¼nning 1999</ref>.</note> andererseits listet die Forschung zahlreiche
+                     sprachliche Indikatoren, die auf unzuverlÃ¤ssiges ErzÃ¤hlen hinweisen
+                     kÃ¶nnen.<note type="footnote"> Vgl. <ref type="bibliography" target="#nuenning_narration_1998">NÃ¼nning 1998</ref>; 
+                        <ref type="bibliography" target="#allrath_signale_1998">Allrath 1998</ref>.</note>
+                     Leser*innen kÃ¶nnen solche Merkmale â€“ unter RÃ¼ckgriff auf allgemeines Weltwissen
+                     sowie literarische und literaturwissenschaftliche Kontexte â€“ zum Anlass nehmen,
+                     der ErzÃ¤hlinstanz eines fiktionalen Textes UnzuverlÃ¤ssigkeit zuzuschreiben. In
+                     diesem Rahmen entwickeln sie eine inhaltsspezifizierende Interpretation<note
+                        type="footnote"> Vgl. <ref type="bibliography" target="#folde_interpretation_2015">Folde 2015</ref>, S. 366.</note> des Textes, d.Â h. sie
+                     bilden Annahmen darÃ¼ber, was in der fiktiven Welt des Textes wahr und was
+                     falsch ist.</p>
+                  <p>Um die Schluss- und Argumentationsprozesse bei der Feststellung bzw.
+                     Zuschreibung unzuverlÃ¤ssigen ErzÃ¤hlens systematisch untersuchen zu kÃ¶nnen, sind
+                     in einer ersten AnnÃ¤herung folgende Teilfragen relevant: </p>
+                  <list type="ordered">
+                     <item>Welche ErzÃ¤hler*innen bzw. Figuren treten in einer ErzÃ¤hlung auf? </item>
+                     <item>Welche Ã„uÃŸerungen Ã¼ber die fiktive Welt der ErzÃ¤hlung treffen diese
+                        Instanzen? </item>
+                     <item>Welche dieser Ã„uÃŸerungen betreffen Propositionen, deren Zutreffen in der
+                        fiktiven Welt in Frage steht? </item>
+                     <item>Wie positionieren sich die relevanten Instanzen zu diesen Propositionen? </item>
+                     <item>Gibt es textuelle Hinweise auf die Vertrauens(un)wÃ¼rdigkeit der
+                        relevanten Instanzen?</item>
+                  </list>
+                  <p>Zur Beantwortung dieser Fragen wird im Rahmen des zweiten Nutzungsszenarios
+                     explorativ-heuristisch eine Mischung aus automatisierten Text-Mining-Verfahren
+                     und manueller Annotation auf ein Testkorpus aus vier kurzen bis mittellangen
+                     ErzÃ¤hlungen und vier langen ErzÃ¤hlungen aus dem 19. bis 21. Jahrhundert
+                     angewandt. FÃ¼r die Teilfragen (1) und (2) werden automatische Verfahren zur
+                     Erkennung von Named Entities<note type="footnote"> Verwendet wurde hier der
+                        <ref target="https://nlp.stanford.edu/software/CRF-NER.shtml">Stanford Named Entity
+                           Recognizer</ref>.</note> und <term type="dh">Redewiedergabe</term>
+                     <note type="footnote"> FÃ¼r die Erkennung von direkter Rede wurde ein simpler
+                        Tagger entwickelt, der auf der Identifikation von AnfÃ¼hrungszeichen basiert;
+                        indirekte Rede wurde mithilfe eines verfÃ¼gbaren <ref
+                           target="https://github.com/redewiedergabe/tagger">Taggers</ref> annotiert. Alle erzeugten Annotationen wurden anschlieÃŸend gesichtet und
+                        gegebenenfalls korrigiert.</note> verwendet, zusÃ¤tzlich wurden Koreferenzen
+                     exemplarisch manuell annotiert. FÃ¼r Fragen (3) und (4) muss â€“ wie es bei der
+                     Untersuchung genuin literaturwissenschaftlicher Konzepte oft notwendig ist â€“
+                     zunÃ¤chst ein eigenes Annotationsschema entwickelt werden, das dann im Rahmen
+                     manueller Annotation auf die Texte angewandt wird.<note type="footnote"> FÃ¼r
+                        die manuelle Annotation wurde die Annotations- und Analyseumgebung <ref
+                           target="https://catma.de/">CATMA</ref> verwendet.</note> FÃ¼r Frage (5)
+                     wird exemplarisch eine Indikatorengruppe aus der UnzuverlÃ¤ssigkeitsforschung in
+                     den Fokus genommen: die Verwendung emotionaler bzw. wertender Sprache, fÃ¼r
+                     deren Erkennung eine Kombination aus automatischer <term type="dh"
+                        >Sentimentanalyse</term>
+                     <note type="footnote"> Zum Einsatz kam hier SentText, vgl. <ref type="bibliography" target="#schmidt_tool_2021">Schmidt et al. 2021</ref>.
+                     </note> und manueller <term type="dh">Emotionsanalyse</term>
+                     eingesetzt wird.</p>
+                  <p>FÃ¼r den Einsatz computergestÃ¼tzter Verfahren in der Literaturwissenschaft ist
+                     oft erheblicher Entwicklungsaufwand notwendig, sowohl konzeptionell im Rahmen
+                     der Operationalisierung literaturwissenschaftlicher Forschungsfragen als auch
+                     technisch im Hinblick auf die Anpassung oder Neuentwicklung von Tools.<note
+                        type="footnote"> Vgl. <ref type="bibliography" target="#gius_textanalysen_2019">Gius 2019</ref>; 
+                           <ref type="bibliography" target="#pichler_operationalisierung_2021">Pichler / Reiter 2021</ref>.</note> Deswegen kann
+                     es bei der Auswertung der Pilotstudie noch nicht darum gehen, die Ã¼bergeordnete
+                     Forschungsfrage zu den Schluss- und Argumentationsprozessen bei der
+                     Feststellung unzuverlÃ¤ssigen ErzÃ¤hlens zu beantworten. Dennoch kann ein
+                     Einblick in die Daten bereits in diesem Zwischenstadium aufschlussreich sein.
+                     Generell ist Forschung im Bereich der Digital Humanities (und besonders im
+                     Bereich der <term type="dh">Computational Literary Studies</term>) stÃ¤rker als
+                     in den traditionellen Geisteswissenschaften durch <quote>ProzessualitÃ¤t,
+                        VorlÃ¤ufigkeit und â€ºNichtwissenâ€¹</quote>
+                     <note type="footnote"> <ref type="bibliography" target="#schruhl_objektumgangsnormen">Schruhl 2018</ref>.</note> gekennzeichnet. Dies lÃ¤sst sich
+                     durchaus als StÃ¤rke dieser AnsÃ¤tze verstehen, weil dadurch die Zwischenschritte
+                     der Forschung und Entwicklung dokumentiert (und damit durch Dritte einsehbar)
+                     werden, die in nicht-digitalen literaturwissenschaftlichen ZugÃ¤ngen oft
+                     implizit bleiben.</p>
+                  <p>Beim zweiten Nutzungsszenario dient eine Einsicht in die Daten durch Dritte
+                     also hauptsÃ¤chlich dem Zweck, einen Einblick in den Operationalisierungsprozess
+                     der Ã¼bergeordneten literaturwissenschaftlichen Fragestellung zu erhalten, oder
+                     ist dem Interesse an bestimmten EinzelphÃ¤nomenen (etwa dem Sentiment)
+                     geschuldet. Nachnutzer*innen kÃ¶nnen beispielsweise prÃ¼fen, inwieweit die
+                     eingesetzten Text-Mining-Verfahren bereits fÃ¼r die Anwendung auf literarischen
+                     Texten adÃ¤quat sind oder ob die fÃ¼r die manuelle Annotation entwickelten
+                     Annotationsschemata geeignet sind, die im Fokus stehenden literarischen
+                     PhÃ¤nomene zu fassen.</p>
+                  <p>FÃ¼r die Form, in der die Textdaten Dritten zugÃ¤nglich gemacht werden sollten,
+                     bedeutet das im vorliegenden Zusammenhang Folgendes:</p>
+                  <list type="ordered">
+                     <item>
+                        <hi rend="italic">Named Entity Recognition</hi>: Inwieweit die <term
+                           type="dh">Named Entity Recognition</term> (mit zu diesem Zeitpunkt noch
+                        nicht eigens fÃ¼r das Korpus trainierten Modellen) auf literarischen Texten
+                        zu brauchbaren Ergebnissen fÃ¼hrt, kann unter UmstÃ¤nden noch teilweise
+                        mittels abgeleiteter Textformate (z.Â B. bestimmter tokenbasierter
+                        Formate<note type="footnote"> Vgl. <ref type="bibliography" target="#schoech_textformate_2020">SchÃ¶ch et al. 2020</ref>.</note>) geprÃ¼ft
+                        werden. ZusÃ¤tzlich kÃ¶nnen Nachnutzer*nnen sich damit ebenfalls einen ersten
+                        Eindruck hinsichtlich der im jeweiligen Text auftretenden Figuren
+                           verschaffen.<note type="footnote"> TatsÃ¤chlich ist (auch eine eigens
+                           trainierte) Named Entity Recognition nur in eingeschrÃ¤nktem MaÃŸe fÃ¼r die
+                           Identifikation der relevanten Akteur*innen / Instanzen geeignet, da gerade in
+                           potenziell unzuverlÃ¤ssigen ErzÃ¤hlungen hÃ¤ufig homodiegetische
+                           ErzÃ¤hler*innen (â€ºIch-ErzÃ¤hler*innenâ€¹) auftreten, auf die nicht oder
+                           selten mit Eigennamen referiert wird.</note>
+                     </item>
+                     <item>
+                        <hi rend="italic">Automatische Sentimentanalyse</hi>: Um zu beurteilen, ob
+                        durch das lexikonbasierte Vorgehen der automatischen Sentimentanalyse
+                        einzelne WÃ¶rter falsch klassifiziert wurden, ist der Rekurs auf den
+                        textuellen Kontext notwendig, den abgeleitete Textformate nicht ermÃ¶glichen.
+                        Ein erster Einblick in die Ergebnisse der automatischen Sentimenanalyse ist
+                        allerdings noch mit abgeleiteten Textformaten mÃ¶glich, sofern fÃ¼r
+                        Nachnutzer*innen interessant ist, ob ein Text bzw. Korpus eher von negativen
+                        oder positiven WÃ¶rtern geprÃ¤gt ist oder welche WÃ¶rter bzw. Wortfelder mit
+                        positiver oder negativer PolaritÃ¤t vorherrschen.</item>
+                     <item>
+                        <hi rend="italic">Redewiedergabeerkennung</hi>: FÃ¼r die PrÃ¼fung der
+                        automatisch generierten Redewiedergabe-Annotationen sind abgeleitete
+                        Textformate ebenfalls nicht funktional, da die Annotationen lÃ¤ngere Passagen
+                        betreffen bzw. ihre Korrektheit (insbesondere im Fall indirekter Rede) nur
+                        unter RÃ¼ckgriff auf die fraglichen Textpassagen beurteilt werden kann. Auch
+                        der fÃ¼r die weitere Bearbeitung der Ã¼bergeordneten Forschungsfrage
+                        ausschlaggebende Inhalt der Figurenrede kann nur durch Konsultation
+                        zusammenhÃ¤ngender Textpassagen untersucht werden.</item>
+                     <item>
+                        <hi rend="italic">KoreferenzauflÃ¶sung</hi>: Bei den manuellen Annotationen
+                        zur KoreferenzauflÃ¶sung sind sowohl zur PrÃ¼fung der Korrektheit als auch fÃ¼r
+                        die Bearbeitung der inhaltlichen Fragestellung (â€ºWer sagt was?â€¹) textuelle
+                        Kontexte notwendig.</item>
+                     <item>
+                        <hi rend="italic">Manuelle Emotionsanalyse</hi>: FÃ¼r die manuelle
+                        Emotionsanalyse wurde im Rahmen des Nutzungsszenarios ein eigenes Tagset
+                        entwickelt, das auf den sprachlichen Indikatoren basiert, die in der
+                        erzÃ¤hltheoretischen Forschungsliteratur als Hinweise auf die EmotionalitÃ¤t
+                        von ErzÃ¤hler*innen (und damit auf ihre mÃ¶gliche UnzuverlÃ¤ssigkeit)
+                        identifiziert werden. Derartige Operationalisierungen
+                        literaturwissenschaftlicher Forschungsfragen fÃ¼r die computergestÃ¼tzte
+                        Analyse sind oft langwierige Prozesse und benÃ¶tigen im Rahmen von manueller
+                        (und meist kollaborativer) Annotation hÃ¤ufig mehrere DurchlÃ¤ufe.<note
+                           type="footnote"> Vgl. <ref type="bibliography" target="#gius_profit_2017">Gius / Jacke 2017</ref>; 
+                           <ref type="bibliography" target="#reiter_anleitung_2020">Reiter 2020</ref>.</note> Im Rahmen
+                        des zweiten Nutzungsszenarios hat ein erster dieser DurchlÃ¤ufe
+                        stattgefunden, in dem Forscher*innen bzw. Datenlieferant*innen einige
+                        Entscheidungen treffen mussten, die fÃ¼r den Nachvollzug der Ergebnisse durch
+                        Dritte relevant sein kÃ¶nnen. HierfÃ¼r ist nicht nur ein Einblick in die
+                        Annotationsschemata und Anwendungsrichtlinien notwendig, sondern ebenso der
+                        Zugriff auf zusammenhÃ¤ngende Textteile, die den textuellen Kontext zeigen
+                        und damit individuelle Annotationsentscheidungen potenziell nachvollziehbar
+                        machen. Einen ersten Eindruck von den Ergebnissen der manuellen
+                        Emotionsanalyse kÃ¶nnen sich Nachnutzer*innen â€“ analog zur verwandten
+                        Sentimentanalyse â€“ allerdings auch auf der Basis abgeleiteter Textformate
+                        verschaffen.</item>
+                     <item>
+                        <hi rend="italic">Wahre Propositionen der erzÃ¤hlten Welt</hi>: Den
+                        komplexesten und zugleich wichtigsten Operationalisierungs- und
+                        Annotationsschritt stellt im Rahmen des zweiten Nutzungsszenarios die
+                        manuelle Annotation der SÃ¤tze dar, die diejenigen Propositionen betreffen,
+                        deren Wahrheit in der fiktiven Welt eines Textes in Frage stehen. Genau wie
+                        im Fall der manuellen Emotionsanalyse mÃ¼ssen die Annotationskategorien erst
+                        in mehreren DurchlÃ¤ufen entwickelt werden, von denen der erste im Rahmen des
+                        vorliegenden Nutzungsszenarios stattfindet. Allerdings muss fÃ¼r die
+                        Entwicklung von Annotationsschemata und Guidelines hier noch mehr Vorarbeit
+                        geleistet werden als bei der Emotionsanalyse, da in der
+                        UnzuverlÃ¤ssigkeitsforschung fÃ¼r letztere bereits Listen mit textuellen
+                        Indikatoren zur VerfÃ¼gung stehen, die vergleichsweise direkt in
+                        Annotationsschemata Ã¼bertragen werden kÃ¶nnen. Die Annotation in Frage
+                        stehender SÃ¤tze erfordert dagegen grundsÃ¤tzliche konzeptionelle und
+                        praktische Entscheidungen. Im Rahmen dieses Nutzungsszenarios wurden
+                        beispielsweise zunÃ¤chst jeweils textspezifische Kategorien entwickelt, d.Â h.
+                        dass fÃ¼r jeden Text ca. zwÃ¶lf zentrale, in Frage stehende Propositionen
+                        identifiziert und als Tagset umgesetzt wurden (z.Â B. fÃ¼r E.Â T.Â A. Hoffmanns <bibl>
+                           <title type="desc">Der Sandmann</title>
+                        </bibl> die Propositionen <quote>Der dÃ¤monische Sandmann existiert</quote>,
+                           <quote>Der Sandmann will Nathanaels Leben zerstÃ¶ren</quote>,
+                           <quote>Advokat Coppelius und WetterglashÃ¤ndler Coppola sind dieselbe
+                           Person</quote> etc.). Mithilfe dieser spezifischen Tagsets wurden in den
+                        Texten jeweils SÃ¤tze annotiert, in denen die fraglichen Propositionen
+                        thematisiert werden, um Ã¼berhaupt erst einmal die grundsÃ¤tzliche
+                        Umsetzbarkeit des Ansatzes zu testen. Perspektivisch ist die Entwicklung
+                        eines generischen Tagsets fÃ¼r diese Annotationsaufgabe wÃ¼nschenswert, in dem
+                        beispielsweise Propositionen in Typen (z.Â B. in <term type="dh"
+                           >singular</term>, <term type="dh">particularized</term> und <term
+                              type="dh">general</term>) unterteilt und verschiedene Rollen der Propositionen im Rahmen von Argumenten (PrÃ¤misse und
+                        Konklusion) unterschieden werden.
+                        Deshalb ist zu erwarten, dass sich die Annotationskategorien und
+                        Anwendungsrichtlinien noch erheblich verÃ¤ndern werden. Aus diesem Grund kann
+                        der Nachvollzug der einzelnen Operationalisierungsschritte durch Dritte von
+                        besonderer Bedeutung sein. Dieser wird wieder durch Zugriff auf
+                        Annotationskategorien / Anwendungsrichtlinien im Manifest sowie (mindestens)
+                        zusammenhÃ¤ngende Textabschnitte ermÃ¶glicht. An dieser Stelle tritt ein
+                        weiterer Unterschied zur manuellen Emotionsanalyse zutage: WÃ¤hrend bei der
+                        Emotionsanalyse anhand sprachlicher Indikatoren vornehmlich einzelne WÃ¶rter
+                        annotiert werden, betrifft die Annotation bei der Analyse in Frage stehender Propositionen mindestens TeilsÃ¤tze. Tokenbasierte abgeleitete Textformate sind
+                        deswegen weder fÃ¼r den Nachvollzug der Kategorienentwicklung oder der
+                        Annotationsentscheidungen noch fÃ¼r einen ersten Einblick in die Ergebnisse
+                        der Annotation bzw. Analyse funktional.</item>
+                  </list>
+                  <p>Zusammenfassend lÃ¤sst sich also festhalten, dass abgeleitete Textformate fÃ¼r
+                     den Nachvollzug der Operationalisierung literaturwissenschaftlicher
+                     Forschungsfragen, die in der durch das zweite Nutzungsszenario abgebildeten
+                     Forschungsphase im Vordergrund steht, nur schwer oder gar nicht verwendbar
+                     sind. Ein Auszugskonzept kann dagegen vielen der genannten Anforderungen
+                     begegnen.</p>
+                  <p>Wie eingangs deutlich gemacht wurde, dient das zweite Nutzungsszenario als
+                     Pilotstudie zu einem umfangreicheren Projekt, das die Schluss- und
+                     Argumentationsprozesse bei der Feststellung bzw. Zuschreibung unzuverlÃ¤ssigen
+                     ErzÃ¤hlens untersucht. In diesem Zusammenhang wird fÃ¼r Nachnutzer*innen die
+                     Notwendigkeit, auf zusammenhÃ¤ngende Textteile zugreifen zu kÃ¶nnen, noch stÃ¤rker
+                     in den Vordergrund rÃ¼cken, denn unzuverlÃ¤ssiges ErzÃ¤hlen gilt als PhÃ¤nomen,
+                     dessen Feststellung sich aus dem Zusammenspiel verschiedener sprachlicher
+                     Indikatoren, Ã¼ber den Text verteilter Informationen und Kontextinformationen
+                     ergibt. Aus diesem Grund bleibt letztlich noch zu prÃ¼fen, inwieweit (d.Â h. bei
+                     welchen PhÃ¤nomenvarianten oder Texten) der Zugriff auf TextauszÃ¼ge fÃ¼r
+                     Nachnutzer*innen ausreichend ist. Fest steht allerdings, dass sich ein
+                     Auszugsmodell, wie es in XSample entwickelt wurde, den Bedarfen dieser
+                     AnwendungsfÃ¤lle deutlich stÃ¤rker annÃ¤hert als abgeleitete Textformate und
+                     Forschenden eine MÃ¶glichkeit bietet, (auch) an urheberrechtlich geschÃ¼tzten Texten solch komplexe literarische
+                     PhÃ¤nomene zu untersuchen.</p>
+               </div>
+            </div>
+            <div type="chapter">
+               <head>5. Fazit</head>
+
+               <p>Um urheberrechtlichen EinschrÃ¤nkungen bei der Auswahl, Verbreitung und Nachnutzung
+                  von Forschung von vornherein aus dem Weg zu gehen, konzentrieren viele digitale
+                  Geisteswissenschaftler*innen ihre korpusorientierte Forschung auf gemeinfreie
+                  Texte. In der Breite fÃ¼hrt dies zu Verzerrungen der Forschungslandschaft, die
+                  inhaltlich wie methodologisch problematisch sind. Dieser Artikel ging daher von
+                  folgendem Desiderat fÃ¼r die Forschungscommunity in den digitalen
+                  Geisteswissenschaften aus: Der bestehende urheberrechtliche Rahmen sollte in der
+                  Praxis so gut es geht ausgenutzt werden, nicht zuletzt um die Relevanz von
+                  korpusorientierter Forschung auf geschÃ¼tzten Texten forschungspolitisch zu
+                  unterstreichen. Hier kommt einer forschungsgeleiteten Dateninfrastruktur die
+                  wichtige Rolle zu, Forscher*innen eine mÃ¶glichst weitgehende, rechtskonforme
+                  Verwendung geschÃ¼tzter Texte zu ermÃ¶glichen. </p>
+               <p>Zwei AnsÃ¤tze hierzu sind zum einen individuelle Lizenzvereinbarungen, zum anderen
+                  das jÃ¼ngst vorgestellte Prinzip abgeleiteter Textformate. Der Austausch von
+                  Ergebnissen einer explorativen Forschungspraxis auf Basis von Fragestellungen, die
+                  fÃ¼r eine Interpretation die Einbeziehung relevanten Kontexts erforderlich machen,
+                  ist mit beiden AnsÃ¤tzen aber nur sehr eingeschrÃ¤nkt mÃ¶glich. Der vorliegende
+                  Beitrag schlÃ¤gt daher eine infrastrukturelle Erweiterung des Instrumentariums vor,
+                  die auf der urheberrechtlich zulÃ¤ssigen Weitergabe von TextauszÃ¼gen aufbaut. Um
+                  die NÃ¼tzlichkeit dieses Ansatzes fÃ¼r das individuelle Forschungsvorhaben zu
+                  maximieren, ermÃ¶glicht der XSample-Workflow den Nutzer*nnen, TextauszÃ¼ge flexibel
+                  anhand von Suchanfragen an den Text und seine Annotationen auszuwÃ¤hlen.</p>
+               <p>Anhand zweier Nutzungsszenarien aus Sprach- und Literaturwissenschaft wurde
+                  beispielhaft gezeigt, welche MÃ¶glichkeiten und Grenzen sich aus dem Prinzip
+                  abgeleiteter Textformate sowie dem Auszugskonzept im Kontext konkreter
+                  geisteswissenschaftlicher Forschungsprojekte ergeben. Das linguistische Szenario
+                  vergleicht Wortfrequenzen zwischen drei Korpora, eine Aufgabe, die problemlos
+                  anhand von einfachen Frequenzlisten â€“ d.Â h. auf Basis abgeleiteter Textformate â€“
+                  reproduziert werden kann. Jedoch erfordert der nÃ¤chste Schritt, die Interpretation
+                  der quantitativen Befunde, eine Rekontextualisierung der Ergebnisse und damit
+                  Zugriff auf die zu untersuchenden Textstellen in ihrem Kontext. Hier stÃ¶ÃŸt das
+                  Prinzip abgeleiteter Textformate an seine Grenzen; durch das Auszugskonzept kann
+                  dieser Schritt hingegen in einem fÃ¼r den Anwendungsfall ausreichendem MaÃŸe
+                  geleistet werden. </p>
+               <p>Das zweite Szenario beschÃ¤ftigt sich mit dem PhÃ¤nomen des unzuverlÃ¤ssigen
+                  ErzÃ¤hlens, bei dem sich schnell zeigt, dass abgeleitete Textformate nicht sinnvoll
+                  eingesetzt werden kÃ¶nnen. Das betrifft zum einen den Nachvollzug der
+                  Operationalisierung der literaturwissenschaftlichen Kategorien, fÃ¼r den der nÃ¤here
+                  textuelle Kontext notwendig ist, zum anderen die Analyse und Interpretation der
+                  Annotationen als Indikatoren fÃ¼r Vorkommnisse unzuverlÃ¤ssigen ErzÃ¤hlens, fÃ¼r die
+                  auch der weitere textuelle Kontext von Bedeutung ist. Lediglich
+                  Vorverarbeitungsschritte wie eine Named Entity Recognition kÃ¶nnen Ã¼ber abgeleitete
+                  Formate, etwa mittels Frequenzdaten, nachgenutzt werden. Der Zugriff auf
+                  individuell ausgewÃ¤hlte TextauszÃ¼ge ist fÃ¼r den literaturwissenschaftlichen
+                  Anwendungsfall somit deutlich vielversprechender. Allerdings ist anzumerken, dass
+                  fÃ¼r gewisse Interpretationen auch der ganze Text vorliegen muss. Hier kÃ¶nnte das
+                  Auszugskonzept zu einer ersten Sichtung und Bewertung des Materials dienen, vor
+                  dem Hintergrund komplexer literaturwissenschaftlicher Fragestellung aber an seine
+                  Grenzen stoÃŸen. </p>
+               <p>Die zwei Nutzungsszenarien kÃ¶nnen die Breite geisteswissenschaftlicher
+                  Fragestellungen und Methoden nur in begrenztem MaÃŸ abbilden. Sie machen jedoch
+                  deutlich, dass selbst Analysen, die einen quantitativen, auf automatisierte
+                  Verfahren bauenden Zugang zu den Daten nutzen, fÃ¼r die Interpretation am Ende auf
+                  Kontextinformationen angewiesen sind. Nur dieser Schritt macht die Analyse an die
+                  Geisteswissenschaften anschlussfÃ¤hig und fÃ¼r die Forschungscommunity
+                  nachvollziehbar. Die Arbeit mit Frequenzdaten, zu denen keine Kontextinformationen
+                  zur VerfÃ¼gung stehen, birgt auch die Gefahr, zu Interpretationen zu verleiten, die
+                  nicht durch die Daten gedeckt sind. Insofern erscheint es fÃ¼r viele
+                  Forschungsszenarien in den digitalen Geisteswissenschaften sinnvoll, eine
+                  Kombination beider Verfahren anzustreben.</p>
+               <p>Alle hier diskutierten Verfahren bleiben selbstverstÃ¤ndlich BehelfslÃ¶sungen. Aus
+                  Sicht der Forschung wÃ¤re die generelle MÃ¶glichkeit, Forschungsdaten einschlieÃŸlich
+                  der zugrundeliegenden Texte fÃ¼r wissenschaftliche Zwecke uneingeschrÃ¤nkt zu
+                  teilen, das bei weitem produktivste Vorgehen. Die Interessen der
+                  Rechteinhaber*innen mÃ¼ssen dabei natÃ¼rlich berÃ¼cksichtigt werden. Gegebenenfalls
+                  mÃ¼ssten langfristig etwa die Richtlinien der Forschungsfinanzierung aus
+                  Ã¶ffentlichen Quellen angepasst werden, um bei der Verwendung von urheberrechtlich
+                  geschÃ¼tzten Werken in berechtigten FÃ¤llen eine vorgelagerte Kompensation fÃ¼r eine
+                  langfristige Nachnutzung zu ermÃ¶glichen. In vielen FÃ¤llen lieÃŸe sich ein
+                  Interessenausgleich von Forschung und Rechteinhaber*innen erreichen. Langfristig
+                  ist zu hoffen, dass die Politik den rechtlichen Rahmen mit dieser Zielsetzung
+                  weiterentwickelt. Unter den aktuell gegebenen UmstÃ¤nden erlauben zum einen die
+                  VerÃ¶ffentlichung von abgeleiteten Textformaten und zum anderen der gezielte
+                  Zugriff auf genau die AuszÃ¼ge des Textes, die fÃ¼r eine gegebene Fragestellung
+                  relevant sind, eine zwar eingeschrÃ¤nkte, in vielen FÃ¤llen aber hinreichende
+                  Reproduktion und Nachnutzung urheberrechtlich geschÃ¼tzter Forschungsdaten.</p>
+            </div>
+            <div type="bibliography">
+               <head>Bibliografische Angaben</head>
+               <listBibl>
+                 <bibl xml:id="allrath_signale_1998">Gaby Allrath: Â»But why will you say that I am mad?Â« Textuelle Signale fÃ¼r
+                     die Ermittlung von unreliable narration. In: Unreliable Narration. Studien zur
+                     Theorie und Praxis unglaubwÃ¼rdigen ErzÃ¤hlens in der englischsprachigen
+                     ErzÃ¤hlliteratur. Hg. von Ansgar NÃ¼nning / Carola Surkamp / Bruno Zerweck. Trier
+                     1998, S. 59â€“80. <ptr type="gbv" cRef="24851167X"/></bibl>
+                 <bibl xml:id="andresen_sprachbeschreibung_2022">Melanie Andresen: Datengeleitete Sprachbeschreibung mit syntaktischen
+                     Annotationen. Eine Korpusanalyse am Beispiel der germanistischen
+                     Wissenschaftssprachen. TÃ¼bingen 2022. (= Korpuslinguistik und interdisziplinÃ¤re
+                     Perspektiven auf Sprache (CLIP), 10). <ptr type="gbv" cRef="1786523841"/></bibl>
+                 <bibl xml:id="dreier_urhg_2018">Thomas Dreier / Gernot Schulze: UrhG â€“ Urheberrechtsgesetz,
+                     Verwertungsgesellschaftengesetz, Kunsturhebergesetz. Kommentar. 6. Auflage.
+                     MÃ¼nchen 2018. <ptr type="gbv" cRef="896763692"/></bibl>
+                 <bibl xml:id="dreier_urhg_2022">Thomas Dreier / Gernot Schulze: UrhG â€“ Urheberrechtsgesetz,
+                     Urheberrechts-Diensteanbieter-Gesetz, Verwertungsgesellschaftengesetz,
+                     Nebenurheberrecht, Kunsturheberrecht. Kommentar. 7. Auflage. MÃ¼nchen 2022.
+                    <ptr type="gbv" cRef="1769737332"/></bibl>
+                 <bibl xml:id="folde_interpretation_2015">Christian Folde: Grounding Interpretation. In: British Journal of Aesthetics
+                    55 (2015), H. 3, S. 361â€“374. <ptr type="gbv" cRef="129077933"/></bibl>
+                 <bibl xml:id="dfg_leitlinien_2019">Deutsche Forschungsgemeinschaft: Leitlinien zur Sicherung der guten
+                     wissenschaftlichen Praxis, Kodex, 2019. DOI: <ref
+                        target="https://doi.org/10.5281/zenodo.6472827">10.5281/zenodo.6472827</ref>
+                  </bibl>
+                 <bibl xml:id="gaertner_corpus_2020">Markus GÃ¤rtner: The Corpus Query Middleware of Tomorrow âˆ’ A Proposal for a
+                     Hybrid Corpus Query Architecture. In: Proceedings of the 8th Workshop on
+                     Challenges in the Management of Large Corpora. Hg. von Piotr BaÅ„ski / Adrien
+                     Barbaresi / Simon Clematide / Marc Kupietz / Harald LÃ¼ngen / Ines Pisetta.
+                     (CMLC 8, Marseille, 11.â€“16.05.2020) Stroudsburg, PA 2020, S. 31â€“39. [<ref
+                        target="https://www.aclweb.org/anthology/2020.cmlc-1.5">online</ref>] </bibl>
+                 <bibl xml:id="gaertner_corpus_2021">Markus GÃ¤rtner / Felicitas Kleinkopf / Melanie Andresen / Sybille Hermann:
+                     Corpus Reusability and Copyright â€“ Challenges and Opportunities. In:
+                     Proceedings of the Workshop on Challenges in the Management of Large Corpor.
+                     Hg. von Harald LÃ¼ngen / Marc Kupietz / Piotr BaÅ„ski / Adrien Barbaresi / Simon
+                     Clematide / Ines Pisetta. (CMLC 9, Limerick, 12.07.2021) Mannheim 2021, S.
+                     10â€“19. DOI: <ref target="https://doi.org/10.14618/ids-pub-10467"
+                        >10.14618/ids-pub-10467</ref> <ptr type="gbv" cRef="1788941780"/></bibl>
+                 <bibl xml:id="gius_textanalysen_2019">Evelyn Gius: Computationelle Textanalysen als fÃ¼nfdimensionales Problem: Ein
+                     Modell zur Beschreibung von KomplexitÃ¤t. In: LitLab Pamphlet 8 (2019). [<ref
+                        target="https://www.digitalhumanitiescooperation.de/pamphlet-8-computationelle-textanalysen/"
+                        >online</ref>] </bibl>
+                 <bibl xml:id="gius_profit_2017">Evelyn Gius / Janina Jacke: The Hermeneutic Profit of Annotation: On
+                     Preventing and Fostering Disagreement in Literary Analysis. In: International
+                     Journal of Humanities and Arts Computing 11 (2017), H. 2, S. 233â€“254. DOI: <ref
+                        target="https://doi.org/10.3366/ijhac.2017.0194"
+                        >10.3366/ijhac.2017.0194</ref> <ptr type="gbv" cRef="569610923"/></bibl>
+                 <bibl xml:id="habermas_diskurs_1998">JÃ¼rgen Habermas: Der philosophische Diskurs der Moderne. ZwÃ¶lf Vorlesungen.
+                     Frankfurt / Main 1988. (= Suhrkamp-Taschenbuch Wissenschaft, 749).
+                    <ptr type="gbv" cRef="863033091"/></bibl>
+                 <bibl xml:id="jockers_methods_2012">Matthew Lee Jockers: Macroanalysis: Digital methods and literary history.
+                    Urbana, IL u. a. 2013. <ptr type="gbv" cRef="1603785094"/></bibl>
+                 <bibl xml:id="kindt_erzaehlen_2008">Tom Kindt: UnzuverlÃ¤ssiges ErzÃ¤hlen und literarische Moderne: eine
+                     Untersuchung der Romane von Ernst WeiÃŸ. TÃ¼bingen 2008. (= Studien zur deutschen
+                     Literatur, 184). <ptr type="gbv" cRef="568520025"/></bibl>
+                 <bibl xml:id="kleinkopf_text_2021">Felicitas Kleinkopf / Janina Jacke / Markus GÃ¤rtner: Text- und Data-Mining â€“
+                     Urheberrechtliche Grenzen der Nachnutzung wissenschaftlicher Korpora bei
+                     computergestÃ¼tzten Verfahren und digitalen Ressourcen. In: MMR. Zeitschrift fÃ¼r
+                     IT-Recht und Recht der Digitalisierung 24 (2021), H. 3, S. 196â€“200. DOI: <ref
+                        target="http://dx.doi.org/10.18419/opus-11445">10.18419/opus-11445</ref> <ptr type="gbv" cRef="1679027220"/></bibl>
+                 <bibl xml:id="kleinkopf_bildung_2021">Felicitas Kleinkopf / Thomas PflÃ¼ger: Digitale Bildung, Wissenschaft und
+                     Kultur â€“ Welcher urheberrechtliche Reformbedarf verbleibt nach Umsetzung der
+                     DSM-RL durch das Gesetz zum Urheberrecht im digitalen Binnenmarkt? In:
+                     Zeitschrift fÃ¼r Urheber- und Medienrecht 56 (2021), H. 8 / 9, S. 643â€“655.
+                    <ptr type="gbv" cRef="130952079"/></bibl>
+                 <bibl xml:id="kresta_realisierungsformen_1995">Ronald Kresta: Realisierungsformen der InterpersonalitÃ¤t in vier
+                     linguistischen Fachtextsorten des Englischen und des Deutschen (= Theorie und
+                     Vermittlung der Sprache, 24). Frankfurt / Main u. a. 1995. <ptr type="gbv" cRef="185951988"/></bibl>
+                 <bibl xml:id="martinez_einfuehrung_2009">MatÃas MartÃnez / Michael Scheffel: EinfÃ¼hrung in die ErzÃ¤hltheorie. 8.
+                    Aufage. (= C.-H.-Beck-Studium). MÃ¼nchen 2009. <ptr type="gbv" cRef="612016773"/></bibl>
+                 <bibl xml:id="nuenning_narration_1998">Ansgar NÃ¼nning: Â»Unreliable NarrationÂ« zur EinfÃ¼hrung. GrundzÃ¼ge einer
+                     kognitiv-narratologischen Theorie und Analyse unglaubwÃ¼rdigen ErzÃ¤hlens. In:
+                     Unreliable Narration. Studien zur Theorie und Praxis unglaubwÃ¼rdigen ErzÃ¤hlens.
+                     Hg. von Ansgar NÃ¼nning / Bruno Zerweck / Carola Surkamp. Trier 1998, S. 3â€“39.
+                    <ptr type="gbv" cRef="24851167X"/></bibl>
+                 <bibl xml:id="nuenning_unreliable_1999">Ansgar NÃ¼nning: Unreliable, Compared to What? Towards a Cognitive Theory of
+                     Â»Unreliable NarrationÂ«. Prolegomena and Hypotheses. In: GrenzÃ¼berschreitungen.
+                     Narratologie im Kontext / Transcending Boundaries. Narratology in Context. Hg.
+                     von Walter GrÃ¼nzweig / Andreas Solbach. TÃ¼bingen 1999, S. 53â€“73. <ptr type="gbv" cRef="25045680X"/></bibl>
+                 <bibl xml:id="pichler_operationalisierung_2021">Axel Pichler / Nils Reiter: Zur Operationalisierung
+                     literaturwissenschaftlicher Begriffe in der algorithmischen Textanalyse. Eine
+                     AnnÃ¤herung Ã¼ber Norbert Altenhofers hermeneutische Modellinterpretation von
+                     Kleists Das Erdbeben in Chili. In: Journal of Literary Theory 15 (2021), H.
+                     1â€“2, S. 1â€“29. [<ref
+                        target="http://www.jltonline.de/index.php/articles/article/view/1124/2571"
+                        >online</ref>] <ptr type="gbv" cRef="519206053"/></bibl>
+                 <bibl xml:id="raue_freistellung_2021">Benjamin Raue: Die Freistellung von Datenanalysen durch die neuen Text und
+                     Data Mining-Schranken. In: Zeitschrift fÃ¼r Urheber- und Medienrecht 56 (2021),
+                     H. 10, S. 793-802. <ptr type="gbv" cRef="130952079"/></bibl>
+                 <bibl xml:id="reiter_anleitung_2020">Nils Reiter: Anleitung zur Erstellung von Annotationsrichtlinien. In:
+                     Reflektierte algorithmische Textanalyse. Hg. von Nils Reiter / Axel Pichler /
+                     Jonas Kuhn. Berlin u. a. 2020, S. 193â€“202. DOI: <ref
+                        target="https://doi.org/10.1515/9783110693973-009"
+                        >10.1515/9783110693973-009</ref> <ptr type="gbv" cRef="1691580465"/></bibl>
+                  <bibl xml:id="DSM-Richtlinie_2019">Richtlinie (EU) 2019/790 des EuropÃ¤ischen Parlaments und des Rates vom 17. April 2019 Ã¼ber das Urheberrecht und die verwandten Schutzrechte im digitalen Binnenmarkt und zur Ã„nderung der Richtlinien 96/9/EG und 2001/29/EG. [<ref target="http://data.europa.eu/eli/dir/2019/790/2019-05-17">online</ref>]</bibl>
+                 <bibl xml:id="schiller_guidelines_1999">Anne Schiller / Simone Teufel / Christine Thielen / Christine StÃ¶ckert:
+                     Guidelines fÃ¼r das Tagging deutscher Textcorpora mit STTS (kleines und groÃŸes
+                     Tagset). 1999. PDF: [<ref
+                        target="http://www.sfs.uni-tuebingen.de/resources/stts-1999.pdf">online</ref>]
+                  </bibl>
+                 <bibl xml:id="schoech_textformate_2020">Christof SchÃ¶ch / FrÃ©dÃ©ric DÃ¶hl / Achim Rettinger / Evelyn Gius / Peer
+                     Trilcke / Peter Leinen / Fotis Jannidis / Maria Hinzmann / JÃ¶rg RÃ¶pke:
+                     Abgeleitete Textformate: Text und Data Mining mit urheberrechtlich geschÃ¼tzten
+                     TextbestÃ¤nden. In: Zeitschrift fÃ¼r digitale Geisteswissenschaften 5 (2020).
+                        DOI: <ref target="https://doi.org/10.17175/2020_006">10.17175/2020_006</ref></bibl>
+                 <bibl xml:id="schruhl_objektumgangsnormen">Friederike Schruhl: Objektumgangsnormen in der Literaturwissenschaft. In: Wie DigitalitÃ¤t die Geisteswissenschaften verÃ¤ndert: Neue
+                     ForschungsgegenstÃ¤nde und Methoden. Hg. von Martin Huber / Sybille KrÃ¤mer. WolfenbÃ¼ttel 2018. (=
+                     Sonderband der Zeitschrift fÃ¼r digitale Geisteswissenschaften, 3) DOI: <ref
+                        target="https://doi.org/10.17175/sb003_012">10.17175/sb003_012</ref></bibl>
+                 <bibl xml:id="schmidt_tool_2021">Thomas Schmidt / Johanna Dangel / Christian Wolff: SentText: A Tool for
+                     Lexicon-based Sentiment Analysis in Digital Humanities. In: Information between
+                     Data and Knowledge. Information Science and its Neighbors from Data Science to
+                     Digital Humanities. Proceedings of the 16th International Symposium of
+                     Information Science. Hg. von Christian Wolff / Thomas Schmidt. (ISI 16,
+                     Regensburg, 08â€“10.03.202) GlÃ¼ckstadt 2021, S. 156â€“172. DOI: <ref
+                        target="http://doi.org/10.5283/epub.44943">10.5283/epub.44943</ref>
+                    <ptr type="gbv" cRef="1747271209"/></bibl>
+                 <bibl xml:id="steinhoff_textkompetenz_2007">Torsten Steinhoff: Wissenschaftliche Textkompetenz: Sprachgebrauch und
+                     Schreibentwicklung in wissenschaftlichen Texten von Studenten und Experten.
+                     TÃ¼bingen 2007. (= Reihe Germanistische Linguistik, 280) <ptr type="gbv" cRef="555521087"/></bibl>
+                  <bibl xml:id="wilkinson_fair_2016">Mark D. Wilkinson / Michel Dumontier / IJsbrand Jan Aalbersberg / Gabrielle Appleton / Myles Axton / Arie Baak / Niklas Blomberg / Jan-Willem Boiten / Luiz Bonino da Silva Santos / Philip E. Bourne / Jildau Bouwman / Anthony J. Brookes / Tim Clark / MercÃ¨ Crosas / Ingrid Dillo / Olivier Dumon / Scott Edmunds / Chris T. Evelo / Richard Finkers / Alejandra Gonzalez-Beltran / Alasdair J.G. Gray / Paul Groth / Carole Goble / Jeffrey S. Grethe / Jaap Heringa / Peter A.C â€™t Hoen / Rob Hooft / Tobias Kuhn / Ruben Kok / Joost Kok / Scott J. Lusher / Maryann E. Martone / Albert Mons / Abel L. Packer / Bengt Persson / Philippe Rocca-Serra / Marco Roos / Rene van Schaik / Susanna-Assunta Sansone / Erik Schultes / Thierry Sengstag / Ted Slater / George Strawn / Morris A. Swertz / Mark Thompson / Johan van der Lei / Erik van Mulligen / Jan Velterop / Andra Waagmeester / Peter Wittenburg / Katherine Wolstencroft / Jun Zhao / Barend Mons: The FAIR
+                     Guiding Principles for scientific data management and stewardship. In:
+                     Scientific Data 3 (2016), Artikelnummer 160018. DOI: <ref target="https://doi.org/10.1038/sdata.2016.18">10.1038/sdata.2016.18</ref> <ptr type="gbv" cRef="788479601"/></bibl>
+                 <bibl xml:id="yacobi_reliability_1981">Tamar Yacobi: Fictional reliability as a communicative problem. In: Poetics
+                    Today 2 (1981), H. 2, S. 113â€“126. <ptr type="gbv" cRef="168640813"/></bibl>
+               </listBibl>
+            </div>
+            <div type="abbildungsnachweis">
+               <head>Abbildungs- und Tabellenverzeichnis: </head>
+               <desc type="graphic" xml:id="abb1">In XSample entwickeltes Auszugskonzept. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                  target="#nachnutzung_2021_001"/></desc>
+                  <desc type="graphic" xml:id="abb2">Dataverse-OberflÃ¤che fÃ¼r ein XSample-Manifest. Rechts unten kann die
+                     Weiterleitung auf den XSample-Server angestoÃŸen werden. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                        target="#nachnutzung_2021_002"/></desc>
+                     <desc type="graphic" xml:id="abb3">Startseite des XSample-Servers nach Weiterleitung aus dem zugehÃ¶rigen
+                        Dataverse und Validierung der Manifest-Datei. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                           target="#nachnutzung_2021_003"/></desc>
+                        <desc type="graphic" xml:id="abb4">Grafische OberflÃ¤che zur flexiblen Auswahl der Auszugsgrenzen. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                              target="#nachnutzung_2021_004"/></desc>
+               <desc type="graphic" xml:id="abb5">Exemplarische OberflÃ¤che
+                  zur Auszugsgenerierung mittels Suchanfrage basierend auf enthaltenen
+                  Annotationen. Die Verteilung der Suchergebnisse Ã¼ber das Korpus wird
+                  direkt visualisiert und Nutzer*innen anschlieÃŸend die MÃ¶glichkeit
+                  gegeben, die fÃ¼r sie relevanten Segmente exakt auszuwÃ¤hlen. [<ref type="bibliography" target="#gaertner_corpus_2021">GÃ¤rtner 2021</ref>]<ref type="graphic"
+                     target="#nachnutzung_2021_005"/></desc>
+               <desc type="table" xml:id="tab1"><ref target="#tab01" type="intern">Tab. 1</ref>: Die
+                  distinktivsten Wortarten fÃ¼r die Unterscheidung von Philosophie und
+                  Literaturwissenschaft im Sinne der SVM. Das verwendete Tagset ist das STTS
+                  (<ref type="bibliography" target="#schiller_guidelines_1999">Schiller et al. 1999</ref>). [Andresen 2022]<ref type="graphic"
+                     target="#nachnutzung_2021_t1"/></desc>
+               <desc type="table" xml:id="tab2"><ref target="#tab02" type="intern">Tab. 2</ref>:
+                  Manuelle Kategorisierung der wir -Verwendung in einer Stichprobe von 100 Instanzen
+                  pro Disziplin. [Pichler 2022]<ref type="graphic"
+                     target="#nachnutzung_2021_t2"/></desc>
+            </div>
+         </div>
+      </body>
+   </text>
+</TEI>