diff --git a/SB05_005_schmunk_et_al/baedeker_2021_001.jpg b/SB05_005_schmunk_et_al/baedeker_2021_001.jpg new file mode 100644 index 0000000000000000000000000000000000000000..43e5b432dacf8b7cb57003edec79e18e6ac34e90 Binary files /dev/null and b/SB05_005_schmunk_et_al/baedeker_2021_001.jpg differ diff --git a/SB05_005_schmunk_et_al/baedeker_2021_002.jpg b/SB05_005_schmunk_et_al/baedeker_2021_002.jpg new file mode 100644 index 0000000000000000000000000000000000000000..ab305a848d3c8a24f3dae01b86d6a7636f80d2f6 Binary files /dev/null and b/SB05_005_schmunk_et_al/baedeker_2021_002.jpg differ diff --git a/SB05_005_schmunk_et_al/baedeker_2021_003.jpg b/SB05_005_schmunk_et_al/baedeker_2021_003.jpg new file mode 100644 index 0000000000000000000000000000000000000000..837bdf677bf08a46512729aea7c632bd1573c746 Binary files /dev/null and b/SB05_005_schmunk_et_al/baedeker_2021_003.jpg differ diff --git a/SB05_005_schmunk_et_al/baedeker_2021_004.jpg b/SB05_005_schmunk_et_al/baedeker_2021_004.jpg new file mode 100644 index 0000000000000000000000000000000000000000..a9269ee8182ea46ad9ea130b5b295d6cd62c1dfd Binary files /dev/null and b/SB05_005_schmunk_et_al/baedeker_2021_004.jpg differ diff --git a/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.pdf b/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.pdf new file mode 100644 index 0000000000000000000000000000000000000000..1f621c708632b659885158ad74d2cd17c91b53fd Binary files /dev/null and b/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.pdf differ diff --git a/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.xml b/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.xml new file mode 100644 index 0000000000000000000000000000000000000000..6c690b6fa1f115e0ef17590d0e323641cf0a4f54 --- /dev/null +++ b/SB05_005_schmunk_et_al/baedeker_schmunk_et_al_v1_0.xml @@ -0,0 +1,1000 @@ +<?xml version="1.0" encoding="utf-8"?> +<?xml-model href="https://www.zfdg.de/sites/default/files/schema/tei_zfdg.rnc" type="application/relax-ng-compact-syntax" + ?> + +<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:html="http://www.w3.org/1999/html" + xmlns:tei="http://www.tei-c.org/ns/1.0" xmlns:xhtml="http://www.w3.org/1999/xhtml" + xmlns:xlink="http://www.w3.org/1999/xlink"> + <teiHeader> + <fileDesc> + <titleStmt> + <title> + <biblStruct> + <analytic> + <title level="a">Bomber’s Baedeker – vom Text zum Bild zur Datenquelle</title> + <respStmt> + <resp> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/data-curation/">data curation</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/formal-analysis/">formal analysis</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/software/">software</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-original-draft/">writing original draft</idno> + <persName> + <name role="marc_aut"> + <forename>Felix</forename> + <surname>Bach</surname> + </name> + <email>fbach9310@gmail.com</email> + <idno type="gnd">124168099X</idno> + <idno type="orcid">0000-0001-9517-270X</idno> + </persName> + </resp> + <orgName>Leibniz-Institut für Europäische Geschichte (IEG) | Hochschule Darmstadt</orgName> + </respStmt> + <respStmt> + <resp> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/conceptualization/">Conceptualization</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/investigation/">investigation</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/project-administration/">project administration</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/supervision/">supervision</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-original-draft/">writing original draft</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-review-editing/">writing review editing</idno> + <persName> + <name role="marc_aut"> + <forename>Stefan</forename> + <surname>Schmunk</surname> + </name> + <email>stefan.schmunk@h-da.de</email> + <idno type="gnd">1028340028</idno> + <idno type="orcid">0000-0001-9706-9757</idno> + </persName> + </resp> + <orgName>Hochschule Darmstadt</orgName> + </respStmt> + <respStmt> + <resp> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/data-curation/">data curation</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/formal-analysis/">formal analysis</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/software/">software</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-original-draft/">writing-original-draft</idno> + <persName> + <name role="marc_aut"> + <forename>Cristian</forename> + <surname>Secco</surname> + </name> + <email>stcrsecc@stud.h-da.de</email> + <idno type="gnd">1241301123</idno> + <idno type="orcid">0000-0002-5023-015X</idno> + </persName> + </resp> + <orgName>Leibniz-Institut für Europäische Geschichte (IEG) | Hochschule Darmstadt</orgName> + </respStmt> + <respStmt> + <resp> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/conceptualization/">conceptualization</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/funding-acquisition/">funding acquisition</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/investigation/">investigation</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/project-administration/">project-administration</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/supervision/">supervision</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/validation/">validation</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-original-draft/">writing original draft</idno> + <idno type="credit" corresp="https://credit.niso.org/contributor-roles/writing-review-editing/">writing review editing</idno> + <persName> + <name role="marc_aut"> + <forename>Thorsten</forename> + <surname>Wübbena</surname> + </name> + <email>wuebbena@ieg-mainz.de</email> + <idno type="gnd">123312396</idno> + <idno type="orcid">0000-0001-8172-6097</idno> + </persName> + </resp> + <orgName>Leibniz-Institut für Europäische Geschichte (IEG)</orgName> + </respStmt> + + <idno type="doi">10.17175/sb005_004</idno> + <idno type="ppn">1770855890</idno> + <idno type="zfdg">sb005_004</idno> + <idno type="url">https://www.zfdg.de/node/335</idno> + <date when="2021-09-22">22.09.2021</date> + </analytic> + <monogr> + <title level="j">Zeitschrift für digitale Geisteswissenschaften</title> + <title level="m">Sonderband: Fabrikation von Erkenntnis – Experimente in den + Digital Humanities.</title> + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Manuel</forename> + <surname>Burghardt</surname> + </name> + <email>burghardt@informatik.uni-leipzig.de</email> + <idno type="gnd">1237665523</idno> + <idno type="orcid">0000-0003-1354-9089</idno> + </resp> + <orgName>Universität Leipzig</orgName> + </respStmt> + + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Lisa</forename> + <surname>Dieckmann</surname> + </name> + <email>lisa.dieckmann@uni-koeln.de</email> + <idno type="gnd">1077268289</idno> + <idno type="orcid">0000-0002-1708-7371</idno> + </resp> + <orgName>Universität zu Köln</orgName> + </respStmt> + <respStmt> + <resp><name role="marc_edt"> + <surname>Timo</surname> + <forename>Steyer</forename> + </name> + <email>t.steyer@tu-braunschweig.de</email> + <idno type="gnd">1053806175</idno> + <idno type="orcid">0000-0003-0218-2269</idno> + </resp> + <orgName>Technische Universität Braunschweig</orgName> + </respStmt> + + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Peer</forename> + <surname>Trilcke</surname> + </name> + <email>trilcke@uni-potsdam.de</email> + <idno type="gnd">139145117</idno> + <idno type="orcid">0000-0002-1421-4320</idno> + </resp> + <orgName>Universität Potsdam</orgName> + </respStmt> + + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Niels-Oliver</forename> + <surname>Walkowski</surname> + </name> + <email>niels-oliver.walkowski@uni.lu</email> + <idno type="gnd">1023378671</idno> + <idno type="orcid">0000-0003-3043-3010</idno> + </resp> + <orgName>Universität Luxemburg</orgName> + </respStmt> + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Joëlle</forename> + <surname>Weis</surname> + </name> + <email>weis@hab.de</email> + <idno type="gnd">1233399721</idno> + <idno type="orcid">0000-0002-0080-4362</idno> + </resp> + <orgName>Forschungsverbund Marbach Weimar Wolfenbüttel</orgName> + </respStmt> + <respStmt> + <resp> + <name role="marc_edt"> + <forename>Ulrike</forename> + <surname>Wuttke</surname> + </name> + <email>wuttke@fhpotsdam.de</email> + <idno type="gnd">1107808405</idno> + <idno type="orcid">0000-0002-8217-4025</idno> + </resp> + <orgName>Fachhochschule Potsdam</orgName> + </respStmt> + + <respStmt> + <resp>Publiziert von</resp> + <orgName role="marc_pbl">Herzog August Bibliothek</orgName> + </respStmt> + <respStmt> + <resp>Transformation der Word Vorlage nach TEI</resp> + <name role="marc_trc"> + <surname>Baumgarten</surname> + <forename>Marcus</forename> + <idno type="gnd">1192832655</idno> + </name> + </respStmt> + <availability status="free"> + <p>Available at <ref target="http://www.zfdg.de">https://www.zfdg.de</ref> + </p> + </availability> + <biblScope unit="sonderband">5</biblScope> + <biblScope unit="artikel">4</biblScope> + </monogr> + </biblStruct> + </title> + </titleStmt> + <editionStmt> + <edition>Elektronische Ausgabe nach TEI P5</edition> + </editionStmt> + <publicationStmt> + <distributor> + <name> + <orgName>Herzog August Bibliothek</orgName> + </name> + </distributor> + <idno type="doi">10.17175/sb005</idno> + <idno type="ppn">1764792149</idno> + <idno type="url">https://www.zfdg.de/sonderband/5</idno> + <date when="2021">2021</date> + <authority> + <name>Herzog August Bibliothek</name> + <address> + <addrLine>Lessingplatz 1</addrLine> + <addrLine>38304 Wolfenbüttel</addrLine> + </address> + </authority> + <authority> + <name>Forschungsverbund MWW</name> + <address> + <addrLine>Burgplatz 4</addrLine> + <addrLine>99423 Weimar </addrLine> + </address> + </authority> + <availability status="free"> + <p> Sofern nicht anders angegeben </p> + <licence target="http://creativecommons.org/licenses/by/4.0/">CC BY SA 4.0</licence> + </availability> + <availability status="free"> + <p> Available at <ref target="workID">https://www.zfdg.de"> (c) Forschungsverbund + MWW</ref> + </p> + </availability> + </publicationStmt> + <sourceDesc> + <p>Einreichung zum Call for Publications im Rahmen der vDHd21.</p> + </sourceDesc> + </fileDesc> + <encodingDesc> + <editorialDecl> + <p>Transformation der WORD-Vorlage nach XML/TEI-P5 durch die Oxgarage und eigenen + XSLT</p> + <p>Lektorat des Textes durch die Herausgeber*innen und die Redaktion der ZfdG.</p> + <p>Medienrechte liegen bei den Autor*innen</p> + <p>All links checked<date when="2021-09-16">16.09.2021</date> + </p> + </editorialDecl> + </encodingDesc> + <profileDesc> + <creation>Einreichung für den Sonderband 5 der Zeitschrift für digitale + Geisteswissenschaften</creation> + <langUsage> + <language ident="de">Text in Deutsch</language> + <language ident="de">Abstract in Deutsch</language> + <language ident="en">Abstract in Englisch</language> + </langUsage> + <textClass> + <keywords scheme="gnd"> + <term>Bomber’s Baedeker<ref target="4165683-0"/></term> + <term>Datentransformation ‹OCR› ‹XML› ‹Python›<ref target="4658512-6"/></term> + <term>Digitalisierung<ref target="4123065-6"/></term> + <term>Informatik<ref target="4026894-9"/></term> + <term>Optische Zeichenerkennung<ref target="4310936-6"/></term> + </keywords> + </textClass> + </profileDesc> + <revisionDesc> + <change/> + </revisionDesc> + </teiHeader> + <text> + <body> + <div> + <div type="abstract"> + <argument xml:lang="de"> + <p>Das zweibändige Druckwerk <bibl> + <title type="desc">The Bomber’s Baedeker. A Guide to the Economic Importance + of German Towns and Cities</title> + </bibl> wurde während des Zweiten Weltkrieges vom britischen Foreign Office und + dem Ministry of Economic Warfare erstellt. Darin sind Städte des Deutschen + Reichs mit mehr als tausend Einwohner*innen und Informationen zu deren + kriegswichtigen Infrastrukturen, Industrie- und Produktionsanlagen aufgeführt. + Weltweit existieren nur noch vier nachgewiesene Exemplare und keines davon war + bislang für die wissenschaftliche Nutzung digital zugänglich. Der <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> wurde 2019 in der Bibliothek des Leibniz-Instituts für Europäische + Geschichte (IEG) (wieder-)entdeckt, in Kooperation mit der + Universitätsbibliothek Mainz digitalisiert und im Rahmen einer + institutionsübergreifenden Kooperation vom Bereich Digitale historische + Forschung | DH Lab des IEG und von der Hochschule Darmstadt, u. a. in + Lehrveranstaltungen mit Studierenden, erschlossen und aufbereitet, so dass der <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> nun als offene, maschinenlesbare Datenquelle unter Einhaltung der + FAIR-Prinzipien genutzt, analysiert und weiterbearbeitet werden kann. </p> + </argument> + </div> + <div type="abstract"> + <argument xml:lang="en"> + <p>The two-volume printed work <bibl> + <title type="desc">The Bomber's Baedeker. A Guide to the Economic Importance + of German Towns and Cities</title> + </bibl> was produced by the British Foreign Office and the Ministry of Economic + Warfare during the Second World War. It lists towns and cities of the German + Reich with more than a thousand inhabitants and information on their + war-related infrastructure, industrial and production facilities. Only four + verified copies still exist worldwide and none of them has been digitally + accessible for scholarly use until now. In 2019, <bibl> + <title type="desc">The Bomber's Baedeker</title> + </bibl> was (re-)discovered in the library of the Leibniz Institute of European + History (IEG), digitised in cooperation with the University Library of Mainz + and made accessible and processed in a cross-institutional cooperation between + the Digital Historical Research Unit | DH Lab of the IEG and the Darmstadt + University of Applied Sciences, including in courses with students, so that <bibl> + <title type="desc">The Bomber's Baedeker</title> + </bibl> can now be used, analysed and further processed as an open, + machine-readable data source in compliance with the FAIR principles.</p> + </argument> + </div> + + <div type="chapter"> + <head>1. Einleitung</head> + <p> + <quote>Handbuch für den Feuersturm</quote> war der Titel der Frankfurt Allgemeinen + Zeitung im Juni 2019<note type="footnote">Vgl. <ref target="#burger_2019" + type="bibliography">Burger 2019</ref>. </note> zum zweibändigen Werk <bibl> + <title type="desc">The Bomber’s Baedeker. A Guide to the Economic Importance of + German Towns and Cities</title> + </bibl>.<note type="footnote"><ref target="#bombers_baedeker_1944" type="bibliography">The + Bomber's Baedeker 1944</ref>.</note> Anlass für die Berichterstattung war + die vollständige Digitalisierung der zweiten Auflage der seltenen britischen + Quelle aus dem Jahr 1944 (809 Seiten, Quartformat, 6 ganzseitige Karten). Diese + Ausgabe ist weltweit nur noch in vier Exemplaren nachweisbar, so dass es durchaus + als Glückstreffer bezeichnet werden kann, dass dieses Exemplar in der + Forschungsbibliothek des Leibniz-Instituts für Europäische Geschichte (IEG) + entdeckt und in einem gemeinsamen Projekt für eine digitale Nutzung vorbereitet + wurde. Der Titel <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> verwundert zugleich ein wenig, denn inhaltlich werden keine touristischen + und sehenswerten Reiseziele identifiziert und beschrieben, wie sie die + namensgebenden roten Reiseführer Karl Baedekers seit dem 19. Jahrhundert<note + type="footnote">Zu einer medienkulturhistorischen Analyse von Reiseführern + vgl. <ref target="#mueller_2012" type="bibliography">Müller 2012</ref>.</note> + liefern, sondern es werden ausschließlich militärische, infrastrukturelle und + ökonomisch-kriegswichtige Ziele der Royal Air Force für den Bombenkrieg gegen das + Deutsche Reich im Zweiten Weltkrieg identifiziert. Das zweibändige Druckwerk + enthält Informationen zu Orten mit mehr als tausend Einwohner*innen, sofern dort + aus Sicht des britischen Foreign Office und des Ministry of Economic Warfare + kriegswichtige Industrie- und Produktionsanlagen vorhanden waren. Die Daten zur + geografischen Lage, Einwohnerzahl, Entfernung zu London sowie umfassende + Beschreibungen von mehr als 500 Städten in Deutschland wurden im Bestreben + zusammengestellt, eine möglichst effektive und effiziente Auswahl von potenziellen + Zielen zu ermöglichen.<note type="footnote">Vgl. <ref target="#hohn_1994" + type="bibliography">Hohn 1994</ref>, S. 213–230.</note> + </p> + <p>Für das Lesen der Quelle ist die digitale Bereitstellung als gemeinfreies + Digitalisat hinreichend, für eine Auswertung der enthaltenen Daten kann dies aus + Sicht der Digitalen Geisteswissenschaften aber nur als erster Schritt betrachtet + werden. Nach der Transformation zu einer digitalen Bilddatei ist die + Weiterverarbeitung zu maschinenlesbaren Daten für zahlreiche Methoden der Digital + Humanities ein wichtiger Schritt in der Aufbereitung. Im Fall des <bibl> + <title type="desc">Bomber's Baedeker</title> + </bibl> wurde dies durch eine Verbesserung der Zeichenerkennung und Überführung + der Inhalte in ein standardisiertes Datenformat durchgeführt, so dass dadurch + digitale Analysen ermöglicht werden. Seit 2019 findet daher im Rahmen einiger + kleinerer Projekte eine intensive wissenschaftliche Auseinandersetzung und + zugleich eine datenspezifische Aufbereitung statt, so dass die Qualität der + maschinenlesbaren Daten stetig verbessert wurde. </p> + </div> + <div type="chapter"> + <head>2. Hintergrund</head> + <p>Woher genau die Bezeichnung <bibl> + <title type="desc">Bomber's Baedeker</title> + </bibl> stammt und wie deren etymologische Entwicklung zu deuten ist, lässt sich + nicht mit hundertprozentiger Sicherheit belegen. Vermutlich ist diese Namensgebung + eine Reaktion auf die im Frühjahr 1942 durch die Deutsche Luftwaffe ausgeführten + Angriffe auf Exeter, Bath, Norwich, York und Canterbury.<note type="footnote">Vgl. <ref target="#rothnie_1992" type="bibliography">Rothnie 1991</ref>, + S. 142f.</note> Als Begründung der Auswahl der Ziele wurden von deutscher Seite + in einer Pressekonferenz des Auswärtigen Amtes im April 1942 die Auszeichnung + dieser Städte im Baedeker-Reiseführer für England angegeben.<note type="footnote">Mit den Worten <quote>Now the Luftwaffe will go for every building which is + marked with three stars in Baedeker</quote> wurde Legationsrat Gustav Braun + von Stumm in der britischen Presse zitiert. Vgl. <ref target="#knuth_2006" + type="bibliography">Knuth 2006</ref>, S. 165.</note> Verständlicherweise + sorgte dies in der britischen Bevölkerung für einen ungeheuren öffentlichen Furor, + da durch diese Aussage deutlich wurde, dass eben nicht ausschließlich militärische + Ziele bzw. Industriestandorte, sondern vielmehr bewusst historisch bedeutsame + Städte von deutscher Seite als Ziele ausgewählt wurden.<note type="footnote">Eine + virtuelle Ausstellung des Imperial War Museums zu den ›Baedeker Raids‹ findet + sich bei <ref target="#baedeker_raids_2021" type="bibliography">Google Arts and + Culture</ref>.</note> + </p> + <p>Diese Vorgänge und insbesondere die enorme öffentliche Empörung dürften dazu + geführt haben, dass die Mitarbeiter*innen des Foreign Office und des Ministry of + Economic Warfare, welche die Analyse der militärisch und wirtschaftlich + bedeutsamen Ziele im Deutschen Reich bereits 1942 – eben zum Zeitpunkt der + sogenannten ›Baedeker Raids‹ – durchführten, ihrerseits wiederum den Namen <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> für die eigenen Aufstellungen wählten. Die erste Auflage des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> erschien dann auch ein Jahr später und deckt sich mit den alliierten + Absprachen zu einem gemeinsamen ›Bomber Command‹ zwischen Großbritannien und den + USA auf der Casablanca-Konferenz im Januar 1943, auf der u. a. festgelegt wurde: + Vordringliches Ziel des Bomber Command ist die fortschreitende Zerstörung des + deutschen militärischen, industriellen und wirtschaftlichen Systems, um die Moral + des deutschen Volkes bis zu einem Grad zu untergraben, wo seine Fähigkeit zum + bewaffneten Widerstand entscheidend geschwächt ist.<note type="footnote">TNA + London, AIR 41/5, Directive 21 January 1943, International Law of the Air, + 1939–1945, Confidential supplement to Air Power and War Rights, 1946, zitiert + nach: <ref target="#boehm_2015" type="bibliography">Böhm 2015</ref>, + S. 147.</note> + </p> + <p>Zeitgleich wurde im britischen Unterhaus das <bibl> + <title type="desc">Dehousing Paper</title> + </bibl> verabschiedet, in dem als strategisches Ziel der britischen Bomberverbände + die gezielte Zerstörung von Wohngebieten vorgesehen wurde – einer Doktrin mit + Namen ›Moral Bombing‹, an der bis zum Ende des Zweiten Weltkrieges festgehalten + wurde und die bereits im Frühjahr 1942 zum 1.000-Bomber-Angriff gegen Köln + führte.<note type="footnote">Vgl. <ref target="#longmatte_1983" + type="bibliography">Longmatte 1983</ref>.</note> Es ist allerdings + festzuhalten, dass die Auswahl der tatsächlichen Ziele dem Bomber Command und dem + Air Ministry oblag und deshalb nicht eindeutig nachvollziehbar ist, welche Rolle + der <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> insbesondere bei der Wahl der Angriffsziele tatsächlich besaß – vor allem, + weil in diesem ausschließlich infrastrukturelle und wirtschaftliche Ziele + angegeben waren. Die Datengrundlage für die Erhebung durch das Foreign Office und + das Ministry of Economic Warfare bildeten – neben Informationen aus der + Feindaufklärung, Adressbüchern, Luftaufnahmen, Berichten von Emigrant*innen etc. – + vor allem die Unterlagen der britischen Rückversicherer. Bei diesen waren seit + Mitte der 1930er-Jahre die Brandversicherungen der deutschen + Versicherungsunternehmen abgesichert. Da es sich um eine Pflichtversicherung für + alle Gebäude im Deutschen Reich handelte, stellte dies eine vollständige + Datenbasis dar, um eine umfassende Quartiersanalyse aller deutschen Städte zu + erstellen. Darüber hinaus konnten hierüber die Standorte aller Firmen + identifiziert werden und über deren Namen und Eigentümer*innen war zugleich zu + erfahren, was dort höchstwahrscheinlich produziert wurde. Auch konnte diesen + Unterlagen Informationen über die Bausubstanz der Gebäude entnommen werden. Auf + dieser Basis war es möglich, eine höchst detaillierte Topographie jeder einzelnen + deutschen Stadt zu erstellen und zugleich die Unterschiede in der + quartierbezogenen Bausubstanz zu erfassen.<note type="footnote">Vgl. <ref + target="#hohn_1994" type="bibliography">Hohn 1994</ref>, S. 213–230.</note> + De facto war genau dies der Schlüssel für die alliierten Luftangriffe gegen + Deutschland, bei denen gezielt Städte bzw. Stadtteile mit leicht entzündbaren und + brennbaren Baustoffen angegriffen wurden.<note type="footnote">Vgl. zur + Geschichte des Bombenkriegs gegen deutsche Städte: <ref target="#overy_2014" + type="bibliography">Overy 2014</ref>; <ref target="#mueller_2004" + type="bibliography">Müller 2004</ref>; <ref target="#boog_et_al_2001" + type="bibliography">Boog et al. (Hg.) 2001</ref>.</note> Folgt man dieser + Argumentation, so wird daraus deutlich, dass <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> eher für strategische Planungen genutzt wurde und weniger eine taktische + Bedeutung besaß.</p> + <p>Während in der ersten Auflage des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> von 1943 nur 392 Städte mit einer Größe über 15.000 Einwohner + berücksichtigt wurden, beinhaltet die zweite Auflage von 1944 insgesamt 518 Städte + und umfasst auch Kleinstädte ab einer Größe von 1.000 Einwohnern. Dieser Umstand + ist u. a. darauf zurückzuführen, dass ab Mitte 1943 eine Verlagerung von + kriegswichtigen Produktionsstätten aus den Städten erfolgte.<note type="footnote">Vgl. <ref target="#schmunk_2005" type="bibliography">Schmunk 2005</ref>, S. 59, + 65f.</note> Für die Datenerhebung und ‑aufbereitung im Rahmen des zugrunde + liegenden Projektes wurde die zweite Auflage von 1944 verwendet, die neben der + Nennung der jeweiligen Stadt mit entsprechenden Breiten- und Längenangaben und der + Flugdistanz (in Meilen) zu London einleitend auch eine kurze Beschreibung der + Stadt mit geographischen Markern (in der Nähe liegende Flüsse, Berge, Seen, Wälder + etc.) sowie eine Kategorisierung der Ziele gibt.<note type="footnote">Der + Unterschied zwischen der ersten und zweiten Auflage besteht vor allem darin, + dass in der zweiten Auflage weitere Städte aufgenommen und somit der + Datenbestand vergrößert wurde.</note> Folgende Kategorisierung wird im <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> für alle Städte angewandt:<note type="footnote">Vgl. <ref + target="#bombers_baedeker_1944" type="bibliography">The Bomber's Baedeker + 2019 (1944)</ref>, <ref + target="https://visualcollections.ub.uni-mainz.de/histbuch/content/pageview/454133" + >Preface</ref>.</note> + </p> + <list type="unordered"> + <item>Transportwesen</item> + <item>Infrastruktur (Wasser, Elektrizität etc.)</item> + <item>Festbrennstoffe (Bergbau, Brennstofflager etc.)</item> + <item>Flüssigbrennstoffe (Raffinerien, Brennstofflager etc.)</item> + <item>Eisen- und Stahlindustrie</item> + <item>Sonstige metallverarbeitende Betriebe</item> + <item>Flugzeuge und Motoren</item> + <item>Werften</item> + <item>Sonstige Industrie- und Rüstungsbetriebe</item> + <item>Chemie- und Munitionsbetriebe</item> + <item>Textil-, Seide-, Zellstoff- und Papierbetriebe</item> + <item>Gummi- und Reifenhersteller</item> + <item>Lederindustrie</item> + <item>Nahrungsmittelindustrie</item> + </list> + <p>Die aus Sicht der beiden Ministerien kriegswichtige Bedeutung dieser Kategorien + wurde zudem auf einer Skala von 1 bis 3 bewertet, wobei anzumerken ist, dass nicht + alle Kategorien bei allen Städten zu finden sind. </p> + </div> + <div type="chapter"> + <head>3. Datenerhebung – vom Bild zum XML </head> + <p>Die hier am <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> durchgeführte Transformation des Inhalts eines gedruckten Buchs in + maschinenlesbare Daten – auf Grundlage einer zuvor erstellten digitalen + 1:1-Abbildung (Repräsentant) – ist ein wichtiger Baustein im Prozess der + Datenaufbereitung und zumeist die Voraussetzung für die Anwendung zahlreicher + Methoden und Verfahren der Digital Humanities.</p> + <p>Wie oben beschrieben, besitzt die Bibliothek des IEG mit dem zweibändigen Werk + eines der wenigen noch verfügbaren Exemplare. Mit dieser Situation geht auch eine + entsprechende Verantwortung einher, zum einen in konservatorischer Hinsicht und + zum anderen im Hinblick auf die Verfügbarmachung des Inhalts für die Forschung. + Beiden Aspekten kann mithilfe der Digitalisierung begegnet werden. Deshalb wurde + im Rahmen eines gemeinsamen Vorhabens zwischen IEG und der Universitätsbibliothek + der Johannes Gutenberg-Universität Mainz im dortigen Servicezentrum + Digitalisierung und Fotodokumentation der <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> im Jahr 2019 digitalisiert. Die angefertigten Digitalisate (in den + Formaten ›.jpg‹ und ›.pdf‹) stehen seitdem in <bibl> + <title type="desc">Gutenberg Capture</title> + </bibl>, dem Online-Portal der Universitätsbibliothek zur digitalen Erschließung + und Bereitstellung von Quellenmaterial für die Wissenschaft, zur Verfügung.<note + type="footnote"><ref type="bibliography" target="#bombers_baedeker_1944">The Bomber's Baedeker 2019 (1944)</ref>. </note> + </p> + <p>Im Zuge der Digitalisierung wurde durch die Universitätsbibliothek auch eine erste + Erschließung des Textes mittels <term type="dh">Optical Character + Recognition</term> (OCR) durchgeführt. </p> + <p>An dieser Stelle setzte die Machbarkeitsstudie an, die im Wintersemester 2019 / 20 + an der Hochschule Darmstadt durchgeführt wurde, und in deren Rahmen das Konzept + für einen automatisierten Prozess der XML-isierung und einer OCR-Verbesserung des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> entstand. Dieses Konzept war ein erster, methodologisch wichtiger + Baustein, der dann im Rahmen einer Zusammenarbeit zwischen der Hochschule + Darmstadt, der Bibliothek des IEG und dem Bereich Digitale historische Forschung | + DH Lab (ebenfalls IEG) umgesetzt wurde. Die ersten experimentellen Ansätze der + Transformation der Quelle zu Daten wurden hier realisiert und auf Grundlage dieser + <term type="dh">datafication</term> – also der Umwandlung von Informationen in + maschinenlesbare, quantifizierbare Daten zum Zweck der Aggregation und Analyse – + und der entsprechenden Verfügbarmachung ist nun eine weitergehende Bearbeitung und + Analyse dieser Daten möglich. </p> + <div type="subchapter"> + <head>3.1. OCR</head> + <p>Die Inhalte des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> werden bereits im Druck stark strukturiert dargestellt und sind daher + grundsätzlich sehr gut geeignet, um die darin enthaltenen Informationen in eine + maschinenlesbare, objektorientierte und strukturierte Form zu bringen. Eine + nähere Betrachtung ergibt, dass jeweils zwei Hauptabschnitte pro Stadt + aufgeführt werden, die sich in folgende Muster aufgliedern:</p> + <figure> + <graphic url=".../medien/baedeker_2021_001.jpg" xml:id="baedeker_2021_001"> + <desc> + <ref target="#abb1">Abb. 1</ref>: ›Kopfteil‹ (Düren), Ausschnitt [The + Bomber's Baedeker. Guide to the economic importance of German towns and + cities, London 1944, S. 176. [Public Domain Mark 1.0]<ref + target="#baedeker_2021_001" type="graphic"/> + </desc> + </graphic> + </figure> + <p>I. Kopfteil</p> + <list type="unordered"> + <item>Name der Stadt (Großbuchstaben, Sperrsatz), dahinter in Klammern: die + Verwaltungseinheit und gegebenenfalls die Region.</item> + <item>In der nächsten Zeile: Geokoordinaten der Stadt im Format ›00° 00’ N. 00° + 00’ E:‹. Hier sind Variationen zu beobachten. So tauchen auch einstellige + Angaben auf und es existieren nicht immer Nachkommastellen in den + Geokoordinaten, also z. B. ›00° N. 00° E:‹.</item> + <item>Im Anschluss an die Koordinaten folgt die Entfernung zu London in Meilen, + im Format ›000 miles:‹.</item> + <item>Die letzte Information in der zweiten Zeile des Kopfteils gibt die + Einwohnerzahl in Klammern wieder.</item> + </list> + <figure> + <graphic url=".../medien/baedeker_2021_002.jpg" xml:id="baedeker_2021_002"> + <desc> + <ref target="#abb2">Abb. 2</ref>: ›Beschreibungsteil‹ (Düren), Ausschnitt + [The Bomber's Baedeker. Guide to the economic importance of German towns + and cities, London 1944, S. 176. [Public Domain Mark 1.0]<ref + target="#baedeker_2021_002" type="graphic"/> + </desc> + </graphic> + </figure> + + <p></p> + <p></p> + <p></p> + <p></p> + + <p>II. Beschreibungsteil</p> + <list type="unordered"> + <item>Eine knappe Beschreibung der wichtigsten Charakteristika der jeweiligen + Stadt (z. B. grobe geographische Verortung, Verkehrsinfrastruktur, + industrielle Bedeutung).</item> + <item>Strukturierung nach Kategorien (z. B. ›Transportation‹, ›Liquid Fuels and + Substitutes‹ usw.)</item> + <item>Es folgt eine detaillierte Auflistung der wichtigsten Ziele innerhalb der + Kategorie, pro potenzielles Ziel unterteilt in drei Punkte:</item> + <item> + <list type="unordered"> + <item>Name und Beschreibung des Ziels.</item> + <item>Standort.</item> + <item>Priorität (in absteigender Reihenfolge ›1‹ bis ›3‹ sowie ›–‹ für nicht + erwähnenswerte bzw. nicht einschätzbare Ziele).</item> + </list> + </item> + </list> + <p>Ein Blick in eines der bei <bibl> + <title type="desc">Gutenberg Capture</title> + </bibl> zur Verfügung stehenden Digitalisate im PDF-Format zeigt, dass hier + bereits ein OCR-Verfahren eingesetzt wurde. Jede Seite verfügt über einen + Text-Layer, der es ermöglicht, im Dokument zu suchen. Die Ergebnisse des + verwendeten OCR-Verfahrens sind aber insgesamt nur für eine einfache Suche + verwendbar, wenig verlässlich und letztlich nicht für eine direkte Umwandlung + im Sinne des Vorhabens geeignet. Nach entsprechender Analyse<note + type="footnote">Mit einem Zufallsgenerator wurden 500 beliebige Zeichen des + Gesamttexts ausgewählt und diese auf Richtigkeit überprüft. Die Auswahl des + Validierungsverfahren, dem sog. Bernoulli-Experiment, basiert auf einer + Empfehlung der <ref target="https://www.dfg.de/formulare/12_151/" + >DFG-Praxisregeln Digitalisierung</ref>, <ref type="bibliography" target="#DFG_2016">DFG (Hg.) 2016</ref>.</note> kann von + einer OCR-Genauigkeit von ungefähr 80 % ausgegangen werden, wobei die für die + effiziente Umsetzung des Projektes benötigte Erkennungsqualität aber mindestens + bei mehr als 95 % liegen sollte.<note type="footnote">Dies ist u. a. darauf + zurückzuführen, dass der Text selbst mit einer Schreibmaschine erstellt und + dann hektographiert wurde, so dass einzelne Stellen schlecht lesbar und für + die OCR nicht bzw. kaum interpretierbar waren.</note> Die vorliegenden + OCR-Daten waren daher nicht für eine Prozessierung nutzbar und die OCR musste + erneut durchgeführt werden. Angesichts dieses neuen Zwischenschritts ergab sich + auch die Situation einer erneuten, genauen Betrachtung des digitalen + Ausgangsmaterials. Zwei Probleme zeigten sich direkt, zum einen der + Vergilbungsgrad der Seiten und die daraus resultierende zu geringe Helligkeit + des Digitalisats, so dass relevante Details nicht von der OCR erkannt werden + konnten (<term type="dh">false negative</term>) beziehungsweise irrelevante + Artefakte auf dem Papier erkannt wurden (<term type="dh">false + positive</term>). Zum anderen zeigten sich einige Schwächen im Kontrast des + Schriftbilds, was angesichts des Alters der Schreibmaschinenseiten des + physischen Originals und dessen Nutzungsszenarien nicht weiter verwundert.<note + type="footnote">Es lassen sich auch Phänomene wie schwächer werdende + Farbbänder beobachten, die z. B. auch innerhalb einer Seite für starke + Kontrastschwankungen sorgen.</note> + </p> + <p>Nach der Entscheidung für eine erneute OCR-Behandlung fiel die Wahl zunächst + auf die freie Software <term type="figure">Tesseract.</term> + <note type="footnote"><ref target="https://github.com/tesseract-ocr">Tesseract-OCR</ref>.</note> + Allerdings erwies sich diese im operativen Einsatz zum Zeitpunkt Ende 2019 als + nicht sehr geeignet bei der Behandlung größerer Textmengen, da eine Aufteilung + des Konvoluts notwendig geworden wäre. Im Falle des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl>, mit mehr als 800 Seiten, wäre hier ein erheblicher Zeitaufwand + entstanden.</p> + <p>Als Alternative kam stattdessen das Werkzeug <term type="figure">FineReader</term> der + Firma ABBYY zum Zuge,<note type="footnote"><ref target="https://pdf.abbyy.com">ABBYY FineReader</ref>.</note> mit dem + sich zum Zeitpunkt der OCR-Verbesserung unkompliziert auch PDF-Dateien größeren + Umfangs verarbeiten ließen. Darüber hinaus bietet diese Software die Option, + mehrere Sprachen gleichzeitig verarbeiten zu lassen, was in der vorliegenden + Situation von großem Nutzen war, da der Löwenanteil des Textes zwar auf + Englisch<note type="footnote">Zum Zeitpunkt der Durchführung dieses + Arbeitsschritts im Projekt verfügte Tesseract nicht über die entsprechenden + Funktionalitäten.</note> verfasst ist, aber aufgrund der behandelten + Gegenstände natürlich auch zahlreiche deutsche Begriffe, wie z. B. Städtenamen + etc., zu finden sind.</p> + <p>Die vollumfängliche Verarbeitung dauerte drei Stunden und das Ergebnis wurde in + einer TXT-Datei gespeichert. Durch dieses Vorgehen konnte die Genauigkeit – + ohne Veränderung oder Bearbeitung des Digitalisats – gesteigert werden. + Letztlich war aber auch die damit erzielte Gesamtgenauigkeit nicht ausreichend, + so dass eine Bildbearbeitung der digitalen Vorlage notwendig wurde, um die + anvisierten Ziele in eine realistische Nähe rücken zu lassen. Um eine optimale + Erkennung der gedruckten Zeichen zu erreichen, war es nötig, den Kontrast zu + erhöhen. Hierzu wurde die in MacOS integrierte Applikation <term type="figure" + >Fotos</term> genutzt, mit der dann auf sehr einfache Art Bildkorrekturen + erstellt, kopiert und in der Gesamtheit auf alle Seiten angewendet wurden. Nach + dieser Optimierung konnten die Ergebnisse des OCR-Verfahrens erneut und sehr + deutlich gesteigert werden, so dass nun eine Genauigkeit von ca. 95 % + vorlag.<note type="footnote">Beim Präprozessieren sollten zukünftig + alternative Verfahren zur Kontrastkorrektur durchgeführt werden – Abbyy + Finereader unterstützt dies ebenfalls.</note> Da auf diesem Weg keine + weiteren großen Verbesserungen der OCR-Qualität zu erwarten waren, wurde fortan + zur weiteren Steigerung der Datenqualität auf ein Python-Skript gesetzt, so + dass zum Zeitpunkt der Veröffentlichung des Data-Papers im September 2021 eine + Zeichengenauigkeit von mehr als 99 % erreicht werden konnte.</p> + </div> + <div type="subchapter"> + <head>3.2. Python-Skript</head> + <p>Die Struktur des für das weitere Vorgehen geschriebenen Python-Skripts kann in + drei Schritte unterteilt werden. Schritt Eins stellt das <term type="dh" + >Preprocessing</term> dar. Hier werden wiederholt auftretende Fehler aus dem + OCR-Verfahren verbessert, die in der nachfolgenden Ausführung weiterer Schritte + im Skript zu Fehlern oder fehlerhafter Erfassung der Objekte führen könnten. + Zusätzlich werden strukturelle Abweichungen an die im <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> vorwiegend genutzten Normen angepasst und es werden Funktionen + ausgeführt, die folgende Muster in den oben beschriebenen Kopf- und + Beschreibungsteilen erkennen: Städtenamen, Land / Region, Koordinaten, + Entfernung zu London, Bevölkerungszahl, Informationstext und strategische Ziele + der beschriebenen Stadt. Darüber hinaus wird auf Seitenebene die + referenzierende URL in <bibl> + <title type="desc">Gutenberg Capture</title> + </bibl> erzeugt.</p> + <p>Die oben genannten Funktionen liefern eine Liste von erkannten Inhalten und + hier setzt der zweite Schritt an. Die Anzahl der Inhalte ist aufgrund der + vorgegebenen Struktur immer dieselbe und jeder Listeneintrag korrespondiert mit + dem entsprechenden Eintrag in der Vorlage. Der vierte Eintrag in der + generierten Liste der Bevölkerungszahlen zum Beispiel ist aus dem vierten + Eintrag in der Liste der erkannten Städte entstanden. Für die weitere + Verarbeitung werden diese Listen nun in ein sogenanntes <term type="dh" + >Dictionary</term> umgewandelt und hier wird jedem Wert ein Schlüssel + zugeordnet, wodurch die Daten nun so gespeichert werden können, dass klar ist, + welche Informationen sie enthalten. Auf diese Weise haben wir ein Dictionary + mit Listen erstellt, die schon alle benötigten Informationen enthalten.</p> + <p>Im dritten und letzten Schritt wird dieses Dictionary dann in eine XML-Datei + eingefügt.<note type="footnote">Ein mit XML ausgezeichneter Text bietet + sich hier als Zielformat an, da entsprechend strukturierte Dateien für + weitere Möglichkeiten der Nachnutzung offenbleiben und jedes spezifische + Format an dieser Stelle ohne konkrete Aufgabenstellung produziert worden + wäre.</note> Damit hier nicht in eine komplett leere Datei geschrieben wird, + wurde die Grundstruktur vorher schon erstellt. Beim Prozess des Exports werden + alle Inhalte aus dem Data-Dictionary eingelesen, sowie die Seitenzahlen aus dem + Originaldokument. Nun kann eine XML-Baumstruktur erzeugt werden, an die zuerst + die Städtenamen angefügt werden. Anschließend wird jeder Stadt-Eintrag mit den + dazugehörigen Informationen gefüllt. Als letzter Schritt wird die XML-Datei + exportiert und die entstandenen HTML-Entitäten werden aufgelöst.<note + type="footnote">Das hier genutzte Skript ist samt Dokumentation im + <ref type="bibliography" target="#bomber_skripte_2021">GitHub-Repositorium des Leibniz-Instituts</ref> für Europäische Geschichte unter + folgender URL aufzurufen: <ref + target="https://github.com/ieg-dhr/bombers_baedeker/"> </ref> + <ref target="https://github.com/ieg-dhr/bombers_baedeker/" + >https://github.com/ieg-dhr/bombers_baedeker/</ref>.</note> + </p> + </div> + <div type="subchapter"> + <head>3.3. Bereitstellung</head> + <p>Neben dem Python-Skript für die OCR-Optimierung finden sich in dem + Projekt-Repositorium auch die aus seiner Anwendung entstandenen Daten: für + jeden Band des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> liegt eine XML-Datei vor, in welcher der entsprechend formal + strukturierte und angereicherte Text enthalten ist.<note type="footnote">Das + Verzeichnis ›<ref + target="https://github.com/ieg-dhr/bombers_baedeker/tree/main/bomber_output_ext" + >bomber_output_ext</ref>‹ enthält das XML-Ergebnis des datengenerierenden + Skripts.</note> Zukünftige Versionen mit verbesserter Datenqualität werden + dort ebenfalls publiziert. </p> + <p>Bei der Bereitstellung des Datensatzes und des Skripts wurden die <term + type="dh">FAIR Data Principles</term> umfänglich berücksichtigt.<note + type="footnote"><ref target="https://www.go-fair.org/fair-principles/">FAIR Data + Principles</ref>, <ref type="bibliography" target="#FAIR_2016_2021">GOFair (Hg.) 2016–2021</ref>.</note> Für die Erfüllung dieser + Prinzipien sorgen die Zugriffsmöglichkeiten per GitHub-Repository und die + Veröffentlichung der erzeugten Daten in Zenodo, womit ein persistenter + Identifikator (DOI) einhergeht.<note type="footnote"><ref type="bibliography" target="#bach_et_al_2021">Bach et al. 2021</ref>.</note> + Für die rechtliche Sicherheit bei der Wiederverwendung von Daten und Skript + sorgen die gewählten Lizenzen (Creative Commons Lizenz, CC BY-SA 4.0<note + type="footnote"><ref target="https://creativecommons.org/licenses/by-sa/4.0/deed.de">CC + BY-SA 4.0</ref>, Creative Commons – Namensnennung – Weitergabe unter + gleichen Bedingungen – 4.0 International, <ref type="bibliography" target="#creative_commons_2021">Creative Communs (Hg.) + 2021</ref>.</note> für die Daten sowie die GNU General Public License<note + type="footnote"><ref target="https://www.gnu.org/licenses/gpl-3.0.de.html">GNU General + Public License</ref>, <ref type="bibliography" target="#GNU_2007">Free Software Foundation, Inc. (Hg.) 2007</ref>. </note> + für das Python-Skript). </p> + </div> + </div> + <div type="chapter"> + <head>4. Forschungs- und Nachnutzungspotenzial</head> + <p>Wie oben bereits geschildert, handelte es sich bei dieser Bereitstellung der + nachnutzbaren Daten des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> um ein Vorhaben, welches mit einem überschaubaren Ressourceneinsatz + durchgeführt wurde. Der Fokus lag dabei primär auf der persistenten + Verfügbarmachung des Datenbestands für die <term type="dh">scientific + community</term>. Eine basale, aber dennoch nicht zu vernachlässigende + Verbesserung, die sich für die Forscher*innen direkt aus dem digitalen Angebot + ergibt, spiegelt sich im vereinfachten Umgang mit dem Text wider. In den + bereitgestellten Daten lassen sich Such- und Analyseszenarien durchspielen, deren + Umsetzung ausschließlich auf dieser digitalen Grundlage möglich sind.</p> + <p>Die bislang durchgeführten Arbeiten haben die Grundlagen geschaffen, um in einem + nächsten Schritt ein digitales Editionsvorhaben durchzuführen. Allein im Bereich + der Auszeichnung und Anreicherung mit Normdaten – z. B. bei den Städte- oder + Firmennamen – besteht großes Potenzial für weitere Analysen. Neben der weiteren + Aufbereitung der Daten sehen wir ein breites Feld an möglichen Forschungsfragen, + die an den Text bzw. die Daten gestellt werden können. So wäre ein Abgleich der im <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> vorgeschlagenen Ziele im Deutschen Reich mit den tatsächlich bombardierten + Städten und Einrichtungen eine interessante Forschungsfrage, um einerseits + Rückschlüsse auf die praktische Anwendung im Hinblick auf die Zielvorgaben der + Royal Airforce zu geben. Andererseits können die detaillierten + Standortinformationen der Firmen aus wirtschaftshistorischer Perspektive erstmals + einen annähernd vollständigen Überblick über die Branchenverteilung in den 1930er- + und 1940er-Jahren geben. In beiden Fällen wäre noch zu prüfen, wie exakt die + vermerkten Geokoordinaten angegeben sind und ob sich gegebenenfalls ein + geographisches Muster aus den ermittelten Abweichungen herauslesen lässt.</p> + <p>Unsere Arbeiten ermöglichen nun einen datengetriebenen Analyseansatz. Während mit + einer traditionellen Methodik oftmals Karten ausschließlich rein visuell + analysiert werden und zugleich deren Richtigkeit und Entstehungskontexte nur + partiell hinterfragt werden können, z. B. ob die Ersteller*innen – wie in <ref + target="#baedeker_2021_003.jpg" type="graphic">Abb. 3</ref> dargestellt – eindeutige + und gültige Geoangaben verwendet haben, besitzen datengetriebene Ansätze der <term + type="dh">Visual Analytics</term> weitaus größere Möglichkeiten und können + aufzeigen, auf welcher Datenbasis die entsprechenden Angaben generiert wurden. </p> + <figure> + <graphic url=".../medien/baedeker_2021_003.jpg" xml:id="baedeker_2021_003"> + <desc> + <ref target="#abb3">Abb. 3</ref>: Klassische Visualisierung der Ziele nach + höchster Priorität aus dem Bomber’s Baedeker. [Uta Hohn: The Bomber’s Baedeker – Target Book + for Strategic Bombing in the Economic warfare against German Towns 1943–1954. In: <ref target="#hohn_1994" + type="bibliography">Hohn 1994</ref>, S. 216.]<ref + target="#baedeker_2021_003" type="graphic"/> + </desc> + </graphic> + </figure> + <p>Dies ist allerdings erst dann möglich, wenn die entsprechenden Angaben + maschinenlesbar vorliegen und so aufbereitet werden, dass sie visuell + interpretiert werden können. Die Darstellung in <ref target="#baedeker_2021_004.jpg" + type="graphic">Abb. 4</ref> wurde – basierend auf den im <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> gemachten Angaben der Geokoordinaten – mittels Tableau<note + type="footnote"><ref target="https://www.tableau.com">Tableau</ref>, <ref type="bibliography" target="#tableau_2003_2021">Tableau Software (Hg.) + 2003–2021</ref>.</note> und dem DARIAH-DE Geo-Browser<note type="footnote"><ref target="https://geobrowser.de.dariah.eu/">DARIAH-DE Geo-Browser</ref>, + <ref type="bibliography" target="#dariah_browser_2021">DARIAH-DE (Hg.) 2021</ref>.</note> angefertigt. Hier ist erkennbar, dass die + Ersteller*innen des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> eine klassische (Raster-)Papierkarte als Vorlage benutzt haben müssen, mit + deren Hilfe die entsprechenden Geokoordinaten in die Textfassung übertragen + wurden. Auffällig ist, dass die validen Geokoordinaten aufgrund des damaligen + technischen Standes der Flugzeug-Leitsysteme keine Bedeutung besaßen, da die + Flugzeuge mittels Radio-Leitstrahlen navigierten. Die Geokoordinaten hatten + dementsprechend nur einen untergeordneten Informationsgehalt. Auch können auf + diese Weise fehlerhafte Angaben im <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> schneller identifiziert werden – wie beispielsweise, dass Mannheim + versehentlich mit den Geokoordinaten von Kiew versehen wurde. Alleine durch dieses + Beispiel wird deutlich, dass die Angabe der Geokoordinaten nur eine zusätzliche + faktisch rein kartographische Information darstellt.</p> + <figure> + <graphic url=".../medien/baedeker_2021_004.jpg" xml:id="baedeker_2021_004"> + <desc> + <ref target="#abb4">Abb. 4</ref>: Visualisierung der im Bomber’s Baedeker benannten + Zielstädte basierend auf den angegebenen zeitgenössischen Geokoordinaten mittels + DARIAH-DE Geo-Browser und Tableau. [Bach / Secco 2021]<ref target="#baedeker_2021_004" type="graphic"/> + </desc> + </graphic> + </figure> + <p>Wichtiger war zum Zeitpunkt der Erstellung in den 1940er-Jahren also vielmehr die + Entfernung zu London und über welche Planquadrate die Flugzeuge fliegen mussten, + um ihre Ziele zu erreichen. Wetterbedingungen, die Abwehrmaßnahmen der Deutschen + Luftwaffe, aber auch welche Ziele in der Nähe lagen, die alternativ angeflogen + werden konnten, wenn das eigentliche Ziel nicht erreicht werden konnte, spielten + eine größere Rolle, als die richtige Angabe der Geokoordinaten.</p> + <p>Allein durch dieses Beispiel wird deutlich, dass die basale Erschließung dieses + Datensatzes in XML und die dadurch hergestellte Maschinenlesbarkeit ungeheures + Forschungspotenzial verspricht. Momentan arbeiten wir daran, dieses Beispiel auf + die Ebene der einzelnen Städte herunterzubrechen, um zu analysieren und + einzuschätzen, wie gut und valide die Alliierten tatsächlich über die Standorte + von Infrastrukturen und Industrieanlagen informiert waren. Der Abgleich mit + zeitgenössischen Stadtplänen und Adressbüchern ermöglicht diesbezüglich die + Durchführung valider Datenanalysen.</p> + </div> + <div type="chapter"> + <head>5. Ausblick</head> + <p>Wie nicht zuletzt an diesem Beispiel der Verfügbarmachung des <bibl> + <title type="desc">Bomber’s Baedeker</title> + </bibl> nachzuvollziehen ist, stellen wissenschaftliche Bibliotheken bereits eine + große Anzahl von Digitalisaten bereit. In einigen Fällen wurden bereits + OCR-Verfahren eingesetzt, um den Nutzer*innen weitergehende Möglichkeiten zu + bieten. Leider liegen die angebotenen OCR-Daten nicht immer in einer Qualität vor, + die eine digitale Bearbeitung ohne weiteren Aufwand für die Vorverarbeitung + erlaubt. Diese Situation belastet die ohnehin knappen Ressourcen in + Forschungsprojekten.</p> + <p>Es wäre wünschenswert, wenn die hier festgehaltene Herausforderung der Erstellung + von manschinenlesbaren Datensets zukünftig von Bibliotheken, + Forschungsdateninfrastrukturinitiativen und Wissenschaftler*innen gemeinsam + adressiert werden könnte. Auf diese Weise kann eine höhere, leichter verarbeitbare + Datenqualität in den Angeboten der Bibliotheken zur Unterstützung der digital + forschenden Wissenschaftler*innen generiert werden.</p> + <p>Nachdem die Bereitstellung des Volltextes für die Nutzer*innen mehr oder weniger + fest im Portfolio der Bibliotheken verankert ist, wäre der nächste Schritt, das + Bewusstsein für die Notwendigkeit einer hohen Datenqualität (über die Metadaten + hinaus) zu schärfen. Trotz vieler guter Beispiele für Ansätze und Umsetzungen sind + hier weitere Aktivitäten notwendig, um das Mindset und die aktuelle Praxis zu + verändern. Die geisteswissenschaftlichen Initiativen in der Nationalen + Forschungsdateninfrastruktur (NFDI) und seine relevanten Teilnehmenden wären die + idealen Multiplikator*innen, um die Standards der Datenbereitstellung für digitale + Texte voranzutreiben.</p> + </div> + </div> + <div type="bibliography"> + <head>Bibliographische Angaben</head> + <listBibl> + <bibl xml:id="bach_et_al_2021">Felix Bach / Cristian Secco / Stefan Schmunk / + Thorsten Wübbena: The Bomber's Baedeker. A Guide to the Economic Importance of + German Towns and Cities. In: zenodo.org. Data set vom 26.07.2021. DOI: <ref + target="http://doi.org/10.5281/zenodo.5138504">10.5281/zenodo.5138504</ref> + </bibl> + <bibl xml:id="boog_et_al_2001">Das Deutsche Reich in der Defensive – Strategischer + Luftkrieg in Europa, Krieg im Westen und in Ostasien 1943 bis 1944/45. Hg. von + Horst Boog / Gerhard Krebs / Detlef Vogel. Stuttgart u. a. 2001. (= Das Deutsche + Reich und der Zweite Weltkrieg, 7) <ptr cRef="336091052" type="gbv"/></bibl> + <bibl xml:id="boehm_2015">Martin Böhm: Die Royal Air Force und der Luftkrieg + 1922–1945. Personelle, kognitive und konzeptionelle Kontinuitäten und + Entwicklungen. Paderborn 2015. <ptr cRef="825778840" type="gbv"/></bibl> + <bibl xml:id="burger_2019">Rainer Burger: Handbuch für den Feuersturm. In: + Frankfurter Allgemeine Zeitung. Artikel vom 26.06.2019. [<ref + target="https://www.faz.net/aktuell/gesellschaft/menschen/mainzer-forscher-haben-den-bomber-s-baedeker-digitalisiert-16253639.html" + >online</ref>] </bibl> + <bibl xml:id="creative_commons_2021">Creative Commons-Lizenzen. Hg. von Creative + Commons. Mountain View, CA 2021. [<ref + target="https://creativecommons.org/licenses/">online</ref>] </bibl> + <bibl xml:id="dariah_browser_2021">DARIAH-DE Geo-Browser. Hg. von DARIAH-DE. Version + 3.6.7. Göttingen 2021. [<ref target="https://geobrowser.de.dariah.eu/" + >online</ref>] </bibl> + <bibl xml:id="DFG_2016">DFG-Praxisregeln ›Digitalisierung‹. Hg. von Deutsche + Forschungsgemeinschaft. Bonn 2016. PDF. [<ref + target="http://www.dfg.de/formulare/12_151/12_151_de.pdf">online</ref>] </bibl> + <bibl xml:id="FAIR_2016_2021">FAIR Data Principles. Hg. von GOFair. In: go-fair.org. + Leiden u. a. 2016–2021. [<ref target="https://www.go-fair.org/fair-principles/" + >online</ref>]</bibl> + <bibl xml:id="GNU_2007">GNU General Public License. Hg. von Free Software Foundation, + Inc. Version 3 vom 29.06.2007. [<ref target="https://www.gnu.org/licenses/gpl-3.0.de.html">online</ref>]</bibl> + <bibl xml:id="hohn_1994">Uta Hohn: The Bomber's Baedeker-target book for strategic + bombing in the Economic Warfare against German Towns 1943–45. In: GeoJournal 34 + (1994), H. 2, S. 213–230. <ptr cRef="13044555X" type="gbv"/></bibl> + <bibl xml:id="knuth_2006">Rebecca Knuth: Burning Books and Leveling Libraires. + Extremist Violence and Cultural Destruction. Westport, CT 2006. <ptr + cRef="507454553" type="gbv"/></bibl> + <bibl xml:id="longmatte_1983">Norman Longmatte: The Bombers: The RAF offensive + against Germany 1939–1945. London u. a. 1983. <ptr cRef="040421465" type="gbv" + /></bibl> + <bibl xml:id="mueller_2004">Rolf-Dieter Müller: Der Bombenkrieg 1939–1945. Berlin + 2004. <ptr cRef="397704798" type="gbv"/></bibl> + <bibl xml:id="mueller_2012">Susanne Müller: Die Welt des Baedeker. Eine + Medienkulturgeschichte des Reiseführers 1830–1945. Frankfurt/Main u. a. 2012. <ptr + cRef="680339256" type="gbv"/></bibl> + <bibl xml:id="overy_2014">Richard Overy: Der Bombenkrieg: Europa 1939–1945. Berlin + 2014. <ptr cRef="785741828" type="gbv"/></bibl> + <bibl xml:id="rothnie_1992">Niall Rothnie: The Baedeker Blitz. Hitler’s Attack on + Britain’s Historic Cities. Shepperton 1992. <ptr cRef="1609359119" type="gbv" + /></bibl> + <bibl xml:id="schmunk_2005">Stefan Schmunk: Entweder KZ oder ordentliche Deutsche. + Die Luftwaffe und der Arbeitseinsatz 1942–1944. Darmstadt 2005. In: + researchgate.net. DOI: <ref target="https://doi.org/10.13140/rg.2.2.20030.08003" + >10.13140/rg.2.2.20030.08003</ref> + </bibl> + <bibl xml:id="tableau_2003_2021">Tableau. Hg. von Tableau Software. In: tableau.com. + Seattle, WA 2003–2021. [<ref target="https://www.tableau.com">online</ref>] </bibl> + <bibl xml:id="bombers_baedeker_1944">The Bomber's Baedeker. Guide to the economic + importance of German towns and cities. (Foreign Office & Ministry of Economic + Warfare). 2 Bände. London 1944. In: Gutenberg Capture. Hg. von + Universitätsbibliothek Mainz. Online-Ausgabe. Mainz 2019. URN: <ref + target="https://nbn-resolving.de/urn:nbn:de:hebis:77-vcol-20056" + >urn:nbn:de:hebis:77-vcol-20056</ref> + </bibl> + <bibl xml:id="bomber_skripte_2021">The Bomber’s Baedeker Guide to the economic + importance of German towns and cities. London 1944. Softwareskripte und + Dokumentation. Hg. von IEG Mainz. In: github.com. 2021. [<ref + target="https://github.com/ieg-dhr/bombers_baedeker/">online</ref>]</bibl> + <bibl xml:id="böhm_2015">TNA London, AIR 41 / 5, Directive 21 January 1943, + International Law of the Air, 1939–1945, Confidential supplement to Air Power and + War Rights, 1946, zitiert nach: Böhm, Martin: Die Royal Air Force und der + Luftkrieg 1922–1945. Paderborn 2015, S. 147.</bibl> + <bibl xml:id="baedeker_raids_2021">Baedeker Raids. The story of the historic towns + and cities in Britain targeted by the German Air Force in Spring 1942. Hg. von + Imperial War Museums. London 05.07.2019–05.01.2020. In: Google Arts and Culture. + Virtuelle Ausstellung. 2021. [<ref + target="https://artsandculture.google.com/exhibit/baedeker-raids/ogKCrdvG3K3qLg" + >online</ref>] </bibl> + </listBibl> + </div> + <div type="abbildungsnachweis"> + <head>Abbildungsverzeichnis</head> + <desc type="graphic" xml:id="abb1">›Kopfteil‹ (Düren), Ausschnitt [The Bomber's + Baedeker. Guide to the economic importance of German towns and cities, London 1944, + S. 176. Public Domain Mark 1.0; <ref + target="https://visualcollections.ub.uni-mainz.de/histbuch/content/pageview/454316" + >online</ref>]. <ref target="#baedeker_2021_001" type="graphic"/></desc> + <desc type="graphic" xml:id="abb2">›Beschreibungsteil‹ (Düren), Ausschnitt [The Bomber's + Baedeker. Guide to the economic importance of German towns and cities, London 1944, + S. 176. Public Domain Mark 1.0; <ref + target="https://visualcollections.ub.uni-mainz.de/histbuch/content/pageview/454316" + >online</ref>]. <ref target="#baedeker_2021_002" type="graphic"/></desc> + <desc type="graphic" xml:id="abb3">Klassische Visualisierung der Ziele nach höchster + Priorität aus dem Bomber’s Baedeker. [Uta Hohn: The Bomber’s Baedeker – Target Book + for Strategic Bombing in the Economic warfare against German Towns 1943–1954. In: + <ref target="#hohn_1994" + type="bibliography">Hohn 1994</ref>, S. 216.]<ref target="#baedeker_2021_003" type="graphic" + /></desc> + <desc type="graphic" xml:id="abb4">Visualisierung der im Bomber’s Baedeker benannten + Zielstädte basierend auf den angegebenen zeitgenössischen Geokoordinaten mittels + DARIAH-DE Geo-Browser und Tableau. [Bach / Secco 2021]<ref + target="#baedeker_2021_004" type="graphic"/></desc> + </div> + </body> + </text> +</TEI>