Startseite Projekt Projekt Aktuelles Editionshinweise Forschungsrelevanz Mitarbeiterinnen und Mitarbeiter Editionsbeirat Hilfe Register Personenregister
Deutsch English

Editionshinweise


Grundlagen

Die hier veröffentlichten Sitzungsprotokolle der Fraktionen des Deutschen Bundestages seit 1949 unterscheiden sich nicht nur hinsichtlich ihres Umfangs und ihrer äußeren Merkmale erheblich voreinander, sie gelangen auch von verschiedenen Ausgangspunkten her in die 2022 erstmals publizierte XML-Online-Edition des Editionsprogramms »Fraktionen im Deutschen Bundestag 1949–2005« .

So liegen die meisten Dokumente aus den Jahren 1949 bis 1969 bereits in einer wissenschaftlichen Buchausgabe der Kommission für Geschichte des Parlamentarismus und der politischen Parteien (KGParl) vor oder sind Teil eines Konvoluts auf CD-ROM. Entsprechend bilden diese beiden Medien – oder die im Vorfeld entstandenen (zumeist unstrukturierten) digitalen (Satz-)Daten – die Grundlage für das neu aufbereitete Online-Material. Bei den Protokollen ab der 8. Wahlperiode, d.h. ab 1976, werden die angefertigten Textdigitalisate und XML-Dateien unmittelbar auf den Vorlagen aus den Archiven basieren (»born digital«).

Die bereits veröffentlichten Editionen (»Altdaten«) wurden von der KGParl retrodigitalisiert. Dies geschah einerseits, indem die Buchvorlage gescannt und per OCR eingelesen und anschließend manuell korrigiert wurde, und zum Teil, durch eine direkte Extraktion der Daten aus den Satzvorlagen (in der Regel PDF). Dem folgte eine Konvertierung dieser Altdaten in TEI-XML durch die Firma textloop sowie eine Weiterbearbeitung bei der KGParl. In diesem letzten und aufwändigsten Bearbeitungsschritt wurden die Altdaten gemäß dem hierfür neu erstellten TEI-XML-Editionsschema semantisch angereichert: Es erfolgten Verknüpfungen von Personennamen und Institutionen mit ID und Normdaten, bislang nur visuell erkennbare inhaltliche Phänomene wie bibliographische Angaben, Verweise auf Parlamentaria, Zeitungen, Zeitschriften, Archive, Querverweise etc. werden durch die entsprechenden TEI-XML-Elemente maschinenlesbar.

Einen weiteren Schwerpunkt stellt die Anreicherung jeder einzelnen XML-Datei mit möglichst ausführlichen Metadaten zur Quelle, ihrer Entstehung, Bearbeitung etc. im teiHeader dar (siehe dazu auch den weiterführenden Abschnitt unter Editionsrichtlinien ).

Das Editionsprogramm und seine Quellen

Das Editionsprogramm »Fraktionen im Deutschen Bundestag 1949–2005« unter Federführung der KGParl hat sich zum Ziel gesetzt, einen einzigartigen Quellenbestand zur Geschichte des Parlamentarismus und der parlamentarischen Kultur in der Bundesrepublik Deutschland für Forschung und Öffentlichkeit online bereitzustellen. Zu den Sitzungen der bis 2005 maßgeblichen Fraktionen und (Landes-)Gruppen im Deutschen Bundestag, das heißt von CDU/CSU, SPD, FDP, GRÜNE und PDS, sind seit 1949 fast durchgängig Protokolle überliefert, die eine exzellente Quellenbasis zur deutschen Geschichte nach dem Zweiten Weltkrieg und zur Funktionsweise des politischen Systems der Bundesrepublik darstellen.

Form und Umfang der in die Online-Edition aufzunehmenden Sitzungsprotokolle sind nicht zuletzt aufgrund des weiten Zeitrahmens von knapp 55 Jahren und der von Fraktion zu Fraktion, aber auch von (Fraktions-)Vorsitz zu (Fraktions-)Vorsitz differierenden Art der Protokollierung äußerst divers. Bis Ende der 1960er Jahre dominieren zumeist recht knappe Beschluss- und Verlaufsprotokolle, vereinzelt ergänzt durch ausführlichere Wortprotokolle – wohl auf der Grundlage stenografischer Mitschriften, die durch die Verwaltungsmitarbeiterinnen und -mitarbeiter der Fraktionsführung angefertigt wurden.

Mit der zunehmend geschäftsmäßigen Anfertigung von Tonbandmitschnitten der Fraktionsdebatten rückt die genaue Abbildung der einzelnen Wortbeiträge der Abgeordneten in den Mittelpunkt. Dies gilt zunächst für die CDU/CSU-Fraktion, die seit September 1966 auf der Grundlage der Tonbänder zeitnah wörtliche oder wortnahe Niederschriften erstellen ließ. Bei der SPD-Fraktion hielt man bis Mitte der 1970er Jahre an einer komprimierten Wiedergabe der Sitzungen durch Verlaufsprotokolle fest, doch existieren seit 1969/70 zu vielen Sitzungen zusätzlich Tonbandaufnahmen – in der Regel von zwei bis vier Stunden Dauer. Diese Audiomitschnitte werden im Rahmen des Editionsprogramms erstmals transkribiert und so in Schriftform verfügbar gemacht. Bereits aus der 7. Wahlperiode (1972–1976) sind für die große Mehrzahl der SPD-Fraktionssitzungen derartige Tonbandtranskripte ediert. In der 6. Wahlperiode wurde noch beide Protokollformen, Ergebnisprotokoll und Audiotranskript, ediert, seit der 7. Wahlperiode werden nur dann andere Protokollformen herangezogen, wenn keine Audioaufnahmen verfügbar sind. Seit Mitte der 70er Jahr wurde zudem innerhalb der SPD-Fraktionsführung festgelegt, dass die Tonbandmitschnitte die Sitzungen protokollieren – schriftliche Beigaben umfassten in der Regel nur noch eine Art Sprecherverzeichnis für die Tonbänder, orientiert am Laufwerkszähler des Tonbands.

Bei den Sitzungsprotokollen der FDP-Fraktion handelt es sich zwar überwiegend um eher knappe Verlaufsprotokolle, doch lässt sich auch hier feststellen, dass Umfang (und damit Aussagekraft) ab der 5./6. Wahlperiode zunehmen. Ähnliches ist für die Protokolle der CSU-Landesgruppe zu vermerken. Die Sitzungsprotokolle der Fraktion der GRÜNEN seit 1983 haben häufig eher Beschlusscharakter, werden jedoch durch reiche und vielfältige Materialanhänge ergänzt. Gleiches gilt für die noch nicht edierten Dokumente der PDS seit 1990, bei denen es sich um zumeist knappe Beschlussprotokolle handelt.

Die Originalvorlagen zu den edierten Dokumenten entstammen der Fraktionsüberlieferung in den Archiven der Parteistiftungen von CDU ( Archiv für Christlich-Demokratische Politik) , SPD ( Archiv der sozialen Demokratie ), FDP ( Archiv des Liberalismus ), CSU ( Archiv für Christlich-Soziale Politik ), GRÜNEN ( Archiv Grünes Gedächtnis ) und zukünftig auch PDS ( Archiv der Rosa-Luxemburg-Stiftung ). Diese Bestände weisen hinsichtlich der hier relevanten Sitzungsprotokolle nur wenige Überlieferungslücken auf – für die CDU/CSU-Fraktion reichen diese vom Februar 1950 bis zum Mai 1954, für die FDP-Fraktion bestehen Unterbrechungen insbesondere im Zeitraum von 1954 bis 1958 und für die CSU-Landesgruppe zwischen Oktober 1966 und Februar 1969. Durch Ersatzüberlieferungen, etwa parallel edierte Fraktionsvorstandsprotokolle der CDU/CSU, oder das Heranziehen von anderem Fraktionsschriftgut, können diese Verluste teilweise aufgewogen werden. Einen großen Teil der Sitzungsprotokolle von 1949 bis 1969 (1.–5. Wahlperiode) hat die KGParl so bereits vollständig in kommentierten Buchausgaben (teilweise mit Beigabe einer CD-ROM) publiziert. Die Wahlperioden ab 1969 werden als schmalere Auswahleditionen auch in Zukunft in Buchform veröffentlicht. Die Gesamtheit aller Sitzungsprotokolle stellt die KGParl im Internet zur Verfügung , was in den Bucheditionen mittels entsprechender Querverweise Berücksichtigung findet.

Editionsrichtlinien

Vorbemerkung zur digitalen Edition

Bei den vorliegenden Editionsrichtlinien und -hinweisen, die sich sowohl auf die Konversion der ursprünglich in Buchform veröffentlichten Protokolle wie auch die rein digital erfassten Protokolle beziehen, handelt es sich um ein Dokument, das nicht abgeschlossen ist.

Die Edition beruht auf TEI-kodierten Texten im XML-Format. Die menschen- wie maschinenlesbare TEI-Kodierung hat sich zu einem De-facto-Standard innerhalb der Geisteswissenschaften allgemein und im editorischen Bereich im Speziellen entwickelt. Details zu diesem von der Text Encoding Initiative entwickelten Dokumentenformat finden sich in den Guidlines der Text Encoding Initiative .

Zu betonen ist an dieser Stelle, dass die Darstellung der TEI-kodierten Protokolle nur in aufbereiteter beziehungsweise gefilterter Form auf unserer Webseite geschieht. Das heißt, nicht jede in den Dateien codierte Information wird optisch präsentiert. Die umfassendste Information findet sich stets in den originalen XML-Dateien selbst, die den Nutzerinnen und Nutzern der Edition daher stets auch zum Download und zur weiteren Nutzung zur Verfügung steht.

TEI-XML-Kodierung der Edition

Grundsätzlich bestehen alle TEI-XML-Dokumente der Edition aus zwei Bereichen: den Metadaten (beispielsweise Informationen zur Datei, zur Quelle und zu den Inhalten) sowie dem eigentlichen Textkorpus . Jede Datei beginnt mit der gleichen Präambel, wobei nur der Identifikationsstring ( XML:ID ) verschieden ist, der für eine eindeutige Auffindbarkeit im Netz sorgt. Es folgt der sogenannte <teiHeader> mit den Metadaten, anschließend der eigentliche Inhalt der Quelle unter <text> .

Beispiel:

                        

Die in der Edition verwendeten XML-Elemente und deren Attribute sind nachfolgend im Zusammenhang mit der Erläuterung der technischen Editionsarbeit beschrieben; es folgt zusätzlich eine Aufstellung mit (auch technisch) detaillierteren Angaben in einem separaten Dokument (wird nachgereicht).

Die editorische Arbeit an einem Sitzungsprotokoll oder einer anderen Quelle findet gemäß den oben erwähnten Angaben statt: Auf Grundlage einer TEI-XML-Dokumentenvorlage erfasst das Editionsteam zunächst die Metadaten der Quelle. Danach wird der textuelle Inhalt der Quelle, die meist als PDF mit OCR-Daten oder von Tonband transkribiert vorliegt, strukturiert und gegliedert erfasst (Phase I: Textkritische Erfassung). Bereits bei der Erfassung erfolgt die semantische Kodierung typographischer und vor allem inhaltlicher Phänomene mit den entsprechenden TEI-XML-Elementen. Ein zweiter Durchgang besteht dann in der inhaltlichen Bearbeitung und Kommentierung der Quellen (Phase II: Kommentierung). Diese erfolgt entweder wie in Phase I über die entsprechenden XML-Elemente oder durch inhaltliche Erläuterungen (Kommentierung) mithilfe eines Anmerkungsapparats (<note> ).

Die Erfassung der Metadaten im <teiHeader>

Nachfolgend wird der Großteil der im Header der Editionsdateien verwendeten TEI-Elemente aufgeführt und ihre inhaltliche wie technische Bedeutung erläutert (für weitergehende Informationen zur TEI, ihrem Strukturmodell und ihren Elementen, sei auf die offizielle Dokumentation TEI:P5 verwiesen):

  • <titleStmt> : Name der vorliegenden Datei (z.B. “Fraktionssitzung (Kurzprotokoll”) und des Editionsprogramms, Namen der Personen, die an der Bearbeitung dieses Dokumentes mitgewirkt haben.

  • <publicationStmt> und <seriesStmt> : Informationen zur herausgebenden Institution (hier: KGParl), maschinenlesbare, die Edition charakterisierende Kurzinformationen zur Übernahme in andere Datenverarbeitungssysteme.

  • <notesStmt> : Weitere allgemeine Informationen zur Edition, bei Dokumenten, die nicht born digital sind, findet sich hier auch der formalisierte bibliographische Hinweis auf die Buchedition bzw. die Erstveröffentlichung. <note type="Verbundene-Protokolle"> wird derzeit noch nicht genutzt, es ist dafür vorgesehen, in Zukunft ein Referenznetz zwischen den Protokollen/Dokumenten formalisiert erfassen zu können.

  • <sourceDesc> : Dieser Abschnitt enthält alle notwendigen Informationen zur Art und Herkunft der Quelle – Archiv, Signatur, ggf. Name der Quelle, Kürzestcharakteristik der Quelle, Beschaffenheit, Umfang.

  • <encodingDesc> : Grundsätzliche, jedoch sehr kurze Informationen zur Aufbereitung und Wiedergabe der Quellen (Rechtschreibung, Korrekturen, Texteingriffe).

  • <profileDesc> : Hierin finden sich maschinenlesbare Informationen zu Fraktion, Wahlperiode, Zeitpunkt, ggf. Dauer und Ort der Sitzung sowie zur Sitzungsleitung. Diese werden für Anzeige und Zuordnung der Dokumente auf der Editionswebseite ausgewertet und entsprechen – bis auf wenige Ausnahmen – den in der XML:ID und dem Dateinamen kodierten Informationen. In der Regel sind XML:ID und Dateiname bis auf die Endung identisch. (Im Laufe der Bearbeitung kam es vor, dass bei einzelnen Dokumenten Uhrzeit oder Sitzungsdatum angepasst werden mussten, nachdem die XML:ID bereits erstellt war; der Charakter der XML:ID als technisch einzigartiger wie persistenter Identifikationsstring für URL etc. macht eine nachträgliche Änderung einer einmal zugewiesenen ID praktisch unmöglich, weshalb hier Abweichungen, die aber rein technischer Natur sind, entstehen können. Grundsätzlich gilt: Die korrekten Metainformationen zur Quelle finden sich im Header, nicht in ID o.ä.).

  • <textClass> : Legt den Dokumententyp (»Wortprotokoll zeitgenössisch« , »Wortprotokoll nachträglich«, »Verlaufs- oder Ergebnisprotokoll«, »Verzeichnis« sowie als offener Typ »Andere«) fest.

    • »Wortprotokoll zeitgenössisch«: Umfasst alle zeitgenössisch stenographisch erstellten oder vom Tonband transkribierten Wortprotokolle einer Sitzung (vgl. z.B. die Protokolle der CDU/CSU-Fraktion der 7. Wahlperiode).
    • »Wortprotokoll nachträglich«: Umfasst alle wörtlichen Sitzungsprotokolle, die vom Editionsteam nachträglich durch Transkription der Audioaufzeichnung angefertigt wurden (vgl. z.B. die meisten Protokolle der SPD-Fraktion der 7. Wahlperiode).
    • »Verlaufs- oder Ergebnisprotokoll«: Umfasst in der Regel alle zeitgenössischen Kurz-, Ergebnis- und Verlaufsprotokolle nicht oder nur teilweise wörtlicher Art (vgl. z.B. die Protokolle der FDP-Fraktion oder der CSU-Landesgruppe).
    • »Verzeichnis«: Wird aktuell nicht genutzt.
    • »Andere«: Umfasst alle Dokumententypen, die sich nicht genau zuordnen lassen, beispielsweise Tagebucheinträge, Briefe oder Ausschnitte aus weiteren Dokumenten, die anstatt einer meist fehlenden anderen Überlieferung der Sitzung erfasst wurden.
    • Für die Zukunft sind weitere Dokumententypen geplant, die dann auch andere Teile der (gedruckten) Edition wie beispielsweise die wissenschaftliche Einleitung abbilden.
  • <revisionDesc> : Dieser Abschnitt dient der (internen) Dokumentation der Schritte der Textüberarbeitung durch das Editionsteam. Eine echte Versionierung der Dokumente findet (ebenfalls nur projektintern zugänglich) via Github statt.

Grundsätze der Texterfassung und Textauszeichnung sowie der inhaltlichen Kommentierung

Dokumentenstruktur

Der Inhalt (also die eigentlich Transkription der Quelle) eines edierten Dokuments gliedert sich in zwei große Blöcke, die jeweils unterschiedliche Funktionen haben. Innerhalb jedes Blocks gibt es weitere Untergliederungen:

                        
Erfassung der Dokumente ( <front> )

Dieser Teil des Dokuments enthält neben dem erwähnten Regest in Listenform und häufig auf Grundlage von vorliegenden Tagesordnungen, Einladungen (mitunter ist die aufbereitete Zusammenfassung bereits Teil der Quelle) auch diverse Teilnehmendenlisten (sei es Gäste, abwesende MdB, anwesende Regierungsmitglieder etc.). Ob solche Listen aufgenommen werden, liegt im Ermessen der jeweiligen Editorin, des Editors – in der Regel ist ihr Aussagewert sehr begrenzt und bildet nicht wirklich die Anwesenheitsstruktur einer Sitzung ab (manche trugen sich nie ein, andere verließen die Sitzung vorzeitig, manche sind eingetragen, obwohl sie offenbar nicht anwesend waren etc.).

Erfassung der Dokumente ( <body> )

Schriftliche Dokumente:

Das Editionsteam bemüht sich, die Strukturen (d.h., das Layout) eines schriftlichen Protokolls in sehr vereinfachter Form in eine XML-Datei zu übertragen: Inhaltlich zusammen gehörende Textteile werden als jeweils separates <div> erfasst. Unterhalb eines <div> gliedert sich der Text in Absätze <p> oder, jedoch möglichst sparsam verwendet, Listen- und Tabelleumgebungen. Jedes <div> erhält eine eindeutige Identifikationsnummer, so dass Verknüpfungen und Verweise auf diese Textblöcke sowohl innerhalb des Dokuments wie der Gesamtedition möglich sind.

Nicht aufgenommen werden rein optische Auszeichnungen in der Quelle wie beispielsweise weitgehend willkürliche und unsystematische Unterstreichungen, durchgestrichene Wörter oder Absätze und handschriftliche Zusätze, soweit es sich lediglich um Fehlerkorrekturen handelt.

Die Orthographie orientiert sich an der zum Zeitpunkt der Quelle gültigen deutschen Rechtschreibung (Kommentare des Editionsteams sind in Neuer Deutscher Rechtschreibung verfasst). Kleinere Fehler wurden in der Regel stillschweigend korrigiert, bei größeren Änderungen dokumentiert das Editionsteam die Änderungen entsprechend in Anmerkungen <note type+"critical"> sowie eckigen Klammern im Text. In den Protokollen falsch geschriebene Namen oder Daten wurden, soweit erkannt, korrigiert. Auslassungen im Text und solche, die vom Editionsteam konstatiert wurden, sind ebenfalls dokumentiert. (Auf die Verwendung des Critical Apparatus der TEI wurde verzichtet). Eine detaillierte Auflistung der verwendeten TEI-XML-Elemente, auch jener zur Textkritik, findet sich weiter unten.

Transkribierte Audiodokumente

Bei der Transkription der Tonbänder wurde ein Kompromiss zwischen Aufwand und Ertrag im Sinne einer Leseedition angestrebt: Bei teilweise 400 Stunden Audioaufnahmen pro Wahlperiode und Fraktion ist eine vollständige Transkription bspw. nach linguistischen Maßstäben inklusive aller vorhandenen nichtsprachlichen, pragmatischen oder dialektalen Phänomene nicht möglich. Bei der Verschriftlichung wurde der textliche Charakter der mündlichen Rede weitgehend übernommen. Abhängig von den jeweiligen Rednerinnen und Rednern auf den Aufnahmen sind somit unvollständige oder grammatikalisch unkorrekte Sätze, Lücken oder inhaltliche Sprünge nicht selten. Im Rahmen der Verschriftlichung wurden Interpunktionen und Absätze nach Maßgabe der Lesefreundlichkeit eingefügt. Eigenheiten oder Defizite in der mündlichen Rede bleiben in der Regel jedoch erkennbar, auch wenn dadurch die Lesbarkeit oder Verständlichkeit gegebenenfalls erschwert wird. Mit aufgenommen worden sind auch zufällige Äußerungen von Abgeordneten oder anderen Sprechenden, die das Mikrofon einfing, die aber nicht zum eigentlichen Kontext dessen gehörten, was die Fraktion gerade verhandelte. Im Rahmen der Möglichkeiten wurde gleichwohl versucht, jeden Redenden namentlich zu identifizieren.

Abschnitte, die in der Tonbandaufnahme aufgrund von Störgeräuschen oder auch sehr undeutlicher Aussprache der Rednerinnen Redner (mitunter ist das nicht voneinander zu unterscheiden) nicht zu verstehen waren, wurden durch eine Transkriptionslücke <gap/> gekennzeichnet (online als geschweifte Klammer mit drei Punkten erkennbar). (Längere Sprech-)Pausen in den Aufzeichnungen, denen keine Transkriptionslücke, sondern sowohl technische (Band läuft weiter, ohne dass das Mikrofon eingeschaltet wurde) wie inhaltliche (die Fraktion zählt eine Wahls aus, das Band läuft weiter) Ursachen zugrunde liegen, werden über das Element <pause dur="PTXXHXXMXXS"/> gekennzeichnet, wobei das Attribut @dur eine standardisierte Zeitangabe zur Dauer der Pause enthält. Ereignisse wie Beifall, Unruhe, Heiterkeit werden als <incident> markiert (inklusive einer Unterscheidung, ob das Editionsteam den Vorfall selbst konstatierte oder, ob dieser bereits im zeitgenössischen Wortprotokoll festgehalten wurde).

Soweit notwendig, werden sowohl bei schriftlichen Vorlagen wie bei Audiovorlagen alle textkritischen semantischen Auszeichnungen durch entsprechende erläuternde Anmerkungen im edierten Dokument ergänzt. Dabei findet auf TEI-XML-Ebene eine Unterscheidung zwischen textkritischen ( <note type="critical"> ) und inhaltlich kommentierenden Anmerkungen ( <note type="comment"> ) statt.

Umgang mit Personennamen und Institutionen

Personennamen:

Ein Hauptaugenmerk der Edition liegt in der sicheren Identifizierung möglichst aller in den Dokumenten erwähnten oder sprechenden (Audiotranskriptionen) Personennamen . Um dies zu gewährleisten wurde zunächst eine umfangreiche Datenbank angelegt. Sie speist sich aus den Mitgliedern des Bundestages von 1949 bis 2019 und enthält zudem sämtliche sonstigen bislang in der Edition vorkommenden Personen, für die die Personenregister der Bucheditionen sowie des Auswärtigen Ausschusses ausgewertet wurden. Diese knapp 10.000 Datensätze werden kontinuierlich ergänzt und erweitert sowie mit Biogrammen sowie, soweit vorhanden, Normdaten (GND, VIAF, NDB usf.) und externen Verlinkungen (Wikipedia) angereichert. Jeder in der Datenbank enthaltenen Person wird ein eindeutiger, einzigartiger und persistenter Identifikator zugewiesen.

In den Dokumenten wird nun jeder vorkommende Personenname entsprechend dem Schema mit dem Attribut role="Sprecher" oder role="Erwaehnung" ausgezeichnet und mit der ID der Personendatenbank verknüpft. So ist gewährleistet, dass jeder Name einer konkreten Person zugeordnet werden kann (auch dann, wenn bspw. keine konkrete Namensnennung erfolgte, sondern eine Funktionsbezeichnung – »Vizekanzler« beispielsweise – benutzt wurde).

Beispiele:

  • <name type="Person" role="Erwaehnung" ref="#ScheelWalter_1953-10-06">Scheel</name>
  • <name type="Person" role="Sprecher" ref="#BrandtWilly_1949-09-07">Der Bundeskanzler</name>

Über das aus Datenbank und Personennamen der Dokumente dynamisch erstellte Personenregister der Webseite kann dann mittels GND-Verknüpfung eine Referenzierung auf Personen vorgenommen werden: Die URL fraktionsprotokolle.de/gnd/118629972 listet z. B. alle Protokolle auf, in denen »Herbert Wehner« spricht oder sein Name erwähnt wird.

Institutionen/Organisationen:

Analog zur Personendatenbank wird eine einfachere Datenbank für Institutionen und Organisationen erstellt (in Vorbereitung). Auch diese enthält eindeutige Identifikatoren und Normdatenverweise, so dass eine eindeutige Referenzierung von Institutionen in den Dokumenten ermöglicht wird.

Anmerkung : Im Moment liegt der Arbeitsschwerpunkt  des Editionsteams bei der nachträglichen Anreicherung der Retrodigitalisate mit Dokumentenstruktur, Sitzungsverläufen und Personennormdaten – die Auszeichnung von Institutionen und Organisationen erfolgt dementsprechend zu einem späteren Zeitpunkt.

Weitere TEI-XML-Elemente

Im Folgenden sind die wichtigsten TEI-XML-Elemente aufgeführt, welche zur semantischen Codierung des Protokolltextes genutzt werden:

Größere Textabschnitte: <div>

Größere Textabschnitte der edierten Protokolle werden mittels <div> in Kapitel eingeteilt. Jedes div-Element erhält eine aus der XML:ID des Protokolls abgeleitete einheitliche und einzigartige ID und wird darüber mit dem Sitzungsverlauf (Regest) verlinkt. Auf der Webseite erfolgt zudem eine optische Hervorhebung des div-Elements mittels eines in einem <head> -Element geklammerten Großbuchstaben.

                        
Absätze: <p>

Jeder einzelne Absatz, im Text wie in den Anmerkungen, steht in einem sogenannten paragraph-Element <p> .

Aufzählungen/Listen: <list > und <item>

XML-Listenelemente werden in der Regel zum Strukturieren des Sitzungsverlaufs im <front> des Dokuments genutzt (sei es beim Sitzungsverlauf/Regest selbst, sei es bei der Aufzählung von Teilnehmenden, die in manchen Protokollen erfolgte). In Ausnahmefällen werden beide Element auch innerhalb des Protokolltextes genutzt, um lange listenartige Aufzählungen besser lesbar zu machen.

                        
Tabellen:

Wird nachgereicht .

Anmerkungen: <note>

Anmerkungen (in klassischen Prin-Editionen etwa die Fuß- oder Endnoten) werden als <note> -Element realisiert. Zu unterscheiden sind dabei textkritische Anmerkungen , die sich auf die Gestalt des Textes, Transkriptonsschwierigkeiten, Eingriffe des Editionsteams etc. beziehen, und i nhaltliche Anmerkungen , die kommentierenden Charakter haben.

  • textkritische Anmerkung: <note type="critical">Anmerkungstext</note>
  • inhaltliche Anmerkung: <note type="comment">Anmerkungstext</note>

Jeder Anmerkung wird eine einzigartige XML:ID zugewiesen, die sie eindeutig identifizier- und referenzierbar macht. Beispiel:

<note xml:id="spd-07_1972-11-29-t1510_WN_xyz" type="comment">

Identifizierung von Textteilen, auf die sich Anmerkungen beziehen: <seg>

Um den Lesenden genaueren Aufschluss darüber geben zu können, auf welchen konkreten Textteil sich eine Anmerkung bezieht, wird das <seg> -Element im Zusammenspiel mit <note> genutzt. Es klammert jenen Textteil, auf den sich eine Anmerkung bezieht. (Dieses Verfahren wird aktuell vor allem in den born digital-Dokumenten ab 1976 genutzt.) Beispiel:

                        
Bibliographische Angaben: <bibl>

Im Moment sind bibliographische Entitäten zwar über entsprechende Bibl-Elemente im TEI-XML ausgewiesen, aber nicht mit entsprechenden Authority-Files oder Bibliographien verknüpft. Gerade bei den retrodigitalisierten Protokolle, die stark auf Kurztitel etc. setzten, können so Schwierigkeiten bei der Identifizierung von erwähnter oder zitierter Sekundärliteratur entstehen. Um hier Abhilfe zu schaffen, wird die verwendete Literatur von uns nach und nach in einer Zotero-Gruppenbibliothek erfasst. Diese Bibliothek teilt sich in eine Gesamtbibliothek, mit allen Literaturangaben aus der gesamten Editionszeit, und in Sammlungen, die jeweils für eine Fraktion und Wahlperiode angelegt wurden. Hier finden Sie die Übersicht der bisher erfassten Fraktionen und Wahlperioden:

Gesamtbibliothek

https://www.zotero.org/groups/4606219/fraktionsprotokolle/library

Sammlungen

CDU/CSU-Fraktion

SPD-Fraktion

FDP-Fraktion

CSU-Landesgruppe

Grüne

Bibliographische Angaben innerhalb der Protokolle oder auch innerhalb der kommentierenden Anmerkungen des Editionsteams werden durch das <bibl> -Element eingerahmt. Das <bibl> -Element seinerseits spezifiziert über Attribute, um welche Art einer bibliographischen Referenz es sich handelt. Derzeit finden folgende Werte Verwendung:

  • Monographie/Aufsatz/Sammelband:

                                    
  • Zeitschriften/Nachschlagewerke/Zeitungen:

                                    
  • Archivalien:

                                    
  • Bundesgesetzblatt:

                                    
  • Bundesratsprotokolle:

                                    
  • Bundestagsprotokolle:

                                    
  • Bundestagsdrucksachen:

                                    
  • Kabinettsprotokolle der Bundesregierung:

                                    

Innerhalb von <bibl> -Elementen können weitere Elemente bspw. die Titel der Werke, Jahr, Verlag etc. näher spezifizieren sowie Anmerkungen Verweise bzw. Hyperlinks auf externe Ressourcen realisieren.

(Langfristig geplant ist die Erstellung eines Gesamtbibliographie für die Edition (Zotero) verbunden mit einem entsprechenden Verweissystem.)

Querverweise/Referenzen: <ref>

Die Anmerkungen, Kapitel oder Sitzungsverlaufspunkte erhalten wie erwähnt automatisch eine XML:ID. Auf diese IDs kann innerhalb des Dokuments oder der Edition über das <ref> -Element mit Attribut »internal« verwiesen werden: <ref type="internal" target=“#xml:id der Anmerkung”> .

Referenzen aus dem Dokument auf externe Ressourcen (beispielsweise Parlamentaria, Webseiten etc.) außerhalb des Dokumentes erfolgen im Rahmen eines Bibliographie-Elements mit dem <ref> -Element mit Attribut “external” und einem weiteren Attribut, das die maschinenlesbare Kodierung des Verweisziels enthält. Beispiel (Verweis auf das Bundestags-Plenarprotokoll Nr. 4 aus der 6. Wahlperiode):

                        

Für die Editionswebseite wird hieraus automatisch ein Hyperlink erzeugt, der auf das entsprechende Dokument (zur Zeit im PDF-Format) auf der Webseite des Deutschen Bundestages verweist.

Ausweis von Zitaten und direkter/indirekter Rede: <quote> und <said>
  • Direkte Zitate, beispielsweise aus Gesetzestexten oder Zeitungsartikeln, werden als <quote>Zitat</quote> markiert.
  • Zitate in direkter oder indirekter Rede (»Ich verlese einen Rede des Bundeskanzlers: ›Redetext‹« oder »Der Bundeskanzler teilte mir mit, dass er … gesagt habe.«) werden über das Element <said> spezifiziert.

Beispiele:

                        
Abkürzungen: <abbr> und <expan>

Abkürzungen werden folgendermaßen kodiert:

                        
Pausen, nichtverbale Vorfälle oder Transkriptionslücken: <pause> , <gap/> und <incident>
  • Pausen kommen praktisch nur in den transkribierten Audioaufnahmen der Sitzungen, aktuell also nur bei der SPD-Bundestagsfraktion, vor. Läuft die Aufnahme weiter, obgleich längere Zeit niemand mehr redet (wenn zum Beispiel im Hintergrund ausgezählt wird, wenn es für einige Minuten schlicht still ist usf.), wird dies als <pause> mit einer als Attribut spezifizierten Dauer (im ISO-Format) ausgewiesen: <pause dur="PT00H10M00S"/> beschreibt also eine Pause, die 10 Minuten lang ist.

  • Das TEI-Element für eine Transkriptionslücke , einen nicht zu entziffernden Teil des Protokolls, eine gestörte Tonbandpassage oder einen entsprechenden Hinweis in der bereits zeitgenössischen Transkription ist <gap/> . Je nach Protokoll und je nachdem, ob die Transkriptionslücke bereits (wie häufig bei den zeitgenössischen Wortprotokollen der CDU/CSU) in der Quelle von den zeitgenössischen Protokollantinnen oder dem Protokollanten festgestellt oder nachträglich durch das Editionsteam konstatiert wurde, wird das Element zusätzlich mit einer Anmerkung (“Anmerkung im Original”) ausgewiesen oder mit einer erläuternden textkritischen Anmerkung versehen. Transkriptionslücken in den vom Editionsteam transkribierten Audioaufnahmen der SPD werden in der Regel lediglich als <gap/> ausgewiesen, nur in Sonderfällen wird dazu eine Anmerkung gesetzt. Beispiele:

                                    
  • <incident> -Elemente zeichnen in der Regel Phänomene wie Zwischenrufe, Beifall, Störungen durch Rufen, Tumult etc. aus. Das <incident> -Element differenziert zwischen Vorfällen, die das Editionsteam (in der Regel bei der Transkription der Audioaufnahmen) wahrnehmen sowie dokumentieren und Vorfälle, die bereits in der zeitgenössischen Protokollvorlage erkannt wurden. Beispiele:

                                    

    [Weitere Hinweise folgen.]


Berlin, Dezember 2021

Sylvia Rochow & Sven Jüngerkes

© KGParl 2022 | Impressum | Datenschutz