Hermann Grotefend lebte und wirkte in der zweiten Hälfte des 19. Jahrhunderts bis ins 20. Jahrhundert. Er studierte an der Universität Göttingen Geschichte und arbeitete danach als Archivar, unter anderem im Stadtarchiv Frankfurt am Main. Er starb 1931 in Schwerin. 

Im Zuge seiner Arbeit veröffentlichte er zahlreiche Editionen von Archivinventar und Hilfswerke für die historische Forschung. Sein erstes Werk dazu war das Handbuch der historischen Chronologie des deutschen Mittelalters und der Neuzeit. Darauf folgte sein Standardwerk Zeitrechnung des deutschen Mittelalters und der Neuzeit, das er zwischen 1891 und 1898  in zwei Bänden veröffentlichte. Im Anschluss an diese Veröffentlichung verfasste er das Taschenbuch der Zeitrechnung des deutschen Mittelalters und der Neuzeit. Das Standardwerk und das Taschenbuch gehören bis heute zum Handwerkszeug der Historiker. Das Standardwerk wird unter Historikern schlicht “Grotefend” genannt. 

Hermann Grotefend (1845-1931).
Foto: Public Domain

Die zwei Bände des Standardwerkes beinhalten ein Heiligenverzeichnis, welches die Heiligennamen und ihre Feste auflistet, ein Glossar, Festkalender aus deutschen, schweizer und skandinavischen Diözesen und Ordenskalender, sowie die Ostertafeln zur Berechnung des Osterfestes. Das Taschenbuch ist eine komprimierte Version des Standardwerkes. Es beinhaltet Erläuterungstexte zur Chronologie und zu Kalendern sowie ein alphabetisches Verzeichnis, das Einträge aus Glossar und Heiligenverzeichnis verbindet. Weiters Listen der Regierungsjahre von Kaisern und Königen und Pontifikationsjahre der Päpste. Diese Listen sind für die historische Forschung insofern wichtig, da lange Zeit nach Regierungsjahren und Pontifikationsjahren datiert wurde und diese Daten somit zur Umrechnung von Datumsangaben wichtig sind. Ebenfalls wichtig zur Umrechnung von Datumsangaben sind die unterschiedlichen Kalendertafeln, die unterschiedliche Zeitrechnungskonventionen abbilden.

Urkunde über den Verkauf einer Rente vom 12.05.1291.
Wikimedia/Zwiebel1 (CC 3.0); shorturl.at/jmpCR

Historische Zeitrechnung

Datumsumrechnungen sind zum Beispiel für die Erforschung von mittelalterlichen Urkunden notwendig. In Urkunden muss immer das Datum vorkommen, an dem die Urkunde verfasst wurde. Doch im Mittelalter wurden Datumsangaben anders geschrieben als heute. So steht am Ende einer Urkunde zum Verkauf einer Rente: “Actum anno Domini M CC XC primo, IIII idus Maii.”, was so viel heißt wie “Im Jahre des Herren 1291, 4. Iden des Mai”. Nach Iden und damit auch nach Kalenden und Nonen - das sind fixe, immer wiederkehrende Tage im Monat - zu rechnen, stammt noch aus der römischen Antike und blieb noch lange vor allem in der römisch-katholischen Kirche in Gebrauch. Die Iden bezeichnen immer die Monatsmitte und es wird zu ihnen hinunter gezählt. Hier helfen die Tafeln des römischen Kalenders im Grotefend. In der Spalte des Mai können wir nachlesen, dass die Iden des Mai am 15. Tag liegen und es sich bei den 4. Iden (IV) um den 12. Mai handelt. Die moderne Umschrift unseres Datums lautet also: 12. Mai 1291.

Tafel zum Römische Kalender aus dem Taschenbuch der Zeitrechnung.
Foto: Elisabeth Raunig

Digitalisierung

Glücklicherweise und aufgrund der Wichtigkeit dieser Werke als Forschungsunterstützung wurde der "Grotefend" auch sehr bald digitalisiert. Aber was bedeutet das? Digitalisierung ist nicht gleich Digitalisierung: Es gibt viele unterschiedliche Arten von "Digitalisierung". Also was ist im konkreten Fall damit gemeint? Ganz allgemein versteht man darunter die Wiedergabe von analogen Daten in digitalen Formaten, zum Beispiel wenn aus Buchseiten digitale Bilder werden.

Im Falle historischer Dokumente kann man unterschiedliche Komplexitätsstufen der Digitalisierung unterscheiden. Die erste Stufe ist das Scannen oder Fotografieren der Quelle, wie zum Beispiel an der Urkunde oder der Tafel aus dem "Grotefend" ersichtlich. Für die Gesamtausgaben der Werke von "Grotefend" bedeutet das, dass sie gescannt wurden und die Bilder zum Beispiel in PDF-Dokumenten zusammengefasst wurden. Die zweite Stufe ist, dass auf diese Bilder OCR (optical character recognition) Technologien angewendet wurden, also eine automatische Texterkennung durchgeführt wurde. Damit wird aus den Mustern in den Farbinformationen eines Bildes der Text errechnet. Die Werke "Grotefends" stehen derart aufbereitet zur Verfügung, sie können aus Google Books übernommen werden und sind sogar für E-Reader geeignet. Aus einem digitalen Bild wurde also digitaler Text.

Hermann Grotefend: Taschenbuch der Zeitrechnung.
Foto: Elisabeth Raunig

Noch mehr Digitalisierung

Man kann diese Komplexität steigern, wenn man plain text (reinen Text ohne Formatinformationen) zum Beispiel in HTML umwandelt: Dabei wird der Text als Hypertext codiert und kann als Website zur Verfügung gestellt werden. Der Vorteil gegenüber plain text oder einem PDF ist, dass HTML-Code durch spezielles Markup strukturierter und damit vielseitiger verarbeitbar ist. Dabei wird der Text (oder der Inhalt) durch bestimmte zusätzliche Informationen "ausgezeichnet" und somit auch besser maschinell verarbeitbar. Das zweibändige Standardwerk von "Grotefend" ist als “Grotefend - online” auch als HTML-Version von Horst Ruth verfügbar, wo neben Glossar, Heiligenverzeichnis, Diözesan- und Ordenskalender und den Tafeln auch noch automatische Webrechner zur Berechnung historischer Datumsangaben hinzugefügt wurden. Diese Rechner umfassen Berechnungen für Jahres- und Tageskennzeichen, bewegliche Feiertage und verschiedene Suchfunktionen für Datierungen, und Umrechnungsmethoden zwischen verschiedenen Kalendersystemen. Diese Webapps ersetzen den analogen Grotefend zur Umrechnung von Datumsangaben weitgehend. Aufwendige Recherchen können nun mit wenigen Klicks gelöst werden.

Zu den Vorteilen der "Grotefend"-Website gehören die Vollständigkeit der Daten und die zusätzlichen Rechner. Der große Nachteil dieser HTML-Version ist, dass die Information noch immer nicht maschinenlesbar sind. Für den Computer sind diese Daten noch immer Zeichenketten unterschiedlicher Zahlen und Buchstaben. Nur ein Mensch kann aus diesen Zeichenketten auch Bedeutung ablesen. Über das Suchen und Finden geht die Interaktion mit den Daten aber nicht hinaus. Gegenüber dem gedruckten "Grotefend" ist das eigentlich ein Rückschritt, denn dieser dient für die Kalenderdaten und das Heiligenverzeichnis als eine hochstrukturierte analoge Datenbank, beziehungsweise als strukturierter Wissensspeicher von Kalendern, Heiligen, ihren liturgischen Festen und in welchen Quellen diese verzeichnet sind. Auch diese Funktion sollte man digital wiederverwendbar machen! 

Weder in analoger Form noch als HTML-Version ist dieser Wissensspeicher mit anderen Daten vernetzbar. Für diese Art von Interaktion sind diese Daten aber besonders interessant, weil sie beispielsweise andere Datenquellen semantisch anreichern können und damit ein unendliches Wissensnetz aufgebaut werden könnte. Semantisch anreichern bedeutet, dass einer (historische) Quelle, die digital aufbereitet wird, so mehr Bedeutung gegeben werden kann, indem andere Informationen hinzugefügt werden und diese Datenquellen direkt mit anderen Daten vernetzt werden. Das Semantic Web wäre eine solche Nutzungsumgebung.

Semantic Web / Web of Data

Die Lösung dafür ist, vom bisherigen “Web of Documents”, also dem bekannten World Wide Web zu einem “Web of Data”, auch “Semantic Web” genannt, zu kommen. Der Unterschied liegt im Umgang mit den Daten: Beim Semantic Web werden Daten so aufbereitet, dass deren “Bedeutung” auch von Computern verstanden werden können und so Netzwerke an Informationen entstehen, in denen diese direkt miteinander in Beziehung gesetzt werden.

Aus technischer Sicht müssen die Daten als Webressourcen, also über Internetadressen, erreichbar gemacht werden: Dabei kann zum Beispiel aus der “Person” der Heiligen Elisabeth die Ressource <https://example.org#heiligeElisabeth> werden. Jede Art von Informationseinheit wird dadurch für Computer eindeutig identifizierbar. Computer können damit nicht nur auf technischer Basis mit Daten arbeiten, sondern auch auf inhaltlicher Basis. Bei der Datenflut, die aktuell entsteht, wäre das ein überaus nützliches Hilfsmittel.

Graphvisualisierung der Linked Open Data Cloud Stand Februar 2017.
Grafik: lod-cloud.net (CC BY-SA 3.0)

Im Semantic Web werden einzelne Ressourcen mit weiteren Ressourcen in Beziehung gesetzt, dafür gibt es entsprechende Beschreibungssprachen und Serversysteme, die diesen Datenaustausch und die Verknüpfung möglich machen. Dafür werden Triples, vergleichbar mit kurzen Aussagesätzen, verwendet, die aus Subjekt, Prädikat und Objekt bestehen. Diese Sätze müssen beim Erstellen der Daten formuliert werden, ein für Menschen leicht verständliches Beispiel wäre: Die Heilige Elisabeth wird am 19. November gefeiert. Diese Aussage wird maschinenlesbar mit einzelnen Webadressen formuliert. Die “Satzteile” werden zu Webressourcen gemacht, aus denen man ein für den Computer verständliches Triple formulieren kann. Dafür verwendet man bestehende Schemata (strukturelle Regeln) und Ontologien (systematisches, thematisch zusammenhängendes Bedeutungsvokabular), die bereits vordefinierte Webadressen bereitstellen, auf die sich die Forschercommunity geeinigt hat, um Wissen zu beschreiben. 

Dafür gibt es allgemeine Ontologien, sogenannte “Top-Level Ontologies”, die generelle Regeln definieren und themenspezifische Ontologien, sogenannte “domain ontologies”. Wichtig ist dabei, dass diese auch mit anderen Ressourcen verknüpft werden, denn nur so kann die Vernetzung von Daten funktionieren. Eine themenspezifische Ontologie wäre jene, die auf die Grotefend-Kalenderdaten angewendet wurde. Darin ist die Person der Heiligen Elisabeth für den Computer identifizierbar als <https://example.org#heiligeElisabeth> abgebildet, zusätzlich werden mit diesem Eintrag auch die Informationen zur Funktion der Person <istEineHeilige> und der Name (das Label) “Heilige Elisabeth von Thüringen” verknüpft. Alle Informationen sind über eigene Webadressen ansprechbar.

Oberfläche von "Grotefend digital".
Screenshot: Elisabeth Raunig

Grotefend digital

Man kann Digitalisierung also von digitalen menschenlesbaren Daten zu digitalen maschinenlesbaren Daten steigern. "Grotefend – digital" wäre eine derartige Anwendung: Sie beinhaltet alle Daten aus dem Heiligenverzeichnis sowie die Diözesan- und Ordenskalender. Die Daten sind auf der Website menschenlesbar abgebildet und können über die dahinterliegende Ontologie auch maschinell verarbeitet werden. Die Daten stellen eine Normdatensammlung für Diözesan- und Ordenskalender, Heilige und liturgische Feste dar. Aber wozu das alles?

"Grotefend – digital" sollte jetzt nicht nur einfach im Web “herumhängen”, sondern für die Verbesserung der Datenvernetzung verwendet werden. Damit könnte man bei Forschungsprojekten, die von den Digital Humanities Gebrauch machen, eine weitere Stufe der Digitalität erreichen. Ein konkretes Beispiel mit einer anderen Quellenart (also nicht Kalendern) ist das Magnum Legendarium Austriacum. Das ist eine österreichische Sammlung von Lebensgeschichten zu Heiligen (Heiligenviten) aus dem 12. Jahrhundert. Auf der digitalen Plattform zu dieser Quelle sind Texteditionen und digitale Bilder zu den einzelnen Heiligenviten miteinander verlinkt. Hyperlinks sind zwar Webadressen, sie können vom Computer zwar funktionell aber nicht inhaltlich "verstanden" werden. Würde man die Daten der beiden Forschungsprojekte verknüpfen (dafür gäbe es mehrere technische Möglichkeiten) könnten beide Projekte davon profitieren – und die damit beschäftigte Forschercommunity sowieso.

Was ist nun digital? Digital ist zumindest nicht immer gleich digital! Die Anwendungsfälle wie auch die beteiligten Personen bestimmen im jeweiligen Kontext, was digital sein könnte, wie so oft gibt es zwischen zwei Polen unendlich viele Abstufungen. Je öfter und umfangreicher diese Vernetzungen hochstrukturierter digitaler Daten stattfinden –, unabhängig  vom Forschungsbereich – desto größer wird die Linked Open Data Cloud und damit das Wissen, dessen Bedeutung sowohl vom Computer als auch vom Menschen verstanden werden kann. (Elisabeth Raunig, Helmut W. Klug, 13.5.2021)

Literaturhinweise

Weitere Beiträge im Blog