Über das Projekt

Entstanden im Rahmen des Praxisseminars der Digital Humanities (M.Sc.) an der Universität Trier

Über Uns

Das Projekt Reiseberichte karTRIERt ist im Rahmen des Projektseminars der Digital Humanities (M.Sc.) an der Universität Trier entstanden. Unsere Gruppe, die das Seminar im Wintersemester 2022/23 belegt hat, besteht aus sieben Studierenden, die alle unterschiedliche geistes- und informationswissenschaftliche Hintergründe haben. Die Vorgabe für das Seminar ist, unser Vorwissen mit den erworbenen Kompetenzen aus den Digital Humanities zu vereinen und ein eigenes Projekt zu schaffen. Das Seminar wurde von Dr. Joëlle Weis und Dr. Élodie Ripoll betreut.

Themenfindung

Nach einem Brainstorming standen uns Ideen aus der Philosophie, der Geschichte, der Literatur und dem Thema Open Science zur Auswahl. Am besten gefiel uns die Idee, ein Multiversum zu kreieren, bei dem man auf einer Karte die Routen verschiedener fiktiver (Roman-)Charaktere nachverfolgen kann. Schlussendlich fiel unsere Wahl jedoch auf eine kartografische Visualisierung von Reiseberichten. Eine genaue Erklärung, wie es dazu kam, die Daten des Projektes Travelogues nachzunutzen, findet sich weiter unten unter „Travelogues“.

Ziele

Da uns die Themen Nachnutzbarkeit und Open Science sehr am Herzen liegen, wollten wir ein Projekt schaffen, das an bereits existierende Forschung anknüpft und so aufgebaut ist, dass es auch für Geisteswissenschaftler:innen, die nicht mit digitalen Methoden arbeiten, zugänglich und nachvollziehbar ist. Es war unser Anliegen, ein Projekt aufzubauen, bei dem computergestützte Methoden so eingebracht werden, dass auch Laien leichten Zugang finden und die Daten nutzen können. Unser Projekt, wie auch die Digital Humanities allgemein, verfolgt das Ziel, Forschungsdaten und Prozesse transparenter zu machen, und orientiert sich dabei an den FAIR-Prinzipien.

Methoden

In unserem Projekt wurden Texte, die bereits durch Optical Character Recognition (OCR) digitalisiert wurden, benutzt. Kleine Fehler in den Volltexten wurden mit einem eigenen Skript (größtenteils durch reguläre Ausdrücke) nachkorrigiert. Mithilfe von Named Entity Recognition (NER) wurden Orte herausgesucht, die dann manuell nachkorrigiert wurden. Auf diese Orte wurde ein Clustering-Verfahren (genauer gesagt: der DBSCAN-Algorithmus) angewandt, und die so entstandenen Cluster wurden auf einer mit Leaflet kreierten Karte visualisiert. Die Website wurde mit Github Pages erstellt. Alle benutzten Methoden werden weiter unten in den jeweiligen Abschnitten ausführlicher erklärt.

Korpus

Unser Korpus besteht aus Reiseberichten, die im Rahmen des Travelogues-Projektes erarbeitet wurden. Näheres zu diesem Projekt gibt es hier. Wir haben uns dabei auf die Texte des 18. Jahrhunderts beschränkt, da die automatische Texterkennung hier zuverlässiger funktioniert hat und die Texte eher zur Nachnutzung geeignet sind. Aus dem Gesamtkorpus haben wir einige Texte ausgewählt und mit einem selbst erstellten Skript kleine vorkommende OCR-Fehler korrigiert. Die vorkommenden Orte haben wir automatisiert erfasst und anschließend manuell nachkorrigiert. Diese sind auf der Karte dargestellt. Zusätzlich haben wir den Roman Reise um die Erde in 80 Tagen (Original Le Tour du monde en quatre-vingts jours) von Jules Verne gewählt, da dieser Text aus der gleichen Zeit stammt wie die Reiseberichte, im Gegensatz zu diesen jedoch in sehr hoher Qualität verfügbar ist und sich somit sehr gut für das Visualisieren einer bekannten Reiseroute eignet.

Methoden der Digital Humanities

Das Projekt in Zahlen

Weil computergestütztes Arbeiten computergestützt ausgewertet werden kann.

Monate Projektlaufzeit

bearbeitete Texte

erkannte Orte pro Text (Durchschnitt)

Worte pro Text (Durchschnitt)

Unser Team

Wir haben's geschafft und sind sehr stolz darauf!

Sarah Ondraszek

Korpusaufbau & Named Entity Recognition

Was haben die Arbeit mit historischen Textdateien und Achterbahnen gemeinsam? Beide bringen meinen Puls auf 179 👍

Lisa Braune

Post Processing & Logo

Alles ein bisschen und nichts richtig

Svenja Wagner

Clustering

Uff, ich bin schlecht mit so Sprüchen…

Jan Philipp Simon

Karte

Ich mag Karten

Solange Wagner

Website

Es funktioniert noch immer nicht!!!!

Tatiana Bessonova

Website

Ich {visibility: hidden;}

Edda Schwarzkopf

Jules Verne und überall ein bisschen

Ich mag die Idee, die Welt, wie wir sie uns in Texten erzählen, irgendwie auf eine Karte bringen zu wollen.