Über das Projekt
Entstanden im Rahmen des Praxisseminars der Digital Humanities (M.Sc.) an der Universität Trier
Über Uns
Das Projekt Reiseberichte karTRIERt ist im Rahmen des Projektseminars der Digital Humanities (M.Sc.) an der Universität Trier entstanden. Unsere Gruppe, die das Seminar im Wintersemester 2022/23 belegt hat, besteht aus sieben Studierenden, die alle unterschiedliche geistes- und informationswissenschaftliche Hintergründe haben. Die Vorgabe für das Seminar ist, unser Vorwissen mit den erworbenen Kompetenzen aus den Digital Humanities zu vereinen und ein eigenes Projekt zu schaffen. Das Seminar wurde von Dr. Joëlle Weis und Dr. Élodie Ripoll betreut.
Themenfindung
Nach einem Brainstorming standen uns Ideen aus der Philosophie, der Geschichte, der Literatur und dem Thema Open Science zur Auswahl. Am besten gefiel uns die Idee, ein Multiversum zu kreieren, bei dem man auf einer Karte die Routen verschiedener fiktiver (Roman-)Charaktere nachverfolgen kann. Schlussendlich fiel unsere Wahl jedoch auf eine kartografische Visualisierung von Reiseberichten. Eine genaue Erklärung, wie es dazu kam, die Daten des Projektes Travelogues nachzunutzen, findet sich weiter unten unter „Travelogues“.
Ziele
Da uns die Themen Nachnutzbarkeit und Open Science sehr am Herzen liegen, wollten wir ein Projekt schaffen, das an bereits existierende Forschung anknüpft und so aufgebaut ist, dass es auch für Geisteswissenschaftler:innen, die nicht mit digitalen Methoden arbeiten, zugänglich und nachvollziehbar ist. Es war unser Anliegen, ein Projekt aufzubauen, bei dem computergestützte Methoden so eingebracht werden, dass auch Laien leichten Zugang finden und die Daten nutzen können. Unser Projekt, wie auch die Digital Humanities allgemein, verfolgt das Ziel, Forschungsdaten und Prozesse transparenter zu machen, und orientiert sich dabei an den FAIR-Prinzipien.
Methoden
In unserem Projekt wurden Texte, die bereits durch Optical Character Recognition (OCR) digitalisiert wurden, benutzt. Kleine Fehler in den Volltexten wurden mit einem eigenen Skript (größtenteils durch reguläre Ausdrücke) nachkorrigiert. Mithilfe von Named Entity Recognition (NER) wurden Orte herausgesucht, die dann manuell nachkorrigiert wurden. Auf diese Orte wurde ein Clustering-Verfahren (genauer gesagt: der DBSCAN-Algorithmus) angewandt, und die so entstandenen Cluster wurden auf einer mit Leaflet kreierten Karte visualisiert. Die Website wurde mit Github Pages erstellt. Alle benutzten Methoden werden weiter unten in den jeweiligen Abschnitten ausführlicher erklärt.
Korpus
Unser Korpus besteht aus Reiseberichten, die im Rahmen des
Travelogues-Projektes erarbeitet wurden.
Näheres zu diesem Projekt gibt es hier. Wir haben uns dabei auf die Texte des
18. Jahrhunderts beschränkt, da die automatische Texterkennung hier zuverlässiger funktioniert hat und die Texte eher
zur Nachnutzung
geeignet sind. Aus dem Gesamtkorpus haben wir einige Texte ausgewählt und mit einem selbst erstellten Skript kleine vorkommende OCR-Fehler
korrigiert. Die vorkommenden Orte haben wir automatisiert erfasst und anschließend
manuell nachkorrigiert. Diese sind auf der Karte dargestellt.
Zusätzlich haben wir den Roman Reise um die Erde in 80 Tagen (Original Le
Tour du monde en
quatre-vingts jours) von