Einleitung

Bausteine des Projekts

Das Projekt “Open Culture in Wikidata” handelt von Datenarbeit mittels Wikidata, Wikiversity, Datentabellen und Open Refine. Unterstützung bei bestimmten Projektaufgaben hatten wir von externen Mitarbeitern der TIB Hannover mit einer starken Anbindung an das Open Science Lab des TIBs.

Wir sind eine Gruppe von Studenten und Studentinnen (13 Personen), die ihre bisher erworbenen Skills in dem Projekt vertiefen und anwenden konnten. Dies betrifft insbesondere Data Science und Projektmanagement. Die größte Herausforderung betraf die virtuellen Treffen und die damit verbundene Zusammenarbeit. Da man leider nicht in Präsenz miteinander zusammenarbeiten konnte, war es schwierig nachzuverfolgen, wer auf welchem Stand ist und welche Probleme auftreten.

Die Besonderheiten des Projektes waren:

  • Die offene und kollaborative Arbeit unter den Studierenden und den Projektleitern
  • Strukturierung der Daten, die eine Auswertung der Daten ermöglicht
  • Erweiterung der eigenen Skills in den Bereichen Linked Data oder Tools wie Open Refine 
  • Sichtbarkeit der Projektergebnisse bereits während des Projekts z.B. auf Twitter

Dieses Projekt hat mit ersten Eintragungen von Orten des Gestapoterrors in Niedersachsen begonnen. Dazu wurde der niedersächsische Denkmalatlas als Grundlage genutzt. Der niedersächsische Denkmalatlas stellt ein Portal dar, in welchem man Kultur-, Boden und Kunstdenkmäler über eine Suchfunktion suchen & finden kann.

Die Denkmäler wurden in der Wissensdatenbank Wikidata eingetragen & die dazu benötigten Kenntnisse & Schritte wurden in Wikiversity, ein Zentrum für die Erstellung & Nutzung kostenloser Tutorials & Lernmaterialen, dokumentiert.

In einem Letzten Schritt wurde das Element OpenRefine eingebaut. Mit dieser Desktop Anwendung ließen sich die für das Projekt genutzten Daten bereinigen, standardisieren & einfacher verarbeiten.

Folgende Aufgaben und Resultate wurden im Projekt erzielt:

  • Ergänzung von Informationen zu historischen Orten und Denkmälern in Niedersachsen in Wikidata
    • Integration von Wikidata mit vorhandenen Datenquellen, z.B. Denkmalatlas
    • Integration historischer Datenquellen ( “Orte des Gestapoterrors” (OGT)-Projekt)
  • Vebesserung der eigenen Vorgehensweise durch Ausprobieren sowie Dokumentation des Handbuchs auf Wikiversity. Dies hilft dabei weitere Zielgruppen (z.B. Jugendliche, didaktisches Personal in Gedenkstätten) leichter in die Weiterentwicklung des offenen Wissens-Netzwerks einzubeziehen.

Das 2013 gegründete Open Science Lab unterstützt Forschung, Lehre und Lernen, das das Internet als Raum nutzt – vom Posten von Fragen und Ideen bis hin zur Online-Zusammenarbeit und Open-Access-Publishing.
Im Open Science Lab zeigen wir, wie digitale Sammlungen geöffnet und vernetzt werden können, um Inhalte besser zu entdecken, zu nutzen und zu verlinken. OSL-Mitarbeiter vermitteln solche Ansätze in Lehraufträgen, Konferenzen, Workshops, im Mentoring oder agile Methoden wie „Sprints of“. 

Das Open Science Lab zeigt, wie Bestände digitaler Objekte geöffnet und vernetzt besser genutzt und verknüpft werden können. Die Digitalisierung bietet die große Chance, Wissenschaftler und Entdeckungen für alle zugänglich zu machen. Damit soll die Qualität der Forschung gesteigert, die Wissenschaft gefördert und der gesellschaftliche Nutzen gefördert werden. Das Open Science Lab der TIB – Leibniz-Informationszentrum und Naturwissenschaften und Universitätsbibliothek Hannover unterstützt Wissenschaftlerinnen und Wissenschaftler, die das Internet als öffentlichen Raum zum Lehren und Lernen nutzen, und initiiert junge Menschen wissenschaftliche Ansätze. Die TIB ist die Universitätsbibliothek des Leibniz Hannover.

Autoren: Sofinias Terefework, Ilknur, Julia Solohub

 

Wikidata

Wikidata ist eine frei bearbeitbare Wissensdatenbank. Das Projekt wurde von Wikimedia Deutschland gestartet und stellt als gemeinsame Quelle bestimmte Datentypen für Wikimedia-Projekte bereit, zum Beispiel Geburtsdaten oder sonstige allgemeingültige Daten, die in allen Artikeln der Wikimedia-Projekte verwendet werden können.
Dort haben wir als Gruppe nach diversen Beiträgen in der Suchleiste gesucht, um diese zu bearbeiten, oder neue Beiträge zu unseren ausgewählten Denkmälern angefertigt. Ist kein Betrag zu einem Denkmal vorhanden, haben wir ein neues Datenobjekt erstellt. Dazu war der Eintrag zur Bezeichnung, Beschreibung und ggf. Aliasse wichtig, um das Datenobjekt einzutragen.
Nach erfolgreichem Erstellen des Eintrags, wird eine neue Seite erstellt, in der wir diverse Items hinzugefügt haben und diese mit Statements bzw. Aussagen befüllt haben. Hilfreich waren zum einen im Denkmalatlas vorhandene Referenzen und zum anderen seriöse Quellen, die dazu dienen dem Beitrag die nötige Referenz und Seriösität zu geben.
Abschließend konnten wir die Beiträge veröffentlichen und für die Gemeinschaft in Wikidata zugänglich machen.

Wikidata Einleitung

Denkmalatlas

Unter dem sogeannten „Denkmalatlas Niedersachsen“ versteht man ein Internet-Portal, welches Kulturdenkmale aus der Bau- und Kunstdenkmalpflege sowie obertägige archäologische Bodendenkmale in Niedersachsen darstellt.
Dabei werden die Denkmäler auf einer Landkarte mit hinterlegten Detailinformationen dargestellt. Online ging das Portal mit einer Beta-Version im Januar 2020 und soll nach einem Ausbau im Jahr 2023 über 120.000 Denkmale beinhalten. Es wurde vom Niedersächsischen Landesamt für Denkmalpflege umgesetzt.
Bei der Suche nach Denkmälern, konnten wir diese auf der Onlineseite suchen, in dem wir die Stadt und den Denkmaltypen in die Suche eingegeben haben:

Als Ergebnisse sind alle Denkmäler in der gesuchten Ortschaft aufgeführt worden. Klickt man einen Beitrag zu einem Denkmal an, sind dort folgende Merkmale aufgelistet:
Gemeinde, Gemarkung, Orts-/Stadtteil/Lage, Adresse, Objekttyp, Baujahr von-bis, Denkmalstatus, Bedeutung, im Denkmalverzeichnis, Objekt-ID und Nummer, Fachbereich, Beschreibung, Denkmalgründung und die Literatur.
Besonders wichtig war dabei die Objekt-ID, die als Verifizierung in Wikidata gilt.

Denkmalatlas

Orte des Gestapoterrors

Die Orte des Gestapoterrors im heutigen Niedersachsen sind Teil eines Projektes von Studierenden der Hochschule Hannover im Sommersemester 2021. Hierbei wird der Zweck verfolgt, die Verbrechen der Gestapo strukturiert und digital verfügbar zu machen und damit verbunden einen Teil zur Erinnerungskultur beizutragen.

Autoren: Deniz Göker, Alexander Markov

RDF Quickstatements

Über Quickstatements haben wir Einträge und deren Aussagen, Bezeichnungen, Beschreibungen in Wikidata schneller über simple Befehle erstellt oder geändert. Mithilfe des Tools lassen sich Quickstatements generieren. Dafür haben wir eine bestimme Syntax verwendet.

Die Seite Quickstatements lasst sich über folgende URL abrufen: https://quickstatements.toolforge.org/#/

Der Aufbau des Tools ist einfach und sofort zu überschauen, und in verschiedenen Sprachen verfügbar.

Im Tool haben wir einen neuen Stapel erstellt.

Im Bearbeitungsfeld haben wir zuerst das zu bearbeitende Item eingegeben, und anschließend die zu bearbeitende Property eingegeben, und am Ende den Wert eingegeben, der geändert werden soll.

Alle Bausteine werden mithilfe eines senkrechten Strich “|” getrennt. Einen Namen für den Stapel haben wir ebenfalls eingefügt. Anschließend haben wir den Bearbeitungsprozesse über Quickstatements gestartet.  Im Anschluss wird der Status des Befehls angezeigt. Danach haben wir im Eintrag überprüft ob die Änderungen vorgenommen wurden sind.

SPARQL-Query

SPARQL ist eine Abfragesprache für RDF. Diese nutzten wir, um nach bestimmten Ergebnissen in Wikidata zu suchen und zu filtern. Ein Beispiel hierfür wären alle Denkmäler aus dem Denkmalatlas Niedersachsen im Umkreis die maximal eine Entfernung von 100 km von Hannover haben zu finden. Somit konnte man die Ergebnisse visuell darstellen. In dem genannten Beispiel haben wir die Orte auf einer Karte dargestellt. Damit wir die Queries verfassen konnten nutzten wir zwei Tools: Wikidata Query Service and Wikidata Query Builder. Bei beiden Tools wurden Hilfestellungen angeboten, die einer Person, die nie mit SPARQL gearbeitet hat, beim Schreiben einer Suchanfrage helfen kann. 

Autorin: Julia Solohub

Wikiversity

“Handbuch Wikidata” im Wikiversity

Link zum Handbuch

Wikiversity ist ein Zentrum für die Erstellung und Nutzung von kostenlosen Lernmaterialien und die Bereitstellung von Lernaktivität Wikiversity ist eines von vielen Wikis, die in Bildungskontexten verwendet werden, sowie viele Initiativen, die freie und offene Bildungsressourcen verschaffen.
Die primären Prioritäten und Ziele von Wikiversity sind:

  • das Erstellen und Hosten einer Reihe von kostenlosen Inhalten,
  • mehrsprachigen Lernmaterialien/Ressourcen für alle Altersgruppen in allen Sprachen,
  • wissenschaftlichen/Lernprojekten und Gemeinschaften, die diese Materialien unterstützen.

Konzeption

Erstellt haben wir im Laufe des Projekts ein Handbuch für das Wikidata im Wikiversity, welches durch praktische Anwendungen und Erfahrung zustande gekommen ist. Ziel dieses Handbuch-Eintrags ist, eine übersichtliche Zusammenstellung der Erfahrungen im Wikidata-Projekt zu verschaffen und zugleich als Nachschlagwerk zu dienen. Anhand von Screenshots und Links gestalteten wir dieses Handbuch.
Unterteilt haben wir das Handbuch Wikidata in 9 Kapitel.

In dem ersten Abschnitt der Einleitung berichten wir zunächst über Wikidata im Allgemeinen und bringen die Ziele näher. In Kapitel 2 befassen wir uns mit praktischen Erfahrungen aus dem Projekt, wie zum Beispiel Objekte gesucht und erstellt werden. Weiterhin beschäftigten wir uns im dritten Kapitel mit den Funktionen und Definitionen des Begriffs „Item“ und wie man dieses anlegt. Daraufhin werden die Bearbeitungen von „Statements/Aussagen“, „Qualifikatoren“ sowie „References“ Schritt für Schritt anhand von Screenshots und Beispielen erläutert. Anschließend legen wir in Kapitel 4 die sogenannten „Quickstatements“ dar und definieren die dazugehörigen Syntaxen.

Unter dem Kapitel “Mögliche Probleme oder Hinweisen” listen wir auf, inwieweit man diese lösen und bearbeiten kann. Daraufhin folgt das Kapitel “WD-Query” in dem neben den Definitionen auch Timeframe Projekte und Visualisierungen auf einer Karte im Wikidata dargelegt werden. Im vorletzten Kapitel stellen wir das Projekt in Verknüpfung mit den Orten des Gestapoterrors dar und geben Anweisungen zu unterschiedlichen Anhaltspunkten. Als letztes beschreiben wir im Abschnitt “OpenRefine” diese und führen eine Anweisung zu der Installation auf.

Handbuch

Bearbeitet und ergänzt haben wir das Handbuch dem Punkt „Bearbeiten“ oben rechts auf der Website.

Bearbeitungsfeld des Handbuchs Wikidate im Fenster mit Beispiel Befehlen zur Gestaltung der Struktur:

Buket Bayram & Elif Celik

OpenRefine

Definition

OpenRefine ist eine Desktop Anwendung, die den Webbrowser als graphische Oberfläche nutzt. Mit OpenRefine kann man Daten aus einem Tabellenformat wie csv-Dateien oder tabulatorgetrennte Datein (tsv) angezeigt werden. Mit dieser Anwendung lassen sich Daten standardisieren und bereinigen. Folgende Vorteile lassen sich erschließen:

  • Überblick über den Datensatz
  • Standardisierung von Daten
  • Aufteilung in detaillierte und übersichtliche Teile
  • Vergleich von lokalen Daten mit anderen Datensätzen
  • Erweiterung des Datensatzes mit weiteren Daten aus anderen Quellen

Nähere Erläuterung zu der Definition ist in unserem Wikiversity Beitrag and librarycarpentry OpenRefine zu finden.

Aufgabenstellung und Ziele

Unsere Aufgabe war es mithilfe von OpenRefine, die Daten aus dem Denkmalatlas Niedersachsen mit den zu vergleichen, die bereits in Wikidata (mit der Property P:7900 -> Denkmalatlas Niedersachsen ID) vorhanden sind, um über RDF-Quickstatements die fehlenden Einträge in Wikidata zu ergänzen.

Vorgehensweise

Die Daten vom Denkmalatlas Niedersachsen in Form von XML-Dateien haben wir vom Projekt Coding Da Vinci heruntergeladen. Um die Daten zu vergleichen, haben wir die Adress-Spalte der Denkmalatlas-Daten mit der Wikidata-Property “Adresse” verknüpft. Dafür müssen die benötigten Datensätze in OpenRefine herausgefiltert und danach mit Wikidata-Items abgeglichen (reconciled) werden. (s. Bild x)

Bild x: Denkmalatlas-Daten in OpenRefine

Anschließend haben wir ein Schema erstellt (s. Bild x), damit Wikidata in der Lage ist die Daten einzulesen und Einträge für sie zu ergänzen oder zu erstellen.

Bild x: Wikidata-Schema in OpenRefine

Probleme/Schwierigkeiten

  • Adressen in Wikidata können unterschiedlich angelegt werden
  • Mehrere Objekte unter derselben Adresse
  • Zu viele Datensätze
    -> Sehr lange Bearbeitungszeit
    -> Computer hatte bei der Verarbeitung starke Schwierigkeiten
  • Leere Zeilen/Datensätze in der Tabelle, die wir entfernen mussten
  • Unnötige oder doppelte Spalten, unklare Bedeutung der Spalten
  • Probleme beim reconcilen
    -> Dauert durch die große Datenmenge sehr lange
    -> Mussten trotzdem manuell zu Wikidata-Items zugeordnet werden
  • Daten ließen sich nicht in das Schema reinziehen
  • Datenexport nicht möglich

Autoren: Julia Solohub, Jule von Sass, Jeanice Noraman

Fazit

Das Projekt hat insgesamt viel Spaß gemacht, weil uns viel Freiraum zur Organisation der Arbeit gegeben, sodass wir die Projektarbeit selbstständig bearbeiten konnten. Vor allem dadurch, dass die Dozenten immer über Slack erreichbar waren, konnten Probleme schnell behoben werden. Im Projekt selbst haben wir neue Plattformen und Software zur Datenbearbeitung kennengelernt, die für zukünftige Arbeitsstellen nützlich sein können. Das Wissen, das wir in unserem Informationsmanagement Studium erlangt haben, konnten wir gut anwenden und praktisch umsetzen. Des Weiteren hat die Projektarbeit ebenfalls gezeigt, wie wichtig Teamarbeit ist, um gemeinsam an Ideen zu arbeiten und beim Fortschritt voranzukommen.

Autorin: Julia Solohub