BII Stories

Stipendiatenberichte und Neuigkeiten von Bibliothek & Information International

Transforming Libraries with Open Digital Technologies – IT Satellite Meeting in Stellenbosch, Tag 1

Ein Kommentar

Am 13.-14. August organisierte die IT-Sektion in Zusammenarbeit mit der UB Stellenbosch ein Satellite Meeting zum Thema „Transforming Libraries with Open Digital Technologies“. Die Verwendung von Open Source Software (OSS) wird allgemein als eine attraktive Alternative für z. B. Bibliotheken in Entwicklungsländern gesehen, die nicht die Lizenzgebühr für kommerzielle Systeme bezahlen können, oder sonst für Bibliotheken, die mit kleinem Budget operieren müssen. Da inzwischen einige afrikanische Bibliotheken OSS für verschiedene Aufgaben einsetzen, sollte das Satellite Meeting die Gelegenheit geben, über Vor- und Nachteile, über Erfahrungen bei der Implementierung und über verschidene Einsatzgebieten für OSS i Bibliotheken ins Gespräch zu kommen.

Der Eingang zu STIAS in Stellenbosch Am ersten Tag fanden drei Workshops statt: eins über OSS für Big Data (den ich besuchte), eins über den Einsatz von DSpace für Institutional Repositories sowie eins über Forschungsmethoden und -werkzeuge für digitale Bibliotheken. Der Workshop über Big Data fand im Stellenbosch Institut for Advanced Studies (STIAS) statt (es füllte mich mit etwas schwedischen Nationalstolz zu sehen, dass es von der Wallenberg-Stiftung gefördert worden ist). Referent war Kia Siang Hock vom NLB Singapore geleitet, und allein die Herkunft des Referenten zeigt, dass die Verwendung von OSS in Bibliotheken nicht nur eine Frage des zur Verfügung stehenden Budgets ist, sondern dass auch große Bibliotheken gezielt offene Software einsetzen, um bestimmte Aufgaben zu lösen. Der Fokus des Tutorials war auch nicht, theoretische Grundlagen zu vermitteln, sondern anhand von konkreten Einsatzscenarien zu zeigen, wie sie in Singapore verschiedene Werkzeuge für Datenanalys einsetzen, um den Bibliotheksanwendern einen Mehrwert zu bieten.

Obwohl Big Data aktuell zu den Buzzwords der IT gehört, gibt es keine allgemein akzeptierte Definition dafür. Es gibt aber Konsens darüber, dass es um Datenmengen geht, die zu groß sind, als dass man sie mit Standardwerkzeugen hantieren, speichern und analysieren kann, und dass eine wichtige Aufgabe ist, Muster zu finden, um daraus Entscheidungen für die Zukunft zu treffen. In vielen Fällen wird Big Data durch die vier V:s definiert: Volume (große Mengen), Velocity (z. B. Echtzeitinformation von Sensoren), Variety (speist sich aus vielen Quellen, oft heterogen) und Veracity (wie sicher sind die Aussagen der Daten). Diesen vier V:s fügte Siang Hock ein fünftes hinzu: Value (Rolle von Big Data im Wertschöpfungsprozess).

Das Ziel, dass der NLB bei seinen Big Data-Aktivitäten verfolgt, ist „die verborgenen Schätze zu bergen,“ und damit eine Datengrundlage für Bibliotheksplanung (Gebäude und Bestände) und Serviceoptimierung zu schaffen. Anwendungsfälle, wo die NBL Potenzial für Big Data-Analysen sieht, sind z. B.:

  • Schaffen von Benutzerprofilen, um die Nutzung der Bibliotheksräume zu optimieren (wobei sie auch Videoaufnahmen der Bibliothekseingänge verwenden, um z. B. Geschlecht und Alter der Besucher herauszufinden),
  • kombinierte Auswertung von Suchbegriffen und Topics in social Media, um Lücken in den Sammlungen und neue Trends zu erkennen,
  • Analyse von z. B. Bildern, um Suche von nicht-Textdokumenten zu ermöglichen.

Von vielen Seiten kam bei diesen Beispielen die Frage, ob es z. B. bei der Videoauswertung keine datenschutzrechtlichen Bedenken gäbe. Die Antwort fiel pragmatisch aus: Da es sich nicht um die Identifikation von einzelnen Personen handele, sondern nur um die Analyse bestimmter Merkmale wie Alter und Geschlecht und die Aufnahmen nicht gespeichert werden, sei es kein Problem. Es war deutlich, dass dies den meisten Europäern wie auch den Kolleginnen und Kollegen aus z. B. Südafrika nicht ausreichte, während andere Teilnehmer die Frage in den Raum stellten, ob man nicht Bibliotheken als „sichere Institutionen“ klassifizieren und ihnen solche Analysen erlauben sollte, da davon auszugehen wäre, dass Bibliothekare grundsätzlich daran interessiert wären, die Daten ihrer Nutzer zu schützen.

Kia Siang Hock erläutert die Funktion des Recommender-Systems Beispiele für Anwendungsszenarien, bei denen die NLB Big Data-Analysen durchführt, sind vielfältig. Zu den einfacheren Anwendungen gehört die Implementierung eines Recommender-Systems (Benutzer, die dieses Buch ausliehen, liehen auch folgende Bücher aus). Hier reicht eine einfache Datenbanktabelle, die für jede Ausleihe die BenutzerID und die ID des Medienwerkes speichert; eine SQL-Abfrage stellt dann die gewünschte Information zusammen. Komplexer wird es bei der Analyse von unstrukturiertem Text mit dem Ziel, ähnliche Dokumente zu finden. Die NLB hat hier erfolgreich z. B. ihre digitalisierten Zeitungen und die Singapore Infopedia analysiert und stellt für jeden Artikel eine Liste von Links zu ähnlichen Artikeln zur Verfügung. Technisch basiert die Umsetzung auf Apache Mahout, einem Framework für maschinelles Lernen und Textanalyse, das die NLB seit 2013 in Produktion einsetzt.

Weitere Open Source Analysesoftware, die für Bibliotheken interessant sein könnte, sind der N-Gram Viewer Bookworm, die Software Gate (General Architecture for Text Engineering) bzw. Annie (a Nearly-New Information Extraction System) von der Universität Sheffield für die Analyse von natürlicher Sprache, sowie OpenCV, eine Software die u. a. als Basis für eine Bildsuchmaschine fungieren kann.

Die Beispiele, die Siang Hock während des Workshops präsentierte, zeigten deutlich, dass der Einsatz von OSS für die Analyse von Big Data von strategischer Bedeutung sein kann und sowohl verbesserte Funktionalität für die Endnutzer, als auch Entscheidungsgrundlagen für Bibliotheksplanung liefern kann. Gerade die kombinierte Analyse personenbezogener Daten birgt aber datenschutzbedenkliche Gefahren, die bei der Planung vom Einsatz berücksichtigt werden müssen, aber das gilt ja nicht nur bei Big Data.

Advertisements

Ein Kommentar zu “Transforming Libraries with Open Digital Technologies – IT Satellite Meeting in Stellenbosch, Tag 1

  1. Pingback: Gründungstreffen der Big Data Special Interest Group | BII Stories

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s