Читать книгу Empfehlungen für die weitere Entwicklung der Wissenschaftlichen Informationsversorgung des Landes NRW - Manfred Thaller - Страница 9
2.1.4. Trend IV: Informationserschließung
ОглавлениеVon allen technischen Trends am schwierigsten abzuschätzen scheint uns die weitere Entwicklung des Semantic Web.
Einerseits sind die Argumente für die semantischen Technologien offensichtlich; nicht ohne Grund hat die Vision6 von Tim Berners-Lee, James Hendler and Ora Lassila berechtigten Einfluss entwickelt. Andererseits ist diese Vision mittlerweile zehn Jahre alt und es ist äußerst mühsam festzustellen, welche reale Bedeutung sie tatsächlich hat. Im Vergleich dazu: Das Konzept des WWW wurde von Tim Berners-Lee 19897 vorgelegt – und zehn Jahre später war es zwar wesentlich weniger entwickelt als heute, aber offensichtlich Realität und dabei rasend schnell immer wichtiger zu werden. In einer Antwort auf die Frage nach der realen Bedeutung des Semantic Web wird im Scientific American, der 2001 den üblicherweise als Startpunkt der öffentlichen Diskussion zitierten Aufsatz veröffentlichte, 2007 in einer Darstellung, die als so zentral galt, dass sie 2009 wieder veröffentlicht wurde, festgehalten:
„Perhaps the most visible examples, though limited in scope, are the tagging systems that have flourished on the Web. These systems include del.icio.us, Digg and the DOI system used by publishers, as well as the sets of custom tags available on social sites such as MySpace and Flickr. In these schemes, people select common terms to describe information they find or post on certain Web sites. Those efforts, in turn, enable Web programs and browsers to find and crudely understand the tagged information—such as finding all Flickr photographs of sunrises and sunsets taken along the coast of the Pacific Ocean. Yet the tags within one system do not work on the other, even when the same term, such as „expensive,” is used. As a result, these systems cannot scale up to analyze all the information on the Web.“ 8
Das ist vor allem deshalb interessant, weil Systeme wie del.icio.us, MySpace und Flickr mittlerweile als typische Web 2.0 Anwendungen gesehen werden – und das Web 2.0 beschreibt eben jene Entwicklungen, die das WWW zwischen 2001 und 2011 tatsächlich genommen hat, nicht die, die von der Vision des Semantic Web vorgesehen waren. Es ist aber auch deshalb interessant, weil diese Tagging Systeme – die zwar Semantic Web Konzepte und Datenstandards nutzen, aber ohne weiteres auch mit anderen Datenformaten hätten realisiert werden können – das unseres Erachtens zentrale Problem des Semantic Web ansprechen: Die Gewinnung der semantischen Kategorisierung für Inhalte.
Die Semantic Web Community, weite Teile der Information Retrieval Forschung älterer Schule und Teile der bibliothekarischen Community haben einen Ansatz gemeinsam: Sie gehen davon aus, dass Systeme wie die Google Suchmaschine schlecht funktionieren und deshalb durch einen besseren Ansatz ersetzt werden müssten. Bei Betrachtung von Teilen der Diskussion gewinnt man den Eindruck, dass hier eine gewisse Blindheit vorliegt – Google befriedigt die Informationsbedürfnisse einer großen Zahl von Nutzern und weitreichende Strategien darauf auf zu bauen, dass dies nicht so sei, ist für den neutralen Beobachter zumindest ein wenig weltfremd; bestenfalls scheint sie stark ideologisch geprägt, weil sie den Erfolg der Google-Suchmaschine als einen Angriff auf als fundamental angesehene Wahrheiten betrachtet.
Unseres Erachtens verdeckt dieser ideologische Widerstand die wesentliche, aus dem Erfolg der Google Suchmaschine abzuleitende Erkenntnis: Ihr Erfolg ist, mindestens in den frühen, gut dokumentierten, Versionen, ein Resultat der ihr zu Grunde liegenden Algorithmen. Das Semantic Web basiert in hohem Maße auf einer Beschreibung der zu seiner Realisierung notwendigen Datenstrukturen – bzw. der in ihnen enthaltenen Metainformationen. Anders ausgedrückt: Googles Suchmaschine setzt eine erhebliche Rechenleistung voraus; das Semantic Web, nach dem derzeitigen Stand der Entwicklung, eine große Anzahl von Inhaltsspezialisten, die die notwendigen Erschliessungsinformationen auf Grund menschlicher intellektueller Analyse eintippen.
Unsere Ambivalenz dem Semantic Web gegenüber beruht genau auf diesem Zwiespalt: Wenn, aber nur wenn, es gelingt, innerhalb der Semantic Web Forschung einen wesentlich größeren Anteil der Ressourcen auf die algorithmische Gewinnung von Metadaten aus vorliegenden Rohdaten einerseits und auf die algorithmische Anwendung komplexer Regelsysteme andererseits zu verlagern, ist das Bündel unter dieser Bezeichnung zusammengefasster Ansätze von sehr hoher Signifikanz für die Zukunft. Bleibt es beim bisherigen Zustand, so werden die Knowledge Worker des Semantic Web wohl den gleichen Weg gehen, wie die Knowledge Engineers der Ära der Expertensysteme, die sich ja mit genau der gleichen Aufgabe – der manuellen Eingabe von Kategorisierungen – beschäftigt haben.
Die Informationsversorgung der Hochschulen könnte diese technische Entscheidung im Prinzip gelassen abwarten. In der Praxis ist sie allerdings in hohem Maße von dem oben beschriebenen unerfreulichen Schwebezustand betroffen. Die Erschließung von Inhalten ist in den Bibliotheken im Allgemeinen und den wissenschaftlichen Bibliotheken im Besonderen ein wesentlicher konstituierender Bestandteil des Berufsbildes und der institutionellen Strategie. Dies betrifft einerseits die Formalkatalogisierung, andererseits aber auch die inhaltlich / intellektuelle Erschließung im Sinne der Regeln für den Schlagwortkatalog9 (RSWK). In den dieser Studie zu Grunde liegenden Interviews ist es uns nicht gelungen einen Leitenden Bibliotheksdirektor zu finden, der die Katalogisierung nach RSWK als sinnvoll betrachtet hätte. Gleiches gilt für Leitende Bibliotheksdirektorinnen. Trotzdem fließen in diese Tätigkeit nicht unerhebliche Ressourcen.
Dies vermittelt insgesamt den Eindruck, dass die Erstellung von Erschließungsinformationen innerhalb des Bibliothekswesens der Hochschulen sich in vieler Hinsicht verselbständigt hat und als selbstverständliche und nicht mehr hinterfragenswerte Tätigkeit wahr genommen wird.
In diesem Kontext halten wir bestimmte Möglichkeiten der Rezeption des Semantic Web für nachgerade gefährlich. Wie erwähnt setzt es in hohem Maße voraus, dass erschließende Information von Hand eingegeben werden, also genau das, was die bibliothekarische Tätigkeit seit jeher in hohem Maße geprägt hat. Durch recht oberflächliche Anpassungen von Eingabeformen und Formen der Datenspeicherung kann dadurch der Eindruck entstehen, dass bestehende Tätigkeitsfelder in Wirklichkeit ungemein zukunftsträchtig seien, da sie ja einer im Zentrum der Debatte stehenden Technologie zuarbeiten würden. Dass das Eingeben von Kategorien in Erfassungssysteme keinerlei technisches Verständnis der verwendeten Systeme erfordert, führt gleichzeitig zur gefährlichen Situation, dass Personen ohne jedes technische Verständnis über ihre Kenntnisse „des Semantic Web“ leicht zu offensichtlichen Kandidaten für Positionen werden können, die für technische Weichenstellungen verantwortlich sind.
Zusammenfassende These: Die Nutzung im Umfeld des Semantic Web entstandener einzelner Technologien wird als selbstverständlich vorausgesetzt werden; als übergreifende Vision wird das Semantic Web jedoch durch andere Konzepte abgelöst werden.