Suchhilfe für Informationssysteme und Suchmaschinen
Claus-Peter Rückemann 01. Jun. 2003
Kurzfassung:
Die inhaltsbezogene Unterstützung des Nutzers bei der Recherche bzw. Suche,
mit Informationssystemen wie mit Suchmaschinen, Datenbanken oder
Expertensystemen ist eine komplexe
Aufgabe, die im Hintergrund einigen Aufwand erfordert.
Neben verschiedenen Möglichkeiten, die an anderen Stellen
diskutiert wurden ([1],
[2],
[3],
[4]), wird hier kurz und exemplarisch ein
Ablauf für die Nutzung von Thesauri zur Bereitstellung von
Suchvorschlägen vorgestellt.
Folgende Übersicht beschreibt eine einfache Nutzung von Thesauri
mit einem Informationssystem (Suchmaschine, Recherchesystem, ...)
von der Suchanfrage bis zur Rückgabe von Vorschlägen für die Suche.
Abbildung: Informationssystem mit Suchmaschine und Unterstützung durch Thesauri und andere optionale Methoden
Um eine Datenbank für den beschriebenen Zweck effizient zu nutzen, muß eine vereinheitlichte
Begriffswelt zur Beschreibung der Relationen, Attribute
usw. aufgebaut werden.
Ein solcher Thesaurus bildet meist eine fachübergreifende
Datenbank, die insbesondere die Aufgaben erfüllt,
verfügbare Begriffe zur Beschreibung und Dokumentation
festzulegen.
Die Begriffe können so von den eigentlichen Sachdaten getrennt und
in Begriffslisten vorgehalten werden. Die Thesaurusdatenbank
liefert damit Kürzel, die unabhängig von der Strukturierung
der Begriffe sind.
Für Überarbeitungen müssen bei definierten Sachdaten in der Regel
nur die Kürzel überarbeitet werden.
In Fällen, in denen auf unabhängig gepflegte, variable Sachdaten
zugegriffen wird, kann auf die Organisation der Sachdaten
im Extremfall (z.B. Daten aus dem WWW) kein Einfluß
genommen werden.
Einfache Begriffsliste:
Die Begriffe sind gleichwertig.
Sortierte Begriffsliste:
Die Begriffe haben eine logische innere Ordnung.
Diese Ordnung kann bestimmte Eigenschaften wiedergeben.
Hierarchische Begriffsliste:
Die Begriffe in der hierarchisch
übergeordnete Ebene stellen beispielsweise Überbegriffe
(,,Vater-Begriffe``) dar.
Jeder Begriff ist genau einem Überbegriff zugeordnet.
Netzartige Begriffsliste:
Die Begriffe sind ähnliche wie
in hierarchischen Begriffslisten geordnet, jedoch kann jeder Begriff
mehreren Überbegriffen zugeordnet werden.
Kombination einer sortierten und gleichzeitig hierarchischen Begriffsliste:
Die Begriffe sind hierarchisch geordnet, mit Sortierungen in den Ebenen.
Kombination einer sortierten und gleichzeitig netzartigen Begriffsliste:
Die Begriffe sind in einer netzartigen Begriffsliste geordnet, mit Sortierung
in den Ebenen.
Sowohl die Strukturierung, als auch die Erstellung von Begriffslisten
ist abhängig vom Blickwinkel.
In allen Fällen muß je nach Verwendungszweck mit den beteiligten
Fachgruppen und Primärnutzern die jeweils beste oder am besten
geeignete Lösung gesucht,
erstellt und fortlaufend gepflegt werden.
Daten zu Bearbeitungen, Datum, Bearbeiter usw. sollten detailiert und
kontinuierlich erfaßt werden.
Beispiele für Begriffslisten und deren Nutzbarkeit für die Verwendung mit
Suchmaschinen (* inhaltlicher Pluspunkt, + methodisch-umsetzungstechnischer Pluspunkt):
*
++++
Einfache Begriffsliste
**
+++
Sortierte Begriffsliste
***
++
Hierarchische Begriffsliste
***
++
Netzartige Begriffsliste (Netzwerk von Begriffen)
****
+
Kombinationen einer sortierten und gleichzeitig hierarchischen Begriffsliste
****
+
Kombinationen einer sortierten und gleichzeitig netzartigen Begriffsliste
Daraus läßt sich schlußfolgern, daß es allein schon
in dieser Hinsicht
- wie bei den meisten Problemen dieser Art - keine optimale
Lösung gibt, sondern daß zwischen Aufwand bei der Umsetzung und
Aufwand für den Nutzer (z.B. über Menüs geführte Recherche) abzuwägen ist.
Es ist eine fast vollständige Automatisierung bezüglich des
Abfragevorgangs notwendig.
Das Problem von Mehrfachbedeutungen ist durch
vollständige Automatisierung allein nicht zu beheben.
HTTP ist kein ,,Gedächtnisprotokoll`` wie z.B. das
GLTP (Geographic Locator Transfer Protocol) für räumliche Informationssysteme.
Informationen aus möglicherweise zusammenhängenden Nutzungsvorgängen stehen
so für sich (Datenschutz).
Es gibt bei öffentlichen zugänglichen Informationssystemen und Suchmaschinen
in der Regel keinen suchtechnisch privilegierten Nutzerkreis. Die Abstimmung auf bestimmte
Präferenzen der Nutzer ist so sehr schwierig.
Der Datenschutz für den Nutzer sollte
(zumindest bezogen auf den öffentlichen Einsatz und Betrieb) oberste Priorität haben.
Es ist ein sensibler Umgang bezüglich der Aktivitäten und Kooperationen
erforderlich.
Konsequenzen für Vorschläge können sich insbesondere ergeben aus
der Kopplung der Thesauri,
der Reduzierung der inhaltlichen Konsistenzen durch fehlende Zusatzinformationen,
dem Aufwand für Pflege und Expertenwissen für Verbreiterung, Vertiefung
und Strukturierung der Themengebiete aber beispielsweise
auch aus den exemplarisch beschriebenen Anforderungen für den
Betrieb von Informationssystemen.