Suchhilfe für Informationssysteme und Suchmaschinen

Claus-Peter Rückemann
01. Jun. 2003


Kurzfassung: Die inhaltsbezogene Unterstützung des Nutzers bei der Recherche bzw. Suche, mit Informationssystemen wie mit Suchmaschinen, Datenbanken oder Expertensystemen ist eine komplexe Aufgabe, die im Hintergrund einigen Aufwand erfordert. Neben verschiedenen Möglichkeiten, die an anderen Stellen diskutiert wurden ([1], [2], [3], [4]), wird hier kurz und exemplarisch ein Ablauf für die Nutzung von Thesauri zur Bereitstellung von Suchvorschlägen vorgestellt.

Inhalt

 

Zusammenspiel Informationssystem - optionale Methoden

Übersicht zum Ablauf

Folgende Übersicht beschreibt eine einfache Nutzung von Thesauri mit einem Informationssystem (Suchmaschine, Recherchesystem, ...) von der Suchanfrage bis zur Rückgabe von Vorschlägen für die Suche.

Informationssystem mit Suchmaschine und Unterstützung durch Thesauri und andere optionale Methoden

 
 

Abbildung: Informationssystem mit Suchmaschine und Unterstützung durch Thesauri und andere optionale Methoden

Ablauf

Die wesentlichen Schritte können folgendermaßen zusammengefaßt werden:

  1. Suchanfrage, Übermittlung von Daten (u.a. Suchbegriffe) mittels eines Klienten an die Suchmaschine.
  2. Verarbeitung, Filterung, Aufbereitung der Anfrage und Abarbeitung damit verbundener Prozesse für die Bearbeitung der Suchanfrage.
  3. Ermittlung und Aufbereitung der Ergebnismenge (Daten aus dem WWW, Datenbanken, usw.).
  4. Übermittlung bestimmter, ausgewählter Daten (Suchbegriffe) an die Thesauri-Schnittstelle.
  5. Verarbeitung der Suchbegriffe auf der Thesauri-Seite.
  6. Ermittlung der geeigneten Thesauri-Daten (Sachdaten, Objektdaten, Namen, ...), und Übermittlung an die Suchmaschine.
  7. Verarbeitung, Filterung, Aufbereitung der Thesauri-Daten und Integration in die Ergebnismenge.
  8. Übermittlung der Ergebnismenge mit den unterstützenden Daten (Thesauri-Daten, ...) an den Nutzer.

Anforderungen aus dem Blickwinkel der Suchmaschine

 

Datenbank und Begriffslisten

Um eine Datenbank für den beschriebenen Zweck effizient zu nutzen, muß eine vereinheitlichte Begriffswelt zur Beschreibung der Relationen, Attribute usw. aufgebaut werden.

Ein solcher Thesaurus bildet meist eine fachübergreifende Datenbank, die insbesondere die Aufgaben erfüllt, verfügbare Begriffe zur Beschreibung und Dokumentation festzulegen.

Die Begriffe können so von den eigentlichen Sachdaten getrennt und in Begriffslisten vorgehalten werden. Die Thesaurusdatenbank liefert damit Kürzel, die unabhängig von der Strukturierung der Begriffe sind.

Für Überarbeitungen müssen bei definierten Sachdaten in der Regel nur die Kürzel überarbeitet werden.

In Fällen, in denen auf unabhängig gepflegte, variable Sachdaten zugegriffen wird, kann auf die Organisation der Sachdaten im Extremfall (z.B. Daten aus dem WWW) kein Einfluß genommen werden.

Einfache Begriffsliste:
Die Begriffe sind gleichwertig.
Sortierte Begriffsliste:
Die Begriffe haben eine logische innere Ordnung. Diese Ordnung kann bestimmte Eigenschaften wiedergeben.
Hierarchische Begriffsliste:
Die Begriffe in der hierarchisch übergeordnete Ebene stellen beispielsweise Überbegriffe (,,Vater-Begriffe``) dar. Jeder Begriff ist genau einem Überbegriff zugeordnet.
Netzartige Begriffsliste:
Die Begriffe sind ähnliche wie in hierarchischen Begriffslisten geordnet, jedoch kann jeder Begriff mehreren Überbegriffen zugeordnet werden.
Kombination einer sortierten und gleichzeitig hierarchischen Begriffsliste:
Die Begriffe sind hierarchisch geordnet, mit Sortierungen in den Ebenen.
Kombination einer sortierten und gleichzeitig netzartigen Begriffsliste:
Die Begriffe sind in einer netzartigen Begriffsliste geordnet, mit Sortierung in den Ebenen.

Sowohl die Strukturierung, als auch die Erstellung von Begriffslisten ist abhängig vom Blickwinkel. In allen Fällen muß je nach Verwendungszweck mit den beteiligten Fachgruppen und Primärnutzern die jeweils beste oder am besten geeignete Lösung gesucht, erstellt und fortlaufend gepflegt werden. Daten zu Bearbeitungen, Datum, Bearbeiter usw. sollten detailiert und kontinuierlich erfaßt werden.

Beispiele für Begriffslisten und deren Nutzbarkeit für die Verwendung mit Suchmaschinen (* inhaltlicher Pluspunkt, + methodisch-umsetzungstechnischer Pluspunkt):

* ++++ Einfache Begriffsliste
** +++ Sortierte Begriffsliste
*** ++ Hierarchische Begriffsliste
*** ++ Netzartige Begriffsliste (Netzwerk von Begriffen)
**** + Kombinationen einer sortierten und gleichzeitig hierarchischen Begriffsliste
**** + Kombinationen einer sortierten und gleichzeitig netzartigen Begriffsliste

Daraus läßt sich schlußfolgern, daß es allein schon in dieser Hinsicht - wie bei den meisten Problemen dieser Art - keine optimale Lösung gibt, sondern daß zwischen Aufwand bei der Umsetzung und Aufwand für den Nutzer (z.B. über Menüs geführte Recherche) abzuwägen ist.

Einschränkungen für die Nutzbarkeit der optionalen Methoden

Konsequenzen für Vorschläge können sich insbesondere ergeben aus der Kopplung der Thesauri, der Reduzierung der inhaltlichen Konsistenzen durch fehlende Zusatzinformationen, dem Aufwand für Pflege und Expertenwissen für Verbreiterung, Vertiefung und Strukturierung der Themengebiete aber beispielsweise auch aus den exemplarisch beschriebenen Anforderungen für den Betrieb von Informationssystemen.

Literatur

1
Rückemann, C.-P.: Informationssysteme und Thesauri. [Internet], 2003. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2003/informationssysteme/informationssysteme.html (Text).

2
Rückemann, C.-P.: Thesaurus-Unterstützung für Informationssysteme. [Internet], 2003. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2003/thesaurus (Text), URL: http://metager.de/index0-thesaurus.

3
Rückemann, C.-P.: Phonetische Algorithmen zu komparativen Zwecken am Beispiel des phonetischen Komparators für Informationssysteme. [Internet], 2002. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2002/phokom (Text), URL: http://jserv.rrzn.uni-hannover.de/meta/cgi-bin/cprsndx_eqkatll.sh?rueckemann+forschung.

4
Rückemann, C.-P.: Kategorien-Lexika zur Nutzung mit Informationssystemen. [Internet], 2002. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2002/katlex (Text).


© 2003 Dr. Claus-Peter Rückemann, RRZN Hannover / E-Mail [--] / Tel. [--]
vi betrieben.
Letzte Änderung: So, 01. Jun. 2003, 20:27:36 MEZ