RRZN-Logo
 
Regionales Rechenzentrum für Niedersachsen, Hannover (RRZN)
 
- Informationssysteme -
 
Vom Urwald der Wörter zur strukturierten Suche ...  
Suchhilfe für Informationssysteme und Suchmaschinen

Claus-Peter Rückemann
05. Juni 2003 
25. DGI-Online-Tagung, Competence in Content/comInfo, Frankfurt a.M.


 
URL zu diesem Dokument:
http://www.unics.uni-hannover.de/cpr/x/publ/2003/beitrag  
URL zur Präsentation (PDF):
http://www.unics.uni-hannover.de/cpr/x/publ/2003/beitrag/beitrag_dgi_rueckemann.pdf  
URL RRZN:
http://www.rrzn.uni-hannover.de/  
 
Kurzfassung: 
Das Regionale Rechenzentrum für Niedersachsen (RRZN) entwickelt und betreibt seit vielen Jahren eine Reihe von verschiedenen Informationssystemen und Suchmaschinen zu unterschiedlichen Zwecken. Die inhaltsbezogene Unterstützung des Nutzers bei der Recherche bzw. Suche mit Informationssystemen, Datenbanken oder Expertensystemen und insbesondere mit Suchmaschinen und externem Datenmaterial im WWW, ist eine komplexe Aufgabe, die im Hintergrund einigen Aufwand erfordert. Neben verschiedenen Möglichkeiten, die an anderen Stellen diskutiert werden ([1], [2], [3], [4], [5]), wird hier kurz und exemplarisch die Möglichkeit für die Nutzung von Thesauri zur Bereitstellung von Suchvorschlägen vorgestellt.

Inhalt

 

Zusammenspiel Informationssystem - optionale Methoden

Übersicht zum Ablauf

Folgende Übersicht beschreibt eine einfache Nutzung von Thesauri mit einem Informationssystem (Suchmaschine, Recherchesystem, ...) von der Suchanfrage bis zur Rückgabe von Vorschlägen für die Suche.

Informationssystem mit Suchmaschine und Unterstützung durch Thesauri und andere optionale Methoden

 
 

Abbildung: Informationssystem mit Suchmaschine und Unterstützung durch Thesauri und andere optionale Methoden.

Ablauf

Die wesentlichen Schritte können folgendermaßen zusammengefaßt werden:

  1. Suchanfrage, Übermittlung von Daten (u.a. Suchbegriffe) mittels eines Klienten an die Suchmaschine.
  2. Verarbeitung, Filterung, Aufbereitung der Anfrage und Abarbeitung damit verbundener Prozesse für die Bearbeitung der Suchanfrage.
  3. Ermittlung und Aufbereitung der Ergebnismenge (Daten aus dem WWW, Datenbanken, usw.).
  4. Übermittlung bestimmter, ausgewählter Daten (Suchbegriffe) an die Thesauri-Schnittstelle.
  5. Verarbeitung der Suchbegriffe auf der Thesauri-Seite.
  6. Ermittlung der geeigneten Thesauri-Daten (Sachdaten, Objektdaten, Namen, ...), und Übermittlung an die Suchmaschine.
  7. Verarbeitung, Filterung, Aufbereitung der Thesauri-Daten und Integration in die Ergebnismenge.
  8. Übermittlung der Ergebnismenge mit den unterstützenden Daten (Thesauri-Daten, ...) an den Nutzer.

Anforderungen aus dem Blickwinkel der Suchmaschine

 

Beispiele

Integration in Ausgabeseite

Eine Unterstützung durch Suchbegriffe aus den Thesauri von Axel Springer Verlag Infopool exemplarisch integriert in die Ausgabeseite der Suchmaschine MetaGer (Live-Link) des RRZN. Alle folgenden Beispiele entstammen diesen Thesauri. Die Relationen und der Umfang wurden für den speziellen Anwendungszweck reduziert.

Ausgabeseite, Teil1  
Ausgabeseite, Teil2  
Abbildung: Ausgabeseite der Suchmaschine MetaGer des RRZN - ausnahmsweise ohne Treffer (gekürzte Montage), dafür mit Vorschlägen aus den Thesauri von ASV Infopool.

Aufrufe über eine Schnittstelle

Als Vorschläge können sehr flexibel beispielsweise Oberbegriffe zu einem Suchbegriff verwendet werden. Wenn diese nicht vorhanden sind, können Synonyme verwendet werden usw. Auf diese Weise kann die Suche auch inhaltlich breiter und flexibler gestaltet werden.

Abfrage zum Suchbegriff: stern

Synonyme: fixstern

Oberbegriffe: himmelskörper

Unterbegriffe: 18+scorpii, 1st+tw+hya+association, 51+pegasi, 55+cancri, 8405+asbolus, beta+pictoris, blue+straggler, capella, cw+leonis, delta+velorum, denis-p, eta+carinae, fg+sagittae, fomalhaut, hamburger+stern, he+107-5240, hyaden, kh+15d, mira, nova, p+cygni, pistolenstern, planetarischer+nebel, polarstern, psr+2224+65, pulsar, r+coronae+borealis, r+doradus, red+rectangle-nebel, rho+cas, roter+riese, roter+überriese, roter+zwerg, s50, sakurai, schwarzes+loch, sirius, sonne, supernova, supernova+1987a, supernova+1996x, supernova+1999am, supernova+rxj+0852.0-4622, tau+ceti, tmr-1c, v+338+ser, vla+1623, weißer+zwerg, wolf-rayet+104

verwandte-Begriffe: planet

Eigennamen-HB: stern

Eigennamen-UB: stern+tv+magazin

Objektthesaurus-HB: stern

Objektthesaurus-OB: fremdobjekt, onlinenutzung+extern, seriöse+presse

Objektthesaurus-UB: stern+tv+magazin

Abfrage zum Suchbegriff: planet

Synonyme: wandelstern

Unterbegriffe: 1999+cg9, epsilon+eridani, erde+planet, hd+141569, hr+4796a, jupiter, mars, merkur, mond, neptun, nereide, pluto, saturn, uranus, venus

verwandte-Begriffe: asteroid, komet, stern

Eigennamen-HB: planet

Eigennamen-mehrfache-HB: planet+computerpresse, planet+messe, planet+schiff

Abfrage zum Suchbegriff: versicherung

Synonyme: versicherungsgesellschaft, versicherungsleistung, versicherungsschutz

Unterbegriffe: bauleistungsversicherung, berufsunfähigkeitsversicherung, edv-versicherung, führerscheinentzugsversicherung, gebrauchtwagenversicherung, graffitiversicherung, gruppenversicherung, jagdversicherung, kinderversicherung, kraftfahrzeugversicherung, kreditversicherung, lottoversicherung, lösegeldversicherung, luft-+raumfahrtversicherung, luxusversicherung, managerversicherung, medienversicherung, patentversicherung, produktschutzversicherung, projektversicherung, rechtsschutzversicherung, reiseversicherung, rentenversicherung, reparaturkostenversicherung, rückrufkostenversicherung, rückversicherung, sachversicherung, seeversicherung, sozialversicherung, speditionsversicherung, tierversicherung, umweltversicherung, unfallversicherung, veranstaltungsversicherung, versicherungsbetrug, versicherungsfremde+leistung, vertrauensschaden-versicherung

verwandte-Begriffe: schadenersatz, schadensfall

Abfrage zum Suchbegriff: essen

Oberbegriffe: ernährung

Unterbegriffe: essgewohnheit, essstörung, essen

mehrfache-HB: bad+essen, essen+belgien, essen+nordrhein-westfalen

Abfrage zum Suchbegriff: moor

Oberbegriffe: landschaft

Unterbegriffe: flachmoor, hochmoor, torf, übergangsmoor

verwandte-Begriffe: feuchtgebiet, sumpf

Abfrage zum Suchbegriff: fenn

HB: hochmoor

Abfrage zum Suchbegriff: torf

Oberbegriffe: moor

Abfrage zum Suchbegriff: reise

Synonyme: reiseverkehr

Unterbegriffe: dienstreise, geschäftsreise, klassenfahrt, last+minute, reisebetrug, reisejournalismus, reisender, tourismus

verwandte-Begriffe: reisewelle, urlaub

Abfrage zum Suchbegriff: lob

mehrfache-HB: anerkennung

Synonyme: kompliment

Oberbegriffe: verhalten

Datenbank und Begriffslisten

Um eine Datenbank für den beschriebenen Zweck effizient zu nutzen, muß eine vereinheitlichte Begriffswelt zur Beschreibung der Relationen, Attribute usw. aufgebaut werden.

Ein solcher Thesaurus bildet meist eine fachübergreifende Datenbank, die insbesondere die Aufgaben erfüllt, verfügbare Begriffe zur Beschreibung und Dokumentation festzulegen.

Sowohl die Strukturierung, als auch die Erstellung von Begriffslisten ist abhängig vom Blickwinkel. In allen Fällen muß je nach Verwendungszweck mit den beteiligten Fachgruppen und Primärnutzern die jeweils beste oder am besten geeignete Lösung gesucht, erstellt und fortlaufend gepflegt werden. Daten zu Bearbeitungen, Datum, Bearbeiter usw. sollten detailiert und kontinuierlich erfaßt werden.

Beispiele für Begriffslisten und deren Nutzbarkeit für die Verwendung mit Suchmaschinen (* inhaltlicher Pluspunkt, + methodisch-umsetzungstechnischer Pluspunkt):

* ++++ Einfache Begriffsliste
** +++ Sortierte Begriffsliste
*** ++ Hierarchische Begriffsliste
*** ++ Netzartige Begriffsliste (Netzwerk von Begriffen)
**** + Kombinationen einer sortierten und gleichzeitig hierarchischen Begriffsliste
**** + Kombinationen einer sortierten und gleichzeitig netzartigen Begriffsliste

Daraus läßt sich schlußfolgern, daß es allein schon in dieser Hinsicht - wie bei den meisten Problemen dieser Art - keine optimale Lösung gibt, sondern daß zwischen Aufwand bei der Umsetzung und Aufwand für den Nutzer (z.B. über Menüs geführte Recherche) abzuwägen ist.

Einschränkungen für die Nutzbarkeit der optionalen Methoden

Konsequenzen für Vorschläge können sich insbesondere ergeben aus:

Literatur

1
Rückemann, C.-P.: Suchhilfe für Informationssysteme und Suchmaschinen. [Internet], 2003. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2003/suchhilfe/suchhilfe.html (Text).

2
Rückemann, C.-P.: Informationssysteme und Thesauri. [Internet], 2003. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2003/informationssysteme/informationssysteme.html (Text).

3
Rückemann, C.-P.: Thesaurus-Unterstützung für Informationssysteme. [Internet], 2003. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2003/thesaurus (Text), URL: http://metager.de/index0-thesaurus.

4
Rückemann, C.-P.: Phonetische Algorithmen zu komparativen Zwecken am Beispiel des phonetischen Komparators für Informationssysteme. [Internet], 2002. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2002/phokom (Text), URL: http://jserv.rrzn.uni-hannover.de/meta/cgi-bin/cprsndx_eqkatll.sh?rueckemann+forschung.

5
Rückemann, C.-P.: Kategorien-Lexika zur Nutzung mit Informationssystemen. [Internet], 2002. URL: http://www.unics.uni-hannover.de/cpr/x/publ/2002/katlex (Text).

 

anybrowser.org

 


© 2003 Dr. Claus-Peter Rückemann, RRZN Hannover / E-Mail [--] / Tel. [--]
vi betrieben.
Letzte Änderung: Do, 05. Jun. 2003, 04:30:02 MEZ