>> Ressourcen > Theses > Richter, Wolfga[..] > thesis-final > Information Ret[..]

next up previous contents
Nächste Seite: Information Filtering Aufwärts: Wissensauffindung aus der Sicht Vorherige Seite: Wissensauffindung aus der Sicht   Inhalt

Information Retrieval

Abbildung: Grundmodell für wissensbasiertes Information Retrieval. Bei, Information Retrieval besteht beim User ein kurzfristiges Interesse an einer Information. Aus dem Wissen in einer Wissensbasis (z.B. ein Data Warehouse) können für den User geeignete Informationen zu einem bestimmten Thema generiert werden. Diese Informationen können für Problemlösungen herangezogen werden. Durch geeignete Auswertungsmethoden (OLAP, siehe Kap. 3.7.3) ist es möglich, eine Strategie für eine Problemlösung aus einer Wissensbasis heraus zu entwerfen.
\includegraphics[scale=0.6]{pictures/ir1.ps}

Der Begriff ,,Information Retrieval'' wurde 1952 von Mooers geprägt. Will man Information Retrieval in wenigen Worten beschreiben, so ist die Formulierung ,,inhaltliche Suche in Texten`` am treffendsten. Diese Formulierung umfaßt zwar nicht alle Aspekte von Information Retrieval, trifft aber das wesentliche Prinzip dahinter genau. Das klassische Anwendungsgebiet von Information Retrieval (im Speziellen ,,Text Retrieval``) waren Literaturdatenbanken. Mit der Entwicklung der Rechnertechnologie und des Internets sind immer mehr neue Anwendungsgebiete dazugekommen. Datenbanken und ähnliche Informationspools sind über das Internet zugänglich und beinhalten eine derartig große Anzahl an Dokumenten, sodass es notwendig ist, dem User eine Möglichkeit zu bieten, Anfragen konkret zu stellen und Suchen nach Ausdrücken einzuschränken. Eine Möglichkeit dafür bietet die ,,Boolesche Suche``. Der User gibt als Anfrage einen booleschen Ausdruck an das Suchsystem weiter und das Suchsystem sucht in den vorhandenen Dokumenten nach solchen, deren Inhalt die boolesche Anfrage erfüllen. Damit die Suche nicht ein leeres Ergebnis liefert, da kein Dokument exakt die Anfrage erfüllt, wird ein weiteres Konzept zur booleschen Abfrage hinzugefügt: Rating. Mittels ,,Coordination Level Match`` werden die Dokumente gewichtet und in einer bestimmten Reihenfolge, je nach ,,Gewicht``, ausgegeben. In der einfachsten Form eines Coordination Level Match gibt der User seine Anfrage in Form einer Menge von Suchwörtern ein und für jedes Dokument wird einfach die Anzahl der Suchbegriffe aus der Anfrage, die darin vorkommen, gezählt. Die Bezeichnung für ein derartiges Gewicht ist ,,Retrieval Status Value``. Das Ranking erfolgt dann nach der fallenden Anzahl der Treffer. Die Kombination aus boolescher Abfrage und Rating ergibt eine gute Möglichkeit, ein Information Retrieval-System zu verwirklichen. Das Grundmodell für wissenbasiertes Information Retrieval zeigt Abbildung 5.1. [Jones et al.1997]


next up previous contents
Nächste Seite: Information Filtering Aufwärts: Wissensauffindung aus der Sicht Vorherige Seite: Wissensauffindung aus der Sicht   Inhalt
root 2001-10-01