>> Ressourcen > Download Area für Papers > Maurer, H., Güt[..]

 
Kurzfassung für den Forschungsauftrag 61090:

Intelligente Wissenserfassung und Wiederauffindung in künftigen WWW-Systemen

Forschungsprojekt im Bereich WWW-Wissensorganisation


C. Guetl, cguetl@iicm.edu

H. Maurer, hmaurer@iicm.edu

März 2000



Zusammenfassung

Heute verfügbare Suchverfahren und die Aufbereitung der durchsuchten Dokumente stellen in Teilbereichen für den Internet-Benutzer hilfreiche Werkzeuge zur Verfügung. Mit den gegenwärtigen Methoden und der Zunahme von Dokumenten und Suchmaschinen wird allerdings die dadurch verursachte Netz- und Serverbelastung künftig andere Anwendungen weitgehend beeinträchtigen. Die raschen Entwicklungen neuer Internetstandards und Anwendungen sowie der Bedarf an innovativen Verbesserungen wurde durch das Forschungsprojekt „Intelligente Wissenserfassung und Wiederauffindung in künftigen WWW-Systemen" behandelt.

Die umfangreichen Literaturstudien sowie erste Testimplementierungen haben gezeigt, daß ein zukunftsorientiertes Suchsystem der Verteiltheit der Informationsquellen entsprechen soll. Das System muss offen und erweiterbar sein, damit eine Integration von bestehenden und künftigen Informationssystemen gewährleistet werden kann. Eine weitere Anforderung an ein zukunftsorientiertes Suchsystem liegt in einer verteilten und kooperierenden Brokerstruktur; es ist dies jener Teil, der dem Benutzer entsprechende Formulare zur Suchanfrage anbietet, die Suchanfrage entsprechen weiterverteilt und die Ergebnisse wiederum für den Benutzer aufbereitet.

Nachfolgend kurz aufgezeigte Schwachpunkte gängiger Suchdienste konnten identifiziert werden:

  • Netzwerk- und Serverbelastung 
  • Vollständigkeit, Aktualität und Linkkonsistenz des Suchergebnisses
  • Qualität und Zuverlässigkeit 
Um diesen Problemen zu begegnen, kann man sich des Konzeptes einer verteilten Architektur bedienen. Suchprogramme, die am Rechner des Informationsservers im Hintergrund laufen und diesen periodisch absuchen, können so Vollständigkeit innerhalb ihres Bereiches erreichen und die Informationen an übergeordnete Einheiten weiterreichen. Auch externe Informationsdienste bzw. Datenbanken müssen eingebunden werden. Des weiteren stellt die verknüpfte Suche von Dokumentinhalten mit Qualitätsmetadaten einen innovativen Ansatz dar.

Der Prototyp, das xFIND-System in der Version 0.9 wird entsprechend den vorherigen Überlegungen aus den Modulen Gatherer, Indexer und Broker aufgebaut. In der gewählten Architektur können die Gatherer verteilt Informationen von Servern aufbereiten. Gatherer können lokal auf den jeweiligen Informationsserver laufen oder aber auch remote auf Inhalte zugreifen. Die aufbereiteten Informationen der abgegrasten Informationsstrukturen können einem oder mehreren Indexern zur Weiterverarbeitung zur Verfügung gestellt werden. Indexer können wiederum gemeinsam mit den Gatherern auf der selben Maschine arbeiten, oder aber getrennt auf einem anderen Host laufen. Die dritte Komponente, die Broker sind die eigentliche Schnittstelle zum Benutzer. Die Suchanfragen können entsprechend an einen oder mehrere Indexer weiter geleitet werden und die Ergebnisse werden wiederum zusammengefaßt.

Bewertungs- und Beurteilungsmöglichkeiten wurden in einer ersten Implementierung innerhalb von xFIND V0.9 umgesetzt. Das Konzept erlaubt die Voranmeldung von Internet-Ressourcen durch den Autor bzw. Webserverbetreiber. In einem weiteren Schritt können die Ressourcen von Fachexperten geprüft und überarbeitet werden. Zu diesem Zweck wurde ein eigenes Metadaten-Schema – xQMS, xFIND Quality Metadata Scheme – entwickelt. Des weiteren wurde in einer Studie die Notwendigkeit eines hierarchischen Klassifikationsschemas aufgezeigt und in xQMS integriert.

Das Ziel des Forschungsprojekt war es, neuartige Ansätze zur Wissensauffindung im WWW zu untersuchen und prototypenhaft umzusetzen. Durch die rasche Weiterentwicklung von Suchdiensten scheint die Überführung in ein kommerzielles Produkt nicht empfehlenswert. Der Sourcecode des Prototypen ist jedoch für weitere Nutzungen frei verfügbar und steht unter http://xfind.iicm.edu zur freien Verfügung.

xFIND ist wesentlicher Bestandteil folgender Projekte:

http://wbt-1.iicm.edu/wbt/v1/core/app/hwt/mod/ce2;course=Wissens&oid=0x811bc838_0x00125e15

Links:

http://xfind.iicm.edu
 
 

Das Forschungsprojekt hat zu zahlreichen Publikationen - z.T. bei Internationalen Tagungen - geführt, wie z.B.:

Dietinger, T.; Gütl, C.; Maurer, H.; Pivec, M.; Schmaranz, K.: Intelligent Knowledge Gathering and Management as New Ways of an Improved Learning Process, Presented at Conference "Webnet 98", Orlando, 4. - 12. Nov. 1998 and Proceedings of WebNet 98 - World Conference of the WWW, AACE, Internet and Intranet, Charlottesville, USA, pp. 244 - 249

Dietinger, T.; Gütl, C.; Knögler, B.; Neussl, D.; Schmaranz, K.: Dynamic Background Libraries - New Developments in Distance Education Using HIKS (Hierarchical Interactive Knowledge System) Published in J.UCS, Vol.5 / No.1 / 2- 10

Gütl, C.; Jurak, A.; Moser, J.; Neussl, D.; Pivec, M.: Knowledge Transfer and Knowledge Discovery - New Improvements for the Corporate Decision Presented at Conference "Webnet 99", Hawai, 24. - 30. Okt. 1999 and Proceedings of WebNet 99 - World Conference of the WWW, AACE, Internet and Intranet, Charlottesville, USA, pp. 1280 - 1281

Gütl, C.; Maurer, H.; Pivec, P.: Learning on Demand using xFIND: An Improved Way for Ongoing and Lifelong Learning as a Smart Module for the GENTLE Learning Environment Presented at ICCE99 and Proc. ICCE99, Chiba, Japan, IOS Press, Amsterdam, Vol. I (1999), 592-599
 
 

Abstract

Today, available search services and the pre-processing of gathered documents offer useful tools for Internet users in some specific areas. But current search methods and the increase of the number of documents and search services cause troublesome network and server loads. Consequently, other applications are impaired just by the load created by "harvesting" tools. The rapid development of new Internet standards and applications as well as the demand for innovative improvements are the main subjects of the research project "Intelligent knowledge discovery and retrieval in future WWW systems".

An extensive study of research work and first prototype implementations have shown that a future-oriented search service must meet the needs of distributed information sources. The system has to have an open and extendable architecture to allow the integration of existing and future external information applications. A further requirement of a future-oriented search system is that it provides a distributed and cooperative broker environment. A broker in that case is the interface between the user and the distributed search system, where users may specify their search request. The broker manages the scheduling and the routing of the query, collects the results, and provides them to the users.

The following shortcomings of present major search services where identified by the research work:

  • Network and server loads
  • Completeness, timeliness and link consistency of the search results
  • Quality and reliability
The concept of a distributed architecture will reduce or eliminate these problems. A search application which is physically located on the information server and periodically gathers document information will reduce the identified problems. Also, completeness can be guaranteed and preprocessed information is compiled for search modules located on other servers or even for third party search services. Furthermore, existing external search services or data bases must be integrated in a future-oriented system. The combined search between document content and quality metadata is a new and innovative technique.

The prototype implementation is called the 'xFIND System Version 0.9.' It consists, in accordance with the considerations stated above, of a Gatherer, an Indexer, and a Broker. The architecture chosen allows the Gatherers to cooperate in a decentralized environment. This decentralization allows the Gatherers to reside in the same physical location as the server does (e.g. the same computer) or Gatherers may access the data of the server from a remote location. The gathered and pre-processed information can be requested by one or more Indexer. These Indexers can also reside in the same location, or they can be executed on a different host, and access the information remotely. The third component, the Broker, provides the interface to the user. The search queries are sent to one or more Indexer, and the partial results of the different Indexer are collected and concatenated.

A preliminary rating and classification functionality was also implemented in xFIND V0.9 This implementation enables a pre-registration of an Internet-resource by its author or the administrator of the resource. These registered resources can be checked and revised by an expert who is responsible for the specified knowledge domain. To manage this functionality a quality meta data scheme, the xQMS (xFIND Quality Metadata Scheme), was defined. Furthermore a need for a hierarchical classification scheme was also identified, where the Dewey classification scheme was realized to be a suitable candidate. 

The objective of this research project was to find new ways for knowledge discovery in WWW resources and to implement a first prototype. Because of the short development cycles in the field of search services the conversion of the prototype into a search engine product does not seem to be advisable. The source code of the prototype is available for further use at http://xfind.iicm.edu.

xFIND is an essential part of the following projects:

http://wbt-1.iicm.edu/wbt/v1/core/app/hwt/mod/ce2;course=Wissens&oid=0x811bc838_0x00125e15

Links:

http://xfind.iicm.edu
 
 

The research project has lead to a number of publications on an international level such:

Dietinger, T.; Gütl, C.; Maurer, H.; Pivec, M.; Schmaranz, K.: Intelligent Knowledge Gathering and Management as New Ways of an Improved Learning Process, Presented at Conference "Webnet 98", Orlando, 4. - 12. Nov. 1998 and Proceedings of WebNet 98 - World Conference of the WWW, AACE, Internet and Intranet, Charlottesville, USA, pp. 244 - 249

Dietinger, T.; Gütl, C.; Knögler, B.; Neussl, D.; Schmaranz, K.: Dynamic Background Libraries - New Developments in Distance Education Using HIKS (Hierarchical Interactive Knowledge System) Published in J.UCS, Vol.5 / No.1 / 2- 10

Gütl, C.; Jurak, A.; Moser, J.; Neussl, D.; Pivec, M.: Knowledge Transfer and Knowledge Discovery - New Improvements for the Corporate Decision Presented at Conference "Webnet 99", Hawai, 24. - 30. Okt. 1999 and Proceedings of WebNet 99 - World Conference of the WWW, AACE, Internet and Intranet, Charlottesville, USA, pp. 1280 - 1281

Gütl, C.; Maurer, H.; Pivec, P.: Learning on Demand using xFIND: An Improved Way for Ongoing and Lifelong Learning as a Smart Module for the GENTLE Learning Environment Presented at ICCE99 and Proc. ICCE99, Chiba, Japan, IOS Press, Amsterdam, Vol. I (1999), 592-599

Forschungsendbericht HTML Version (deutsch) Forschungsendbericht HTML Version (deutsch)
Forschungsendbericht PDF Version (deutsch) Forschungsendbericht PDF Version (deutsch)
Kurzfassung HTML Version (deutsch) Kurzfassung HTML Version (deutsch)
Kurzfassung PDF Version (deutsch) Kurzfassung PDF Version (deutsch)