>> Ressourcen > Download Area für Papers > Gütl Christian:[..]

"Future Information Harvesting and Processing
on the Web"
 Conference "European Telematics: advancing the information society"
Barcelona, 4-7 February 1998
Christian Gütl, Keith Andrews, Herman Maurer*
IICM, Graz University of Technology, Austria

Keywords:Keywords: Hierarchical Search Index, Catalogue, Internet, Search Engine, Knowledge Discovery 

Kurzfassung 

Die Entwicklung der einfach benutzbaren Web-Browser führt zu einem rapiden Anwachsen der Daten am Web und damit auch der zur Verfügung stehenden Informationen. Die Anzahl der Web-Server kann mit 300.000 angenommen werden und die Anzahl der Dokumente erreicht 150 Millionen. Die Menge der über das Internet zugreifbaren Informationen wächst weiter an und es wird zunehmend schwieriger, relevante Information aufzufinden. Gegenwärtige Katalogsysteme und Suchmaschinen genügen den Anforderungen der Benutzer nach nachgefragter Information und zuverlässigem Wissen nicht. Weitere Suchroboter der Suchdienste verursachen eine Menge an Netz- und Serverbelastung. Es gilt neue Strategien aus dem gegenwärtigen Standard und zukunftsorientierte Technologien zu entwickeln. Es gilt viele Fragen zu klären: "Wo bekomme ich Informationen zu einem bestimmten Thema? Habe ich die richtige (relevante) Information? Wie ist die Qualität der erhaltenen Information? Wie kann ich eine bestimmte Information wieder finden?" Wir müssen auf diese Fragen Antworten finden um Millionen von Benutzern Werkzeuge zu geben, damit diese die Information finden, nach der sie suchen. 

Abstract 

The development of easy-to-use web clients and servers is leading to a rapid growth of available information on the web. The number of web servers can be estimated at 300,000 and the number of documents around 150 million. The volume of internet-accessible information continues to grow and it is becoming increasingly difficult to locate relevant information. Present indexing systems and search engines do not satisfy users’ needs for information and reliable knowledge. Additionally, search engine robots are responsible for a great deal of network traffic and server load. Some new strategies have to be developed based on present standards and future technologies. Appropriate questions include: "Where can I get information about a particular topic? Have I found the right (relevant) information? What is the quality of the received information? How can I find a certain document again?" Answers have to be found to these questions, if millions of users are to easily find the information they are looking for. 

 
HTML Dokument Englische Sprache HTML Dokument Englische Sprache
HTML Document German Version HTML Document German Version
Informationen über die Konferenz Informationen über die Konferenz
Postscript Dokument Englische Verssion Postscript Dokument Englische Verssion
Postscript Dokument Deutsche Version Postscript Dokument Deutsche Version
RTF Dokument Englische Version RTF Dokument Englische Version
RTF Dokument Deutsche Version RTF Dokument Deutsche Version
Word Dukument Deutsche Version Word Dukument Deutsche Version
Word Dokument Deutsche Version Word Dokument Deutsche Version