Information
Retrieval. Suchmodelle und Data-Mining-Verfahren für Textsammlungen und das Web behandelt ein Thema, das wir,
spätestens seitdem das WWW zur allgemeinen Suchen- und Finden-Maschine geworden
ist, alle gut kennen: das Suchen nach Texten zu einem bestimmten Thema. Die
eigentliche wissenschaftliche Disziplin des Information Retrieval (IR) dahinter
geht jedoch weit über die Eingabe in eine Suchmaschine hinaus.
Reginald Ferber gibt eine
integrierte Darstellung des IR, die sich an Informatiker,
Informationswissenschaftler, Bibliothekare, Dokumentare und Studenten richtet
und dabei von den klassischen Methoden wie Klassifikation und Thesaurus bis hin
zur Suche im WWW reicht, immer mit den Methoden und Modellen der Suche nach
Textdokumenten im Auge. Bei Reginald Ferbers Betrachtungsweise herrscht die
konzeptionelle Sicht vor den technischen Details und Implementierungen vor: Es
geht um ein Verständnis und Einschätzungs- und Beurteilungswissen, das sich
auch für beratende Funktionen eignet.
Das in vier Teile
gegliederte Buch beginnt mit der zu Grunde liegenden Theorie und Beispielen
sowie der Vorstellung der klassischen Methoden und Hilfsmittel des IR. Der
zweite Teil behandelt dann die Wissensgewinnung: Data-Mining-Methoden,
verschiedene Ansätze und Techniken. Nach diesen beiden einführenden Kapiteln,
die die zum grundlegenden Verständnis notwendigen Themenbereiche und Methoden
vorstellen, beschäftigt sich das dritte Kapitel mit dem aktuellen Stand der
IR-Forschung, modernen Techniken und neuen Ansätzen der letzten Jahre. Das
letzte Kapitel schließlich widmet sich ganz dem World Wide Web: Vorgestellt und
erklärt werden die Auszeichnungs- und Repräsentationsmethoden HTML, XML und RDF
sowie die dazugehörigen Metadaten-Systeme, mit denen die Suche im Web gestaltet
werden kann.
Information Retrieval ist ein wissenschaftliches,
darüber hinaus aber auch ein für Interessierte informatives Buch über das
Suchen und Finden von Textdokumenten unter anderem in Datenbanken und dem Web.
Die hier erklärten Grundlagen erlauben ein tiefes Verständnis des täglichen
Suchens und Findens von Textinformationen, das weit über die oberflächliche
Mechanik von Suchmaschinen hinausgeht. Ein Buch, dass seine gesellschaftliche
Relevanz angesichts einer textbasierten Wissensgesellschaft gar nicht erst
beweisen m