Institut für Informatik III
Universität Bonn

Datenbanken * Informationssysteme * Softwaretechnologie * Computergrafik * Mustererkennung * Bildverarbeitung * Künstliche Intelligenz * Robotik 

 Proseminar Online-Recherche Techniken 
(Wintersemester 1997/98)

      INDEX:   Ansprechpartner   Informationen   Literatur   Links

Ansprechpartner


Informationen zum Seminar

Beschreibung: Durch die fortschreitende Vernetzung (Internet) und die Entwicklung immer günstigerer Speicherungsmedien ist die Anzahl der in digitaler Form verfügbaren Dokumente in den letzten Jahren sehr stark angewachsen. Aus der Sicht eines Anwenders sind diese Informationen aber nur dann nutzbar, wenn er die für seine Fragestellungen relevanten Dokumente auch effizient finden kann. Gegenstand dieses Proseminars sind grundlegende Techniken zur Suche in großen Dokumentmengen (Information Retrieval). Aus zeitlichen Gründen müssen wir uns dabei allerdings auf Textdokumente beschränken.

Zeit und Ort: Donnerstags 11 - 13 Uhr, Seminarraum A121

Beginn: 16.10.97

Vortragsmodus: Einzelvortrag mit anschließender schriftlicher Ausarbeitung



Vortragsthemen und Zeitplan

  1. Domain Analysis; Textkomprimierung I
    16.10.97: Michael Bussmann
    Literatur: [FraBae92] Kap. 1; [WiMoBe94] Kap. 2
    Folien, Ausarbeitung
     
  2. Textkomprimierung II
    23.10.97: Sven Müller
    Literatur: [WiMoBe94] Kap. 2
    Folien, Ausarbeitung
     
  3. Suche in Zeichenketten I
    30.10.97: Jörg Kohmann
    Literatur: [FraBae92] Kap. 10
    Folien, Ausarbeitung
     
  4. Suche in Zeichenketten II
    06.11.97: Tim Sondermann
    Literatur: [FraBae92] Kap. 10; [Horspo80]; [WuMan92]
    Folien, Ausarbeitung
     
  5. Invertierte Listen
    13.11.97: Oliver Klee
    Literatur: [FraBae92] Kap. 3; evtl. [WiMoBe94] Kap. 3.2, 5.0 - 5.3
    Folien, Ausarbeitung
     
  6. Signature Files
    11.12.97: David Boettger
    Literatur:  [FraBae92] Kap. 4
    Folien, Ausarbeitung
     
  7. PAT Trees, PAT Arrays
    18.12.97: Stefan Olk
    Literatur: [FraBae92] Kap. 5
    Folien, Ausarbeitung
     
  8. Boolsche Suchverfahren und ihre Erweiterungen
    08.01.98: Markus Tölzer
    Literatur: [FraBae92] Kap. 12 + 15 (nur auszugsweise; bitte persöhnlich absprechen)
    --- ausgefallen ---
     
  9. Grundlegende Techniken zum Ranking von Dokumenten
    15.01.98: Jörg de la Haye
    Literatur: [FraBae92] Kap. 14 (nur auszugsweise; bitte persöhnlich absprechen)
    Folien, Ausarbeitung
     
  10. Dateistrukturen für optische Speichermedien
    22.01.98: Ramez Kabibo
    Literatur: [FraBae92] Kap. 6
    Folien, Ausarbeitung

 


Literatur

In diesem Proseminar stützen wir uns vor allem auf das Buch von Frakes und Baeza-Yates (s. u.). Allerdings wird an einigen Stellen auf ausgewählte Originalartikel bzw. auf weiterführende Lehrbücher zurückgegriffen.
 

[CroRyt94] Maxime Crochemore; Wojciech Rytter: Text Algorithms. Oxford University Press, 1994.
[FraBae92] William B. Frakes; Ricardo Baeza-Yates (eds.): Information Retrieval: Data Structures & Algorithms. Prentice Hall, 1992.
[Horspo80] R. Nigel Horspool: Practical Fast Searching in Strings. SOFTWARE - PRACTICE AND EXPERIENCE (SPE), 10:6., pages 501-506, June 1980.
[WiMoBe94]  Ian H. Witten; Alistair Moffat; Timothy C. Bell: Managing Gigabytes: Compressing and Indexing Documents and Images. Van Nostrand Reinhold, 1994.
[WuMan92] Sun Wu; Udi Manber: Fast Text Searching Allowing Errors. COMMUNICATIONS OF THE ACM (CACM), 35:10., pages 83-91, October 1992. 

 


Links


[Uni-Bonn] [Informatik] [III] [Lehre] [Seitenanfang] 


Erstellt am:   18. August 1997   --   Letzte Änderung:   28. August 1997

Thomas Bode  (tb@informatik.uni-bonn.de)