• Media type: E-Article; Conference Proceedings
  • Title: Hashing-basierte Indizierung: Anwendungsszenarien, Theorie und Methoden
  • Contributor: Stein, Benno [Author]; Potthast, Martin [Author]
  • Corporation: Gesellschaft für Informatik, Fachgruppe Information Retrieval
  • Published: @Hildesheim, 2006
  • Published in: LWA 2006 ; , Seite 159-166
  • Language: German
  • Identifier:
  • Keywords: Konferenzschrift
  • Origination:
  • University thesis: Universität Hildesheim, Institut für Informatik, Tagungsbeitrag: 2006
  • Footnote:
  • Description: Hashing-basierte Indizierung ist eine mächtige Technologie für die Ähnlichkeitssuche in großen Dokumentkollektionen [Stein 2005]. Sie basiert auf der Idee, Hashkollisionen als Ähnlichkeitsindikator aufzufassen vorausgesetzt, dass eine entsprechend konstruierte Hashfunktion vorliegt. In diesem Papier wird erörtert, unter welchen Voraussetzungen grundlegende Retrieval- Aufgaben von dieser neuen Technologie profitieren können. Weiterhin werden zwei aktuelle, hashing-basierte Indizierungsansätze präsentiert und die mit ihnen erzielbaren Verbesserungen bei der Lösung realer Retrieval-Aufgaben verglichen. Eine Analyse dieser Art ist neu; sie zeigt das enorme Potenzial maßgeschneiderter hashing-basierter Indizierungsmethoden wie zum Beispiel dem Fuzzy- Fingerprinting.
  • Access State: Open Access