• Medientyp: Dissertation; E-Book; Elektronische Hochschulschrift
  • Titel: Ein generischer Ansatz zur digitalen Layoutanalyse von Manuskripten ; A Generic Approach to Digital Layout Analysis of Manuscripts
  • Beteiligte: Herzog, Rainer [VerfasserIn]
  • Erschienen: Staats- und Universitätsbibliothek Hamburg Carl von Ossietzky, 2018-01-01
  • Sprache: Deutsch
  • Schlagwörter: text block segmentation ; Gabor-Transformation ; Layout ; Dokumentanalyse ; Frequenzanalyse ; Manuskript ; Gabor transform ; 54.80 Angewandte Informatik ; 54.72 Künstliche Intelligenz ; Textblocksegmentierung ; Bildverarbeitung ; 54.74 Maschinelles Sehen
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: In dieser Arbeit wird ein Ansatz zur Layouterkennung von digitalisierten Manuskripten vorgestellt. Die Bestimmung des Layouts liefert einerseits Manuskriptforschern wertvolle Hinweise auf kulturelle Zusammenhänge, kann andererseits auch innerhalb einer Verarbeitungskette nützlich sein, die eine darüber hinausgehende computerbasierte Auswertung von Manuskripten erlaubt. Im Vergleich zu bisherigen Ansätzen liegt der Fokus dieser Arbeit auf der universellen Anwendbarkeit. Es werden keine Vorannahmen bezüglich Schreibsystem, Dokumentenformaten oder Layouteigenschaften, wie etwa der Annahme eines einzigen Haupttextbereichs, gemacht. Vor der Anwendung dieses Verfahrens auf beliebige Manuskriptseiten ist keine Trainingsphase vorgesehen. Dabei soll das Verfahren robust gegenüber Störungen wie Flecken oder Rissen sein, wie sie bei historischen Manuskripten häufig auftreten. Auf der theoretischen Basis der Gabor-Transformation wird experimentell untersucht, wie die grundlegende Eigenschaft von mehrzeiliger Schrift, die ein abwechselnd helles und dunkles streifenförmiges Muster darstellt, zur Layoutanalyse von Manuskripten geeignet ist. Die Gabor-Transformation lässt durch Anwendung einer Fensterfunktion eine lokal eingeschränkte Merkmalsextraktion einzelner Manuskriptregionen zu. Im hier entwickelten Verfahren wird die Antwort der Gabor-Transformation im Frequenzraum in drei Bänder unterteilt und durch eine Kombination ihrer Antworten werden die jeweiligen Vorteile dieser Bänder bezüglich Orts oder Frequenzauflösung vereint. Nach systematischer Verringerung der Auflösung der Manuskriptbilder sowie anschließender Analyse unter einheitlicher Fensterfunktion werden die Auswertungen zusammengefasst und lassen so eine Untersuchung von Regionen nahezu beliebiger Textgröße zu. Daraus werden die Abgrenzung von Schrift zum Hintergrund ermittelt, sowie die durchschnittliche Zeilenorientierung und der durchschnittliche Zeilenabstand von Textregionen. Eine Abgrenzung innerhalb der Textregionen hin zu einzelnen Textblöcken erfolgt ...
  • Zugangsstatus: Freier Zugang