• Medientyp: E-Artikel
  • Titel: Web Scraping zur Gewinnung von Testdaten für administrative Register
  • Beteiligte: Redlich, Sarah [VerfasserIn]
  • Erschienen: Wiesbaden: Statistisches Bundesamt (Destatis), 2020
  • Sprache: Deutsch
  • ISSN: 1619-2907
  • Schlagwörter: mortality ; Mortalität ; obituaries ; Web-Daten ; Traueranzeigen ; online data ; Big Data ; Web Scraping
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: Web Scraping verspricht eine kosten- und zeiteffiziente Nutzung von öffentlich zugänglichen Informationen aus dem Internet. Um Testdaten für die Erstellung eines bundesweiten Mortalitätsregisters zu generieren, könnten online gestellte Traueranzeigen mittels Web Scraping genutzt werden. Aus diesem Grund wurden für die Jahre 2015 und 2016 für eine Stadt die online extrahierten Traueranzeigen mit amtlichen Daten verglichen. Bereits bei der Konstruktion von Web Scrapern zeigten sich erhebliche Probleme. Ein Vergleich der extrahierten Informationen mit amtlichen Daten zeigt Unterschiede hinsichtlich Gesamtzahl, Geschlecht, ethnischer Zugehörigkeit und Alter der Verstorbenen. ; Web scraping promises cost and time-efficient use of open access information from the world wide web. To generate test data for creating a national mortality register, information could be extracted from online obituaries by means of web scrapers. The data scraped from a city’s online obituaries of the years 2015 and 2016 were therefore compared with official data. Even building web scrapers caused major problems. A comparison of the information extracted and official data shows differences regarding the total number of deceased, their sex, ethnicity and age.
  • Zugangsstatus: Freier Zugang