• Medientyp: E-Artikel
  • Titel: Kodierung des Geburtsstaats in der Wanderungsstatistik: Ein Vergleich regelbasierter Signierung mit Verfahren des maschinellen Lernens
  • Beteiligte: Feuerhake, Jörg [VerfasserIn]; Lange, Kerstin [VerfasserIn]; Siegismund, Annelen [VerfasserIn]; Vigneau, Elsa [VerfasserIn]
  • Erschienen: Wiesbaden: Statistisches Bundesamt (Destatis), 2020
  • Sprache: Deutsch
  • ISSN: 1619-2907
  • Schlagwörter: Geburtsstaat ; classification ; country of birth ; Maschinelles Lernen ; migration statistics ; machine learning ; Random Forest ; Wanderungsstatistik ; Signierung
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: Seit dem Berichtsjahr 2008 enthalten die Datenlieferungen zur deutschen amtlichen Wanderungsstatistik Angaben zum Geburtsstaat von zu-, fort- und umziehenden Personen. Wegen unzureichender Qualität wurden diese Daten bislang nur für Schätzungen nach Geburtsstaatengruppen im Rahmen europäischer Lieferverpflichtungen genutzt. Künftig sollen auch Aussagen über die einzelnen Geburtsstaaten der Wandernden möglich sein. Daher wurden im Jahr 2019 verschiedene Methoden untersucht, um ein Verfahren zur automatisierten Plausibilisierung und Signierung des Merkmals zu entwickeln. Der Beitrag stellt zwei Ansätze vor und vergleicht sie miteinander: eine regelbasierte Geburtsstaatssignierung basierend auf Leitdateien und den Einsatz von maschinellen Lernverfahren. ; Since reference year 2008, the data provided for German official migration statistics have included information on the country of birth of immigrants, emigrants, or persons moving their main residence inside Germany. Due to insufficient quality, these data have only been used for estimations in a breakdown by country-of-birth groups in order to meet European data transmission obligations. To enable future analysis of the migrants’ country of birth, various methodological investigations were carried out in 2019 to develop a method for automatically checking the consistency of and classifying the relevant variable. This article presents two approaches and compares them with each other: on the one hand, a rule-based country-of-birth classification using reference files and, on the other, the use of machine learning methods.
  • Zugangsstatus: Freier Zugang