• Medientyp: Studienarbeit
  • Titel: #4 CRAWLING VON TEXTDATEN MIT DDC, LCC BEZUG ZUR GENERIERUNG EINER TRAININGSDATENMENGE FÜR DIE TEXTKLASSIFIKATION : Praktikumsbericht Textmining – Wissensrohstoff Text
  • Beteiligte: Schulz, Waiya [Verfasser:in]; Halbauer, Mathias [Verfasser:in]; Klähn, Jannis [Verfasser:in]
  • Erschienen: [2022]
  • Sprache: Deutsch
  • Schlagwörter: Trainingsdaten ; LCC ; DDC ; Wikidata ; GND
  • Entstehung:
  • Anmerkungen:
  • Beschreibung: Ziel unseres Berichts ist die Evaluation der Datenverfügbarkeit und das Erstellen eines Datensatzes, der später zum maschinellen Lernen von Bibliotheksklassifikationen genutzt werden könnte. Als Basis für die Textdaten werden wir Wikidata-Einträge nutzen, da diese teilweise bereits mit solchen Klassifikationen versehen und direkt mit dem zugehörigen Wikipedia-Artikel verknüpft sind.
  • Zugangsstatus: Freier Zugang
  • Rechte-/Nutzungshinweise: Namensnennung - Nicht kommerziell (CC BY-NC)