#4 CRAWLING VON TEXTDATEN MIT DDC, LCC BEZUG ZUR GENERIERUNG EINER TRAININGSDATENMENGE FÜR DIE TEXTK… - SLUB Dresden

Medientyp: Studienarbeit

Titel: #4 CRAWLING VON TEXTDATEN MIT DDC, LCC BEZUG ZUR GENERIERUNG EINER TRAININGSDATENMENGE FÜR DIE TEXTKLASSIFIKATION : Praktikumsbericht Textmining – Wissensrohstoff Text

Beteiligte: Schulz, Waiya [Verfasser:in]; Halbauer, Mathias [Verfasser:in]; Klähn, Jannis [Verfasser:in]

Erschienen: [2022]

Sprache: Deutsch

Schlagwörter: Trainingsdaten ; LCC ; DDC ; Wikidata ; GND

Entstehung:

Anmerkungen:

Beschreibung: Ziel unseres Berichts ist die Evaluation der Datenverfügbarkeit und das Erstellen eines Datensatzes, der später zum maschinellen Lernen von Bibliotheksklassifikationen genutzt werden könnte. Als Basis für die Textdaten werden wir Wikidata-Einträge nutzen, da diese teilweise bereits mit solchen Klassifikationen versehen und direkt mit dem zugehörigen Wikipedia-Artikel verknüpft sind.

Zugangsstatus: Freier Zugang

Rechte-/Nutzungshinweise: Namensnennung - Nicht kommerziell (CC BY-NC)

Nur in Feld suchen:

Zuletzt gesuchte Begriffe: