• Media type: E-Book; Electronic Thesis; Bachelor Thesis
  • Title: The Necessity of Complex Data: Object Importance by Removing for High-Dimensional Structured Objects
  • Contributor: Karpf, Vincent [Author]
  • imprint: Humboldt-Universität zu Berlin, 2024-01-24
  • Language: English
  • DOI: https://doi.org/10.18452/28011
  • Keywords: Computerprogramme ; Bilddaten ; Airbnb ; Conditional Independence Testing ; Vorhersagemodell ; Preisvorhersage ; Deep Learning ; High-Dimensional ; Hochdimensional ; Daten ; Unabhängigkeitstest ; Predictive Modelling ; Überwachtes Lernen ; Predictive Independence Testing ; Image Embeddings ; Strukturierte Daten ; CLIP ; Structured Data ; Supervised Learning
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: The code and data can be found at https://github.com/VinTsu07/Object_importance. ; Im Zeitalter von Big Data eröffnen hochdimensionale Datensätze neue Möglichkeiten für genauere Prognosen und detailliertere Analysen. Die Komplexität ihrer Nutzung wirft jedoch die Frage auf, ob der Einsatz solcher Daten für spezifische Aufgabenstellungen praktikabel ist. Diese Arbeit untersucht den Einfluss hochdimensionaler strukturierter Daten auf die Vorhersage einer stetigen Variablen am Beispiel der Vorhersage von Airbnb-Preisen mit Hilfe multimodaler Daten. Die Forschungsfrage wird als bedingtes Unabhängigkeitsproblem formuliert: Sind bei gegebenen tabellarischen Daten die Angebotspreise unabhängig von den Angebotsbildern? Ein innovativer Ansatz, der Ideen des statistischen Hypothesentestens und des überwachten Lernens kombiniert, wird verwendet, um die bedingte Abhängigkeit der Preise von den Bildern zu testen. Dabei werden Fortschritte im Deep Learning genutzt, um Bildinformationen durch Einbettungen in den bedingten Unabhängigkeitstest zu integrieren. Verschiedene Vorhersagemodelle werden herangezogen, um die ideale Vorhersagefunktion zu approximieren. Die Komplexität des Datensatzes erschwert die Modellierung und führt zu Unsicherheit über die genaueste Vorhersagefunktion, was die Testergebnisse beeinflussen kann. Überraschenderweise erreichen lineare Regressionsmodelle eine relativ hohe Genauigkeit, was auf eine lineare Beziehung zwischen den unabhängigen Variablen und dem Angebotspreis hindeutet. Die Robustheit der Analyse wird durch eine detaillierte Betrachtung des Stichprobenumfangs und der Bildeinbettungen überprüft. Unter bestimmten Annahmen zeigen die Ergebnisse, dass Bilddaten einen prognostischen Einfluss in Preismodellen haben. Dies unterstreicht das Potenzial der Integration von Bildern in die Preisstrategie von Unternehmen. Zukünftige Forschung könnte untersuchen, ob auch andere hochdimensionale Daten wie Textinformationen einen prädiktiven Einfluss haben. ; The age of big data has given rise to ...
  • Access State: Open Access
  • Rights information: Attribution (CC BY)