• Medientyp: Sonstige Veröffentlichung; Elektronische Hochschulschrift; E-Book
  • Titel: Vers de nouvelles méthodes de clustering de flux de données ; Towards new methods of clustering data stream
  • Beteiligte: Attaoui, Mohammed Oualid [VerfasserIn]
  • Erschienen: theses.fr, 2021-06-30
  • Sprache: Englisch
  • Schlagwörter: Stream Data ; Clustering ; Apprentissage non supervisé ; Unsupervised Learning ; Flux de données
  • Entstehung:
  • Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Beschreibung: L'analyse des flux de données a fait l'objet d'une attention considérable au cours des dernières décennies en raison de l'utilisation de capteurs, de médias sociaux, etc. Elle vise à reconnaître des modèles dans un flux d'observations non ordonné, infini et évolutif. Le clustering de ce type de données nécessite certaines restrictions en termes de temps et de mémoire. La plupart des algorithmes de clustering ne suivent qu'une seule mesure de validité des clusters. Étant donné les différentes propriétés des données, une mesure de validité unique ne fonctionne pas bien pour tous les ensembles de données. Par conséquent, il est avantageux d'optimiser plusieurs mesures de validité simultanément pour saisir les différentes caractéristiques des ensembles de données. Le subspace clustering permet de découvrir des clusters intégrées dans de multiples sous-espaces se chevauchant de données à haute dimension. Elle a été appliquée avec succès dans de nombreux domaines. Le but de cette thèse est de proposer de nouvelles méthodes de clustering de flux de données basées sur des techniques de subspace et multi-objectifs pour détecter des clusters de forme arbitraire, compactes et bien séparées et trouver des attributs et des blocs pertinents avec un meilleur temps d'exécution. ; The analyzes of data streams have received considerable attention over the past few decades due to the usage of sensors, social media, etc. It aims to recognize patterns in an unordered, infinite, and evolving stream of observations. Clustering this type of data requires some restrictions in time and memory. Most of the clustering algorithms follow only one cluster validity measure. Given different data properties, a single validity measure does not work well for all datasets. Therefore, it is beneficial to optimize multiple validity measures simultaneously to capture different characteristics of the datasets. Subspace clustering discovers clusters embedded in multiple, overlapping subspaces of high dimensional data. It has been successfully applied in ...
  • Zugangsstatus: Freier Zugang