La compréhension de la parole dans les systèmes de dialogues humain-machine à l'heure des modèles pré-entraînés ; Spoken language understanding in human-computer dialogue systems in the era of pretrained models

Medientyp: E-Book; Elektronische Hochschulschrift; Sonstige Veröffentlichung

Titel: La compréhension de la parole dans les systèmes de dialogues humain-machine à l'heure des modèles pré-entraînés ; Spoken language understanding in human-computer dialogue systems in the era of pretrained models

Beteiligte: Pelloin, Valentin [VerfasserIn]

Erschienen: theses.fr, 2024-01-24

Sprache: Französisch

Schlagwörter: Attention mechanisms ; Modèles auto-Supervisés ; Réseaux de neurones ; Mécanismes d'attention ; Pretrained models ; Semantic concepts extraction ; Spoken language understanding ; Reconnaissance automatique de la parole ; Automatic speech recognition ; Self-Supervised models ; Neural networks ; Extraction de concepts sémantiques ; Modèles pré-Entraînés ; Compréhension de la parole ; Apprentissage profond ; Deep learning

Entstehung:

Anmerkungen: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.

Beschreibung: Dans cette thèse, la compréhension automatique de la parole (SLU) est étudiée dans le cadre applicatif de dialogues téléphoniques à buts définis (réservation de chambres d'hôtel par exemple). Historiquement, la SLU était réalisée en cascade : un système de reconnaissance de la parole réalisait une transcription en mots, puis un système de compréhension y associait une annotation sémantique. Le développement des méthodes neuronales profondes a fait émerger les architectures de bout-en-bout, où la tâche de compréhension est réalisée par un système unique, appliqué directement à partir du signal de parole pour en extraire l’annotation sémantique. Récemment, les modèles dits pré-entraînés de manière non supervisée (SSL) ont apporté de nouvelles avancées en traitement automatique des langues (TAL). Appris de façon générique sur de très grandes masses de données, ils peuvent ensuite être adaptés pour d'autres applications. À ce jour, les meilleurs résultats SLU sont obtenus avec des systèmes en cascade intégrant des modèles SSL.Cependant, aucune des architectures, cascade ou bout-en-bout, n'est parfaite. À travers cette thèse, nous étudions ces architectures et proposons des versions hybrides qui tentent de tirer parti des avantages de chacune. Après avoir développé un modèle SLU bout-en-bout à l’état de l’art, nous avons évalué différentes stratégies d’hybridation. Les avancées apportées par les modèles SSL en cours de thèse, nous ont amenés à les intégrer dans notre architecture hybride. ; In this thesis, spoken language understanding (SLU) is studied in the application context of telephone dialogues with defined goals (hotel booking reservations, for example). Historically, SLU was performed through a cascade of systems: a first system would transcribe the speech into words, and a natural language understanding system would link those words to a semantic annotation. The development of deep neural methods has led to the emergence of end-to-end architectures, where the understanding task is performed by a single ...

Zugangsstatus: Freier Zugang

Nur in Feld suchen:

Zuletzt gesuchte Begriffe: