• Media type: Electronic Thesis; Text; E-Book
  • Title: Décodage de la parole à partir de l'activité cérébrale à l'aide de méthodes linéaires ; Decoding speech from brain activity using linear methods
  • Contributor: Le godais, Gaël [Author]
  • imprint: theses.fr, 2022-06-28
  • Language: English
  • Keywords: Synthèse vocale ; Brain-Computer interface ; Interface cerveau-Machine ; Machine learning ; Traitement du signal ; Apprentissage statistique ; Methodes linéaires ; Speech synthesis ; Linear methods ; Signal processing
  • Origination:
  • Footnote: Diese Datenquelle enthält auch Bestandsnachweise, die nicht zu einem Volltext führen.
  • Description: Le contrôle d’une interface cerveau-ordinateur invasive par une personne paralyséepourrait restaurer une production naturelle de la parole en permettant une synthèsevocale en temps réel à partir de l’activité corticale. Cette thèse vise à décoder demanière hors ligne des enregistrements invasifs existants de l’activité corticale de laparole, en utilisant des méthodes compatibles temps réel qui pourraient ensuite êtreutilisées dans une interface cerveau-ordinateur générant de la parole naturelle.L’accent a été mis sur l’utilisation de méthodes linéaires pour le décodage de la paroleà partir de l’activité corticale. En particulier la régression des moindres carrés partiels,qui a déjà été utilisée avec succès dans des interfaces cerveau-ordinateur moteur,mais pas encore pour le décodage de la parole. Deux principales approches ont étécomparées : 1. le décodage direct de F0 et des coefficients mel cepstraux de la parole,et 2. le décodage indirect de la parole via une représentation articulatoire. Afinde décoder les trajectoires articulatoires à partir de l’activité corticale, celles-ci ontd’abord été déduites des enregistrements audio du patient à l’aide d’un algorithmede déformation temporelle dynamique. Différents réseaux de neurones récurrentsou à propagation avant ont été entraînés à effectuer une synthèse articulatoire-acoustique sur des données d’articulographie électromagnétique, et ont été évaluésà l’aide de critères objectifs et perceptifs. Le meilleur modèle a été ajusté par fine-tuning à prédire les coefficients mel cepstraux de la parole à partir des trajectoiresarticulatoires décodées. La parole a été synthétisée par un filtre MLSA à partir de F0et des coefficients mel cepstraux décodés.Le décodage direct et indirect des caractéristiques acoustiques de la parole ont atteintdes performances similaires, toutes deux significativement meilleures que la chancebien que non intelligibles. La régression des moindres carrés partiels s’est avéréeeffectuer une réduction des caractéristiques neurales plus efficace ...
  • Access State: Open Access