Bridging Text and Video: A Universal Multimodal Transformer for Audio-Visual Scene-Aware Dialog

Literatur-
verwaltung

Direktlink

Zur
Merkliste

Lösche von
Merkliste

Per Email teilen

Auf Twitter teilen

Auf Facebook teilen

Per Whatsapp teilen

Schließen

Merkliste

Medientyp: E-Artikel
Titel: Bridging Text and Video: A Universal Multimodal Transformer for Audio-Visual Scene-Aware Dialog
Beteiligte: Li, Zekang; Li, Zongjia; Zhang, Jinchao; Feng, Yang; Zhou, Jie
Erschienen: Institute of Electrical and Electronics Engineers (IEEE), 2021
Erschienen in: IEEE/ACM Transactions on Audio, Speech, and Language Processing, 29 (2021), Seite 2476-2483
Sprache: Nicht zu entscheiden
DOI: 10.1109/taslp.2021.3065823
ISSN: 2329-9290; 2329-9304
Entstehung:
Anmerkungen:

... zum Aufsatz via DOI (in der SLUB Dresden bzw. ortsunabhängig für Angehörige der TU Dresden freigeschaltet)