• Medientyp: E-Artikel
  • Titel: Bridging Text and Video: A Universal Multimodal Transformer for Audio-Visual Scene-Aware Dialog
  • Beteiligte: Li, Zekang; Li, Zongjia; Zhang, Jinchao; Feng, Yang; Zhou, Jie
  • Erschienen: Institute of Electrical and Electronics Engineers (IEEE), 2021
  • Erschienen in: IEEE/ACM Transactions on Audio, Speech, and Language Processing, 29 (2021), Seite 2476-2483
  • Sprache: Nicht zu entscheiden
  • DOI: 10.1109/taslp.2021.3065823
  • ISSN: 2329-9290; 2329-9304
  • Entstehung:
  • Anmerkungen: