visual speech recognition

https://deepai.org/publication/deep-audio-visual-speech-recognition Deep Audio-Visual Speech Recognition | DeepAI Sep 6, 2018 - 09/06/18 - The goal of this work is to recognise phrases and sentences being spoken by a talking face, with or without the audio. Unlike prev... visual speech recognition deep audio https://deepai.org/publication/multimodal-integration-for-large-vocabulary-audio-visual-speech-recognition Multimodal Integration for Large-Vocabulary Audio-Visual Speech Recognition | DeepAI Jul 28, 2020 - 07/28/20 - For many small- and medium-vocabulary tasks, audio-visual speech recognition can significantly improve the recognition rates compa... visual speech recognition multimodal integration large vocabulary audio https://deepai.org/publication/fusing-information-streams-in-end-to-end-audio-visual-speech-recognition Fusing information streams in end-to-end audio-visual speech recognition | DeepAI Apr 19, 2021 - 04/19/21 - End-to-end acoustic speech recognition has quickly gained widespread popularity and shows promising results in many studies. Speci... visual speech recognition fusing information streams end https://www.mdpi.com/1424-8220/22/20/7738 Noise-Robust Multimodal Audio-Visual Speech Recognition System for Speech-Based Interaction... Speech is a commonly used interaction-recognition technique in edutainment-based systems and is a key technology for smooth educational learning and... visual speech recognition noise robust multimodal audio https://arxiv.org/abs/2509.16023 [2509.16023] Interpreting the Role of Visemes in Audio-Visual Speech Recognition Abstract page for arXiv paper 2509.16023: Interpreting the Role of Visemes in Audio-Visual Speech Recognition the role https://arxiv.org/html/2302.08102v2 Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition deep neural networks https://arxiv.org/abs/2201.01763 [2201.01763] Robust Self-Supervised Audio-Visual Speech Recognition Abstract page for arXiv paper 2201.01763: Robust Self-Supervised Audio-Visual Speech Recognition self supervised audio visual 2201 01763 robust https://arxiv.org/abs/2302.08102v2 [2302.08102v2] Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition Abstract page for arXiv paper 2302.08102v2: Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition

Robuta