Лаборатория речевых и многомодальных интерфейсов

Специальная сессия и результаты EUSIPCO-2022

Наша лаборатория совместо с сербскими коллегами организовали специальную сессию Multi-Lingual, Multi-Style, Multi-Modal Human-Machine Spoken Language Communication в рамках 30-й международной конференции по обработке сигналов European Signal Processing Conference (EUSIPCO 2022). EUSIPCO является ведущей европейской конференций по обработке сигналов.

Multi-Lingual, Multi-Style, Multi-Modal Human-Machine Spoken Language Communication Председатели сессии: Алексей Карпов, СПб ФИЦ РАН и Vlado Delić, университет Нови-Сада Дата: 1 Сентября 2022 Представлено: 9 постеров из Сербии, Словении, Македонии, Боснии и Герцеговины, Венгрии и России (большинство офлайн)

В рамках этой сессии, научный сотрудник Иванько Денис Викторович сделал доклад на тему: «Visual Speech Recognition in a Driver Assistance System», посвященный автоматическому распознаванию речи на основе видеоинформации. На момент выступления, в данной работе были получены наилучшие результаты по автоматическому распознаванию речи по губам диктора не только для русской, но и для английской речи. Соавторами данной работы также являются: Рюмин Д.А., Кашевник А.М., Аксенов А.Ю. и Карпов А.А.

Ivanko D., Ryumin D., Kashevnik A., Axyonov A., Karnov A. Visual Speech Recognition in a Driver Assistance System // In Proc. of 30th European Signal Processing Conference (EUSIPCO). 2022. pp. 1131-1135.