Лаборатория речевых и многомодальных интерфейсов

Публикации

2022

Аксёнов А.А., Кагиров И.А., Рюмин Д.А. Метод многомодального машинного сурдоперевода для естественного человеко-машинного взаимодействия // Научно-технический вестник информационных технологий, механики и оптики. 2022. Т. 22. № 3. C. 585-593.
Двойникова А.А., Кагиров И.А., Карпов А.А. Аналитический обзор методов автоматического распознавания вовлеченности пользователя в виртуальную коммуникацию // Информационно-управляющие системы. 2022. № 5(120). С. 12-22.
Markitantov M., Ryumina E., Ryumin D., Karpov A. Biometric Russian Audio-Visual Extended MASKS (BRAVE-MASKS) Corpus: Multimodal Mask Type Recognition Task // Proceedings of 23rd International Conference INTERSPEECH-2022. Korea. 2022. pp. 1756-1760.
Ivanko D., Ryumin D., Kashevnik A., Axyonov A., Kitenko A., Lashkov I., Karpov A. DAVIS: Driver’s Audio-Visual Speech recognition // Proceedings of 23rd International Conference INTERSPEECH-2022. Korea. 2022. pp. 1141-1142.
Ivanko D., Ryumin D., Kashevnik A., Axyonov A., Karpov A. Visual Speech Recognition in a Driver Assistance System // Proceedings of 30th European Signal Processing Conference EUSIPCO-2022. Belgrade, Serbia. 2022. pp. 1131-1135.
Ivanko D., Axyonov A., Ryumin D., Kashevnik A., Karpov A. RUSAVIC Corpus: Russian Audio-Visual Speech in Cars // Proceedings of 13th Language Resources and Evaluation Conference LREC-2022. France. 2022. pp. 1555-1559.
Подробнее
Ivanko D., Kashevnik A., Ryumin D., Kitenko A., Axyonov A., Lashkov I., Karpov A. MIDriveSafely: Multimodal Interaction for Drive Safely // Proceedings of 24th ACM International Conference on Multimodal Interaction ICMI-2022. India. 2022. pp. 733-735.
Dvoynikova A., Markitantov M., Ryumina E., Uzdiaev M., Velichko A., Kagirov I., Kipyatkova I., Lyakso E., Karpov A. An analysis of automatic techniques for recognizing human's affective states by speech and multimodal data // Proceedings of 24th International Congress on Acoustics ICA-2022. Korea. 2022. pp. 22-33.
Ryumina E., Ivanko D. Emotional Speech Recognition Based on Lip-Reading // Lecture Notes in Computer Science, SPECOM-2022, India. 2022. Vol. 13721. pp. 616-625.
Kipyatkova I. Investigation of Transfer Learning for End-to-End Russian Speech Recognition // Lecture Notes in Computer Science, SPECOM-2022, India. 2022. Vol. 13721. pp. 349-357.
Величко А.Н. Метод анализа речевого сигнала для автоматического определения агрессии в разговорной речи // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. 2022. № 4. C. 180-188.
Летенков М.А., Яковлев Р.Н., Маркитантов М.В., Рюмин Д.А., Карпов А.А. Применение методов синтеза обучающих данных для распознавания частично скрытых лиц на изображениях // Известия высших учебных заведений. Приборостроение. 2022. № 65(11). С. 842-850.
Кагиров И.А., Рюмин Д.А. База данных русского жестового языка поликлинического предназначения: лингвистические особенности материала и аннотирования // Вестник Новосибирского государственного университета. Серия: Лингвистика и межкультурная коммуникация. 2022. №20(3). С. 90-108.
Ivanko D., Ryumin D., Markitantov M. End-to-end Visual Speech Recognition for Human-Robot Interaction // Proceedings of IV International Scientific Conference MIP: Engineering-IV-2022: Modernization, Innovations, Progress: Advanced Technologies in Material Science, Mechanical and Automation Engineering. 2022. pp. 82-90.
Двойникова А.А. Распознавание кашля с помощью анализа спектрограмм // Альманах научных работ молодых ученых Университета ИТМО. 2022. Т. 2. С. 230-234.