Лаборатория речевых и многомодальных интерфейсов

Публикации

2023

Ryumin D., Ivanko D., Ryumina E. Audio-Visual Speech and Gesture Recognition by Sensors of Mobile Devices // Sensors. 2023. vol. 23(4). no. 2284.
Аксёнов А.А., Рюмина Е.В., Рюмин Д.А., Иванько Д.В., Карпов А.А. Нейросетевой метод визуального распознавания голосовых команд водителя с использованием механизма внимания // Научно-технический вестник информационных технологий, механики и оптики. 2023. Т. 23. № 4. C. 767–775.
Кипяткова И.С., Кагиров И.А. Система автоматического распознавания карельской речи // Информационно-управляющие системы. 2023. Т. 3. С. 16–25.
Величко А.Н., Карпов А.А. Методика и программная система интегрального анализа деструктивных паралингвистических явлений в разговорной речи // Информационно-управляющие системы. 2023. Т. 4. С. 2–11.
Dvoynikova A., Karpov A. Bimodal Sentiment and Emotion Classification with Multi-Head Attention Fusion of Acoustic and Linguistic Information // Computational Linguistics and Intellectual Technologies: Proceedings of the International Conference «Dialogue 2023». 2023. vol. 22. pp. 51–61.
Ryumin D., Ivanko D., Axyonov A. Cross-Language Transfer Learning Using Visual Information for Automatic Sign Gesture Recognition // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2023. vol. XLVIII. pp. 209–216.
Ryumina E., Karpov A. Impact of Visual Modalities in Multimodal Personality and Affective Computing // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2023. vol. 48. pp. 217–224.
Ivanko D., Ryumina E., Ryumin D. Improved Automatic Lip-Reading Based on the Evaluation of Intensity Level of Speaker’s Emotion // The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. 2023. vol. 48. pp. 89–94
Ivanko D., Ryumina E., Ryumin D., Axyonov A., Kashevnik A., Karpov A. EMO-AVSR: Two-Level Approach for Audio-Visual Emotional Speech Recognition// In Proc. of the 25th International Conference on Speech and Computer SPECOM-2023. Lecture Notes in Computer Science. LNAI. 2023. vol. 14338. pp. 18–31.
Kipyatkova I., Kagirov I. Phone Durations Modeling for Livvi-Karelian ASR// In Proc. of the 25th International Conference on Speech and Computer SPECOM-2023. Lecture Notes in Computer Science. LNAI. 2023. vol. 14339. pp. 87–99.
Karpov A., Dvoynikova A., Ryumina E. Intelligent Interfaces and Systems for Human-Computer Interaction// In Proc. of the 7th International Scientific Conference “Intelligent Information Technologies for Industry” IITI-2023. Lecture Notes in Networks and Systems. pp. 3–13.
Кипяткова И.С., Родионова А.П., Кагиров И.А., Крижановский А.А. Подготовка речевых и текстовых данных для создания системы автоматического распознавания карельской речи // Учёные записки Петрозаводского государственного университета. 2023. Т. 45. № 5. С. 89–98.
Двойникова А.А., Кондратенко К.О. Подход к автоматическому распознаванию эмоций в транскрипциях речи // Известия вузов. Приборостроение. 2023. Т. 66. № 10. С. 818–827.
Кагиров И.А. Системы регистрации жестовой информации и их применение в авиакосмических исследованиях. Авиакосмическое приборостроение. 2023. № 10. С. 35–46.
Поволоцкая А.А., Евдокимова В.В., Скрелин П.А. Запись и апробация набора речевых данных для распознавания негативных эмоций в речи. Terra Linguistica. 2023. Т. 14. № 2. С. 59–76.