Лаборатория речевых и многомодальных интерфейсов

Публикации

2017

Verkholyak O., Karpov A. Combining utterance-level and frame-level feature representations for emotion classification from speech. In Proc. IEEE International Symposium «Video and Audio Signal Processing in the Context of Neurotechnologies», SPCN‐2017, 2017, p. 31.
Тампель И.Б., Карпов А.А. Автоматическое распознавание речи. Учебное пособие - СПб: Университет ИТМО, 2017, 152 с.
Карасев Е.Ю., Савельев А.И., Малов Д.А. Управление потоками аудио- и видеоданных в пиринговых приложениях видеоконференцсвязи. Материалы 10-й Всероссийской мультиконференции МКПУ-2017, Т. 3. Управление в распределенных и сетевых системах, 2017, С. 94-96.
Будков В.Ю., Савельев А.И., Басов О.О., Ронжин А.Л., Корпус русской речи для исследования истинности передаваемого сообщения // Труды седьмого междисциплинарного семинара «Анализ разговорной русской речи» (АР3 - 2017), Санкт-Петербург, 2017, С. 21-25.
Крючков Б.И., Карпов А.А., Усов В.М., Чертополохов В.А. Многоуровневый мониторинг жестового управления мобильным роботом при внекорабельной деятельности на поверхности Луны. Труды XIX Международной конференции «Проблемы управления и моделирования в сложных системах» ПУМСС-2017, Самара, 2017, С. 153-159.
Величко А.Н., Будков В.Ю., Карпов А.А. Аналитический обзор компьютерных паралингвистических систем для автоматического распознавания лжи в речи человека // Информационно-управляющие системы, No 5, 2017, С. 30-41.
Кипяткова И.С., Карпов А.А. Исследование нейросетевых моделей русского языка для систем автоматического распознавания слитной речи // Автоматика и телемеханика, Т. 78, No 5, 2017, С. 110-122.
Kryuchkov B., Usov V., Tchertopolokhov V., Ronzhin A., Karpov A. Simulation of the “cosmonaut-robot” system interaction on the lunar surface based on methods of machine vision and computer graphics. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. In Proc. ISPRS International Workshop “Photogrammetric and computer vision techniques for video Surveillance, Biometrics and Biomedicine” PSBB-2017, Moscow, 2017, pp. 129-133.
Подробнее
Ryumin D., Karpov A. Parametric representation of the speaker’s lips for multimodal sign language and speech recognition. The International Archives of the Photogrammetry, Remote Sensing and Spatial Information Sciences. In Proc. ISPRS International Workshop “Photogrammetric and computer vision techniques for video Surveillance, Biometrics and Biomedicine” PSBB-2017, Moscow, 2017, pp. 155-161.
Подробнее
Vatamaniuk I., Budkov V., Kipyatkova I., Karpov A. Methods and Algorithms of Audio-Video Signal Processing for Analysis of Indoor Human Activity. In: Favorskaya M., Jain L. (eds.) Computer Vision in Control Systems-4. Intelligent Systems Reference Library, Springer, vol. 136. 2018, pp. 139-173.
Подробнее
Verkholyak O., Karpov A. Combined feature representation for emotion classification from Russian speech. In Proc. 6th International Conference on Artificial Intelligence and Natural Language AINL-2017, St. Petersburg, Communications in Computer and Information Science, Springer, vol. 789, pp. 68-73.
Подробнее
Markovnikov N., Kipyatkova I., Karpov A., Filchenkov A. Deep neural networks in Russian language recognition. In Proc. 6th International Conference on Artificial Intelligence and Natural Language AINL-2017, St. Petersburg, Springer, Communications in Computer and Information Science, vol. 789, pp. 54-67.
Подробнее
Pugachev A., Akhtiamov O., Karpov A., Minker W. Deep Learning for Acoustic Addressee Detection in Spoken Dialogue Systems. In Proc. 6Th International Conference on Artificial Intelligence and Natural Language AINL-2017, St. Petersburg, Communications in Computer and Information Science, Springer, vol. 789, pp. 45-53.
Подробнее
Kryuchkov B., Syrkin L., Usov V., Ivanko D., Ivanko Dm. Using Augmentative and Alternative Communication for Human Robot Interaction during Maintaining Habitability of a Lunar Base. In Proc. 2Nd International Conference on Interactive Collaborative Robotics ICR-2017, Hatfield, UK, Springer LNCS vol. 10459, 2017, pp. 95–104.
Подробнее
Gruber I., Hlaváč M., Železný M., Karpov A. Facing Face Recognition with ResNet: Round One. In Proc. 2nd International Conference on Interactive Collaborative Robotics ICR-2017, Hatfield, UK, Springer LNCS vol. 10459, 2017, pp. 67-74.
Подробнее