Лаборатория речевых и многомодальных интерфейсов

Публикации

2020

Кипяткова И.С., Марковников Н.М. Исследование методов улучшения интегральных систем распознавания речи при недостатке обучающих данных // Труды III Всероссийской акустической конференции ВАК. 2020. С. 361-367.
Аксёнов А., Рюмин Д., Кагиров И.А., Иванько Д., Карпов А.А. Способ отслеживания ориентиров рук для бесконтактного жестового человеко-машинного взаимодействия. Cборник тезисов 31-й международной научно-технической конференции «Экстремальная робототехника» 2020, Санкт-Петербург, 2020, С. 34-36.
Михайлюк М.В., Карпов А.А., Крючков Б.И., Усов В.М., Довженко В.А. Голосовое управление сервисными роботами в условиях возможных ограничений двигательных функций человека в космическом полете. Материалы XII Всероссийской научно-технической конференции «Робототехника и искусственный интеллект» РИИ-2020, Железногорск, 2020, С. 197-201.
Двойникова А.А., Верхоляк О.В., Карпов А.А. Сентимент-анализ разговорной речи при помощи метода, основанного на тональных словарях // Альманах научных работ молодых ученых Университета ИТМО. 2020. Т. 3. С. 75-80.
Рюмина Е.В. Метод извлечения информативных видеопризнаков для распознавания эмоций // Альманах научных работ молодых ученых Университета ИТМО. 2020, Т.3. С. 151-155.
Аксёнов А., Рюмина Е.В. Аналитический обзор современных методов детектирования лиц // Альманах научных работ молодых ученых Университета ИТМО. 2020, T. 3, С. 12-19.
Маркитантов М.В. Аналитический обзор аудиовизуальных корпусов речи для автоматического распознавания возраста диктора // Альманах научных работ молодых учёных Университета ИТМО. 2020, Т. 3, С. 124-128.
Верхоляк О.В., Карпов А.А. Глава “Автоматический анализ эмоционально окрашенной речи” в коллективной монографии “Голосовой портрет ребенка с типичным и атипичным развитием” / Ляксо Е.Е., Фролова О.В., Гречаный С.В., Матвеев Ю.Н., Верхоляк О.В., Карпов А.А. / СПб: Издательско-полиграфическая ассоциация высших учебных заведений, 2020, 204 c. ISBN 978-5-91155-096-7.
Ivanko D., Ryumin D., Kipyatkova I., Axyonov A., Karpov A. Lip-reading Using Pixel-based and Geometry-based Features for Multimodal Human-Robot Interfaces // Smart Innovation, Systems and Technologies, Springer, vol. 154, Zavalishin’s Readings 2019, 2020, pp. 477-486.
Подробнее
Ryumin D., Ivanko D., Kagirov I., Axyonov A., Karpov A. Vision-Based Assistive Systems for Deaf and Hearing Impaired People // In: Favorskaya M., Jain L. (eds) Computer Vision in Advanced Control Systems-5, Intelligent Systems Reference Library, Springer, vol. 175, 2020, pp. 197-224.
Подробнее

2019

Verkholyak O., Fedotov D., Kaya H., Zhang Y., Karpov A. Hierarchical Two-Level Modelling of Emotional States in Spoken Dialog Systems. In Proc. 44th IEEE International Conference on Acoustics, Speech, and Signal Processing ICASSP-2019, Brighton, UK, 2019, pp. 6700-6704.
Подробнее
Kaya H., Fedotov D., Dresvyanskiy D., Doyran M., Mamontov D., Markitantov M., Akdag Salah A., Kavcar E., Karpov A., Salah A.A. Predicting depression and emotions in the cross-roads of cultures, para-linguistics, and non-linguistics. In Proc. 9th International Audio/Visual Emotion Challenge and Workshop AVEC’19, co-located with ACM Multimedia 2019, Nice, France, 2019, pp. 27-35.
Подробнее
Ryumin D., Ivanko D., Kagirov I., Axyonov A., Karpov A., Zelezny M. Human-Robot Interaction with Smart Shopping Trolley using Sign Language: Data Collection. In Proc. 2019 IEEE International Conference on Pervasive Computing and Communications Workshops, PerCom Workshops 2019, Kyoto, Japan, 2019, pp. 949-954.
Подробнее
Akhtiamov O., Siegert I., Karpov A., Minker W. Cross-Corpus Data Augmentation for Acoustic Addressee Detection. In Proc. 20th ACL International Conference on Discourse and Dialogue SIGDial-2019, Stockholm, Sweden, 2019, pp. 274-283.
Подробнее
Fedotov D., Kim B., Karpov A., Minker W. Time-Continuous Emotion Recognition Using Spectrogram Based CNN-RNN Modelling // Lecture Notes in Computer Science, Springer LNAI 11658, SPECOM 2019, 2019, pp. 93-102.
Подробнее