Лаборатория речевых и многомодальных интерфейсов

Публикации

2020

Двойникова А.А., Верхоляк О.В., Карпов А.А. Сентимент-анализ разговорной речи при помощи метода, основанного на тональных словарях // Альманах научных работ молодых ученых Университета ИТМО. 2020. Т. 3. С. 75-80.
Рюмина Е.В. Метод извлечения информативных видеопризнаков для распознавания эмоций // Альманах научных работ молодых ученых Университета ИТМО. 2020, Т.3. С. 151-155.
Аксёнов А., Рюмина Е.В. Аналитический обзор современных методов детектирования лиц // Альманах научных работ молодых ученых Университета ИТМО. 2020, T. 3, С. 12-19.
Маркитантов М.В. Аналитический обзор аудиовизуальных корпусов речи для автоматического распознавания возраста диктора // Альманах научных работ молодых учёных Университета ИТМО. 2020, Т. 3, С. 124-128.
Верхоляк О.В., Карпов А.А. Глава “Автоматический анализ эмоционально окрашенной речи” в коллективной монографии “Голосовой портрет ребенка с типичным и атипичным развитием” / Ляксо Е.Е., Фролова О.В., Гречаный С.В., Матвеев Ю.Н., Верхоляк О.В., Карпов А.А. / СПб: Издательско-полиграфическая ассоциация высших учебных заведений, 2020, 204 c. ISBN 978-5-91155-096-7.
Ivanko D., Ryumin D., Kipyatkova I., Axyonov A., Karpov A. Lip-reading Using Pixel-based and Geometry-based Features for Multimodal Human-Robot Interfaces // Smart Innovation, Systems and Technologies, Springer, vol. 154, Zavalishin’s Readings 2019, 2020, pp. 477-486.
Подробнее
Ryumin D., Ivanko D., Kagirov I., Axyonov A., Karpov A. Vision-Based Assistive Systems for Deaf and Hearing Impaired People // In: Favorskaya M., Jain L. (eds) Computer Vision in Advanced Control Systems-5, Intelligent Systems Reference Library, Springer, vol. 175, 2020, pp. 197-224.
Подробнее

2019

Verkholyak O., Fedotov D., Kaya H., Zhang Y., Karpov A. Hierarchical Two-Level Modelling of Emotional States in Spoken Dialog Systems. In Proc. 44th IEEE International Conference on Acoustics, Speech, and Signal Processing ICASSP-2019, Brighton, UK, 2019, pp. 6700-6704.
Подробнее
Kaya H., Fedotov D., Dresvyanskiy D., Doyran M., Mamontov D., Markitantov M., Akdag Salah A., Kavcar E., Karpov A., Salah A.A. Predicting depression and emotions in the cross-roads of cultures, para-linguistics, and non-linguistics. In Proc. 9th International Audio/Visual Emotion Challenge and Workshop AVEC’19, co-located with ACM Multimedia 2019, Nice, France, 2019, pp. 27-35.
Подробнее
Ryumin D., Ivanko D., Kagirov I., Axyonov A., Karpov A., Zelezny M. Human-Robot Interaction with Smart Shopping Trolley using Sign Language: Data Collection. In Proc. 2019 IEEE International Conference on Pervasive Computing and Communications Workshops, PerCom Workshops 2019, Kyoto, Japan, 2019, pp. 949-954.
Подробнее
Akhtiamov O., Siegert I., Karpov A., Minker W. Cross-Corpus Data Augmentation for Acoustic Addressee Detection. In Proc. 20th ACL International Conference on Discourse and Dialogue SIGDial-2019, Stockholm, Sweden, 2019, pp. 274-283.
Подробнее
Fedotov D., Kim B., Karpov A., Minker W. Time-Continuous Emotion Recognition Using Spectrogram Based CNN-RNN Modelling // Lecture Notes in Computer Science, Springer LNAI 11658, SPECOM 2019, 2019, pp. 93-102.
Подробнее
Yu J., Markov K., Karpov A. Speaking Style Based Apparent Personality Recognition // Lecture Notes in Computer Science, Springer LNAI 11658, SPECOM 2019, 2019, pp. 540-548.
Подробнее
Verkholyak O.V., Kaya H., Karpov A.A. Modeling short-term and long-term dependencies of the speech signal for paralinguistic emotion classification // Труды СПИИРАН (SPIIRAS Proceedings), Вып. 62, № 1, 2019, С. 30-56.
Подробнее
Иванько Д.В., Рюмин Д.А., Карпов А.А., Железны М. Исследование влияния высокоскоростных видеоданных на точность распознавания аудиовизуальной речи // Информационно-управляющие системы (Informatsionno-Upravliaiushchie Sistemy) [Information and Control Systems], № 2, 2019, C. 26-34.
Подробнее