Лаборатория речевых и многомодальных интерфейсов

Публикации

2018

Kipyatkova I. Improving Russian LVCSR Using Deep Neural Networks for Acoustic and Language Modeling. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 291-300.
Hlaváč M., Gruber I., Železný M., Karpov A. LipsID using 3D Convolutional Neural Network. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 209-214.
Velichko A., Budkov V., Kagirov I., Karpov A. Comparative Analysis of Classification Methods for Automatic Deception Detection in Speech. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 737-746.
Fedotov D., Kaya H., Karpov A. Context Modeling for Cross-Corpus Dimensional Acoustic Emotion Recognition: Challenges and Mixup. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 155-165.
Kaya H., Fedotov D., Yesilkanat A., Verkholyak O., Zhang Y., Karpov A. LSTM based Cross-corpus and Cross-task Acoustic Emotion Recognition. In Proc. 19th International Conference INTERSPEECH-2018, Hyderabad, India, ISCA, 2018, pp. 521-525.
Подробнее
Vatamaniuk I.V., Budkov V.Y., Kipyatkova I.S., Karpov A.A. Methods and Algorithms of Audio-Video Signal Processing for Analysis of Indoor Human Activity. In: Favorskaya M., Jain L. (eds.) Computer Vision in Control Systems-4. Intelligent Systems Reference Library, vol. 136. Springer, 2018, pp. 139-173.
Подробнее
Верходанова В.О., Шапранов В.В., Кипяткова И.С., Карпов А.А. Автоматическое определение вокализованных хезитаций в русской речи // Вопросы языкознания. М.: Наука, № 6, 2018, С. 104-118.
Подробнее
Иванько Д.В., Федотов Д.В., Карпов А.А. Повышение точности автоматического распознавания визуальной русской речи: оптимизация виземных классов // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 2. С. 346–349. doi: 10.17586/2226-1494-2018-18-2-346-349
Подробнее
Марковников Н.М., Кипяткова И.C. Аналитический обзор интегральных систем распознавания речи // Труды СПИИРАН. 2018. Вып. 58. C. 77-110.
Подробнее
Karpov A., Mporas I. Speech Communication Integrated with Other Modalities (Editorial) // Journal on Multimodal User Interfaces, Springer, Vol. 12, № 4, 2018, pp. 271-272.
Подробнее
Karpov A.A., Yusupov R.M. Multimodal Interfaces of Human-Computer Interaction // Herald of the Russian Academy of Sciences, Springer, Vol. 88, No. 1, 2018, pp. 67-74.
Подробнее
Ivanko D., Karpov A., Fedotov D., Kipyatkova I., Ryumin D., Ivanko Dm., Minker W., Zelezny M. Multimodal Speech Recognition: Increasing Accuracy using High Speed Video Data // Journal on Multimodal User Interfaces, Springer, Vol. 12, № 4, 2018, pp. 319-328.
Подробнее
Карпов А.А., Юсупов Р.М. Многомодальные интерфейсы человеко-машинного взаимодействия // Вестник Российской академии наук, Т. 88, № 2, 2018, С. 146-155.
Подробнее
Kaya H., Karpov A. Efficient and Effective Feature Normalization Strategies for Cross-Corpus Acoustic Emotion Recognition // Neurocomputing. Elsevier, Vol. 275, 2018, pp. 1028-1034.
Подробнее

2017

Кипяткова И.С. Разработка и исследование нейросетевых гибридных акустических моделей для системы распознавания русской речи. Материалы XXII Санкт-Петербургской ассамблеи молодых ученых и специалистов, 2017, С. 201.