Лаборатория речевых и многомодальных интерфейсов

Публикации

2018

Ivanko D., Ryumin D., Axyonov A., Železný M. Designing Advanced Geometric Features for Automatic Russian Visual Speech Recognition. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 245-254.
Markovnikov N., Kipyatkova I., Lyakso E. End-to-End Speech Recognition in Russian. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 377-386.
Kipyatkova I. Improving Russian LVCSR Using Deep Neural Networks for Acoustic and Language Modeling. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 291-300.
Hlaváč M., Gruber I., Železný M., Karpov A. LipsID using 3D Convolutional Neural Network. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 209-214.
Velichko A., Budkov V., Kagirov I., Karpov A. Comparative Analysis of Classification Methods for Automatic Deception Detection in Speech. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 737-746.
Fedotov D., Kaya H., Karpov A. Context Modeling for Cross-Corpus Dimensional Acoustic Emotion Recognition: Challenges and Mixup. In Proc. 20th International Conference on Speech and Computer SPECOM-2018, Leipzig, Germany, Springer, LNAI vol. 11096, 2018, pp. 155-165.
Kaya H., Fedotov D., Yesilkanat A., Verkholyak O., Zhang Y., Karpov A. LSTM based Cross-corpus and Cross-task Acoustic Emotion Recognition. In Proc. 19th International Conference INTERSPEECH-2018, Hyderabad, India, ISCA, 2018, pp. 521-525.
Подробнее
Vatamaniuk I.V., Budkov V.Y., Kipyatkova I.S., Karpov A.A. Methods and Algorithms of Audio-Video Signal Processing for Analysis of Indoor Human Activity. In: Favorskaya M., Jain L. (eds.) Computer Vision in Control Systems-4. Intelligent Systems Reference Library, vol. 136. Springer, 2018, pp. 139-173.
Подробнее
Верходанова В.О., Шапранов В.В., Кипяткова И.С., Карпов А.А. Автоматическое определение вокализованных хезитаций в русской речи // Вопросы языкознания. М.: Наука, № 6, 2018, С. 104-118.
Подробнее
Иванько Д.В., Федотов Д.В., Карпов А.А. Повышение точности автоматического распознавания визуальной русской речи: оптимизация виземных классов // Научно-технический вестник информационных технологий, механики и оптики. 2018. Т. 18. № 2. С. 346–349. doi: 10.17586/2226-1494-2018-18-2-346-349
Подробнее
Марковников Н.М., Кипяткова И.C. Аналитический обзор интегральных систем распознавания речи // Труды СПИИРАН. 2018. Вып. 58. C. 77-110.
Подробнее
Karpov A., Mporas I. Speech Communication Integrated with Other Modalities (Editorial) // Journal on Multimodal User Interfaces, Springer, Vol. 12, № 4, 2018, pp. 271-272.
Подробнее
Karpov A.A., Yusupov R.M. Multimodal Interfaces of Human-Computer Interaction // Herald of the Russian Academy of Sciences, Springer, Vol. 88, No. 1, 2018, pp. 67-74.
Подробнее
Ivanko D., Karpov A., Fedotov D., Kipyatkova I., Ryumin D., Ivanko Dm., Minker W., Zelezny M. Multimodal Speech Recognition: Increasing Accuracy using High Speed Video Data // Journal on Multimodal User Interfaces, Springer, Vol. 12, № 4, 2018, pp. 319-328.
Подробнее
Карпов А.А., Юсупов Р.М. Многомодальные интерфейсы человеко-машинного взаимодействия // Вестник Российской академии наук, Т. 88, № 2, 2018, С. 146-155.
Подробнее