Лаборатория речевых и многомодальных интерфейсов

Статья в международном журнале IEEE Access (Q1)

Наша лаборатория совместно с коллегами из лаборатории интегрированных систем автоматизации опубликовали статью в журнале IEEE Access (Scopus, Q1):

Kashevnik A., Lashkov I., Axyonov A., Ivanko D., Ryumin D., Kolchin A., Karpov A. Multimodal Corpus Design for Audio-Visual Speech Recognition in Vehicle Cabin // IEEE Access, IEEE, 2021, vol. 9, pp. 34986-35003. DOI: 10.1109/ACCESS.2021.3062752

Эта статья представляет новую методологию, направленную на создание мультимодального корпуса для аудиовизуального распознавания речи в системах мониторинга водителей. Мультимодальное распознавание речи позволяет использовать: аудиоданные, когда видеоданные бесполезны (например, в ночное время), а в то время, как видеоданные - в шумных условиях (например, на шоссе). Кроме того, мы разработали мобильное приложение для записи мультимодальной базы данных и с его помощью записали корпус RUSAVIC. Сейчас данный корпус является уникальным аудиовизуальным корпусом для русского языка, записанным в естественных условиях.