Результаты конференции INTERSPEECH 2022
23 Международная конференция INTERSPEECH 2022 в этом году проводилась с 18 по 20 сентября в городе Инчхон, Южная Корея в гибридном формате. Данная конференция является крупнейшей в мире, посвященная науке и технологиям обработки живой речи и в этом году заглавная тема которой звучала как «Человек и гуманизация речевых технологий».
Виртуальные участники выступали в формате постера: им предлагалось подготовить 15-ти минутную видео-презентацию доклада, а также постер размера A0. Кроме того, в день проведения сессии виртуальные участники должны были присутствовать в специальной платформе Gather для ответов на вопросы по докладам. Данная платформа предназначена для того, чтобы превратить виртуальное взаимодействие во взаимодействие лицом к лицу. Организаторы построили систему комнат для каждой сессии, в которой для каждого доклада отводилось определенное место, обозначенное постером.
Конференция INTERSPEECH была посвящена таким вопросам, как:
- восприятие речи человеком;
- фонетика, фонология речи;
- анализ паралингвистических явлений в речи и в языке;
- распознавание речи;
- анализ речи и звуковых сигналов;
- кодирование и улучшение речи;
- синтез речи;
- распознавание речи — обработка речевого сигнала, надежность акустического моделирования и адаптация, анализ лингвистических компонентов, технологии и системы распознавания речи;
- обработка разговорной речи — обобщение, понимание, перевод и поиск информации в речи.
По итогам конференции были опубликованы три наших статьи, одна из них совместно с иностранными коллегами.
- Markitantov M., Ryumina E., Ryumin D., Karpov A. Biometric Russian Audio-Visual Extended MASKS (BRAVE-MASKS) Corpus: Multimodal Mask Type Recognition Task // In Proc. of INTERSPEECH. 2022. pp. 1756-1760. DOI: 10.21437/Interspeech.2022-10240.
- Velichko A., Markitantov M., Kaya H., Karpov A. Complex Paralinguistic Analysis of Speech: Predicting Gender, Emotions and Deception in a Hierarchical Frameworkk // In Proc. of INTERSPEECH. 2022. pp. 4735-4739, DOI: 10.21437/Interspeech.2022-11294.
- Ivanko D., Ryumin D., Kashevnik A., Axyonov A., Kitenko A., Lashkov I., Karpov A. DAVIS: Driver’s Audio-Visual Speech recognition // In Proc. of INTERSPEECH. 2022. pp. 1141-1142.