«ВКонтакте» запустила технологию распознавания аудиосообщений

Технологии/гаджеты 09 июня, 2020 / 12:39

«ВКонтакте» объявила о появлении новой функции — распознавании аудиосообщений. Пользователи получили возможность читать полученные голосовые записи.

За распознавание речи отвечает новая нейросеть, созданная командой исследований VK. По словам разработчиков, от аналогичных технологий она отличается тем, что учитывает высокую нагрузку платформы, русскоязычный сленг и сложные условия записи. Функция распознаёт как полученные, так и отправленные голосовые сообщения длительностью до 30 секунд.

Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке, — рассказал директор по исследованиям в области искусственного интеллекта «ВКонтакте» Павел Калайдин.

Функция работает в мобильном приложении VK и уже появилась у части пользователей. Всем юзерам соцсети она станет доступна в ближайшую неделю. Распознавание голосовых сообщений полностью автоматизировано и проводится при помощи методов искусственного интеллекта.

Ранее NEWS.ru рассказал, что «ВКонтакте» запустила сервис «Клипы». Он представляет собой ленту коротких вертикальных видео на разные темы, от развлечений до образования. Одной из главных особенностей «Клипов» стало управление с помощью AR-механик: юзеры могут начать запись или включить эффект благодаря специальным жестам.