«ВКонтакте» запустила новую функцию — распознавание аудиосообщений, рассказали «Афише Daily» в пресс-службе соцсети. Теперь пользователям не придется слушать голосовые, их содержание можно будет прочитать. Новая нейросеть расшифрует записанное аудио. В компании обещают, что технология справляется с русскоязычным сленгом и посторонними шумами в голосовых записях.
Функция уже работает у части пользователей мобильного приложения «ВКонтакте», а в ближайшую неделю станет доступна всем. Расшифровывать можно полученные и отправленные голосовые сообщения длительностью до 30 секунд. По данным «ВКонтакте», такие записи составляют около 90% от всех аудио на платформе.
Также «ВКонтакте» запустила поиск по голосовым сообщениям — теперь их можно будет найти с помощью поиска по тексту. В дальнейшем технологию распознавания запустят и в десктопной версии соцсети. Кроме того, в планах «ВКонтакте» — позволить расшифровывать более длинные сообщения, а также пересланные голосовые.
«С другом в чате общаются совсем не так, как с умной колонкой: сообщения записываются на бегу с посторонними шумами, большим количеством сленга и сокращений. Нейросеть должна не просто понять речь, но и сформулировать связный текст. Поэтому на самом деле мы сделали три нейросети: одна отвечает за распознавание, вторая находит подходящие слова, а третья расставляет знаки препинания. Вместе они станут самым высоконагруженным сервисом по распознаванию речи на русском языке», — рассказал о новой разработке директор по исследованиям в области искусственного интеллекта «ВКонтакте» Павел Калайдин.
«ВКонтакте» начала тестировать функцию распознавания голосовых сообщений в марте. Это не первый случай использования нейросетей и машинного обучения — «ВКонтакте» в прошлом году представила нейросеть, способную генерировать новостные заголовки. А в сентябре 2019-го «ВКонтакте» открыла в МФТИ собственную лабораторию искусственного интеллекта.