Японская компания создала голосовой фильтр, который преобразует крики в спокойную речь

22 июня 2024 в 17:27
Фото: Icons8 Team/Unsplash

Японская компания SoftBank разработала фильтр, который с помощью искусственного интеллекта преобразует гневные крики в спокойную речь. Об этом сообщает Oddity Central.

Фильтр предназначен для сотрудников кол-центров, которые часто сталкиваются с недовольством клиентов. Технологическое решение должно снизить стресс, который испытывают работники.

SoftBank говорит, что разрабатывал фильтр три года. Он работает в два этапа — на первом ИИ распознает агрессивный голос и извлекает ключевые моменты в речи, а на втором использует акустические инструменты для преобразования криков в более естественный и даже вежливый тон.

При этом фильтр не меняет ни единого слова, произносимого человеком, — лишь смягчает интонацию. Таким образом, операторы кол-центров будут слышать все произнесенные оскорбления, просто более мягким тоном.

Для обучения ИИ инженеры SoftBank попросили 10 актеров записать не менее 100 общих фраз, включая крики, обвинения, угрозы и требования извинений. Всего для обучения фильтра было использовано более 10 тыс. голосовых аудиофрагментов.