Нейросеть Voice Engine от OpenAI

Нейросеть копирует голоса других людей и озвучивает ими добавленный текст.


2 мин чтения
Нейросеть Voice Engine от OpenAI

Voice Engine – нейросеть для копирования голоса от компании OpenAI. Переводит ролики и аудио на другой язык с сохранением оригинальной интонации и речевых особенностей. Воспроизводит голос человека на основе 15-секундной записи.

Как работает нейросеть

Нейросеть Voice Engine AI работает на основе ИИ алгоритмов, способных синтезировать любой голос. Искусственный интеллект по короткой аудиозаписи может скопировать и воспроизвести уникальное звучание, эмоциональные оттенки и тембр.

Writesonic - нейросеть для создания текстов
Нейросеть пишет тексты на разных языках и создает изображения по описанию.

Нейросеть подражает речевым особенностям оригинала. Искусственный интеллект от OpenAI работает на основе технологии преобразования текста в речь. За счет этого скопированный голос невозможно отличить от оригинала.

В основе нейронной сети лежит API для чтения текста вслух. ИИ копирует голос человека и озвучиваем им текст, добавленный пользователем.

Как пользоваться Voice Engine

Для использования ИИ функций необходимо перейти на официальный сайт voicengine.ai. Используется англоязычный интерфейс, но сама нейросеть Voice Engine на русском понимает запросы не хуже, чем на других языках.

Для копирования голоса необходимо:

  • нажать кнопку Let’s Go!;
  • выбрать голос или загрузить собственный;
  • набрать текст, который необходимо озвучить.

Нейросеть сгенерирует аудиозапись с выбранным голосом в течение скольких минут.

Компания OpenAI предусмотрела риски, которые представляет технология клонирования голоса. Разработчики добавили строгие правила использования Voice Engine. Требуется обязательно информировать пользователей о том, что аудиозапись создана с помощью нейросети. Запрещается копирование голоса другого человека без согласия.

Стоимость

Нейросеть Voice Engine скачать в качестве отдельного приложения на смартфон нельзя. ИИ работает только в веб-формате.

Нейросеть Voice Engine бесплатно предлагает доступ к набору стандартных голосов и 500 минут сгенерированного звука. Для использования дополнительных функций потребуется оплатить подписку.

Нейросеть Leiapix для оживления фото
Нейросеть превращает фото и картинки в анимацию и видео.

Пользователям доступно три тарифа:

  • Профессиональный – 99 долларов в месяц, 2000 минут сгенерированного звука, набор премиальных голосов, расширенные возможности настройки, доступ к API, приоритетная поддержка.
  • Бизнес – 499 долларов в месяц, 10000 минут сгенерированного звука, функция клонирования голоса, многоязычная поддержка, специальный менеджер по работе с клиентами.
  • Корпоративный – индивидуальное ценообразование, создание пользовательских голосов, улучшенная поддержка, повышенная безопасность, масштабируемые решения.

На момент написания обзора нейросеть находится на этапе бета-тестирования и доступна ограниченному количеству пользователей.

Подписывайтесь на T4S.TECH в Telegram. Публикуем новости, обзоры и забавные факты о технологиях.

Вам понравится

Вверх

🎉 Вы успешно подписались на новости сайта T4S.TECH!
OK