Нейросеть ElevenLabs

Озвучивание текста на 29 языках с эмоциями и интонационными паузами.


3 мин чтения
Нейросеть ElevenLabs

ElevenLabs – нейросеть для синтеза человеческой речи. Инструмент озвучивает текст и создает аудиозаписи с мужскими или женскими голосами.

Перейти на официальный сайт ElevenLabs.

Общая информация

Сайт проекта зарегистрирован в 2022 году Петром Дабковски и Мати Станишевски. Бета-версия нейросети запущена в январе 2023 года. Цель проекта – повысить качество озвучки в фильмах.

Элевен Лабс распознает текст в файлах epub, txt и pdf. Подходит для озвучивания книг. Нейросеть полезна для видеоблогов, подкастов, кино и сериалов.

Пример дубляжа отрывка из книги «Властелин Колец»‎ Дж. Р. Р. Толкина.

Русский язык, женский голос:

audio-thumbnail
0:00
/29.857938

Английский язык, мужской голос:

audio-thumbnail
0:00
/29.518313

Хинди, мужской голос:

audio-thumbnail
0:00
/30.772188

Регистрация и тарифы

Для регистрации потребуются электронная почта и пароль. Email нужно подтвердить. Возможна авторизация через аккаунт Google.

Разработчики предоставляют шесть тарифных планов:

  • Бесплатный – 10 тысяч символов, 3 голоса.
  • Стартовый – 30 тысяч символов, 10 голосов за 5 долларов в месяц.
  • Творческий – 100 тысяч символов, 30 голосов за 22 доллара в месяц.
  • Для независимого издателя – 500 тысяч символов, 160 голосов за 99 долларов в месяц.
  • Бизнес – 2 миллиона символов, 660 голосов за 330 долларов в месяц.
  • Корпоративный – индивидуальные цены и квоты, безлимитное количество голосов.

Подписка обеспечивает битрейт 192 кбит/с и частоту дискретизации 44,1 КГц. После оплаты материалы доступны для коммерческого использования. Предоставляется корпоративная поддержка и приоритетная очередь обработки.

Возможности

На сайте присутствует встроенная коллекция из 50 мужских и женских голосов. Доступна настройка тонна, громкости, четкости, манеры повествования. Для обработки нужно написать текст и выбрать голос.

Поддерживается загрузка аудиозаписей с собственной или чужой речью. Нейросеть копирует голос и озвучивает текст.

Искусственный интеллект разговаривает на 29 языках, включая английский, русский, польский, китайский, французский, хинди, немецкий.

Социальные сети

Использование

Elevenlabs автоматически озвучивает текст после выбора голоса из встроенной коллекции. Чтобы нейросеть скопировала чужую речь, необходимо:

  1. Нажать кнопку +Add Voice и загрузить аудиозапись голоса.
  2. Выбрать функцию клонирования.
  3. Дождаться завершения процесса и дать название полученному голосу.
  4. Нажать «Использовать» и добавить текст.
  5. Воспроизвести и сохранить сгенерированный файл.

Доступна настройка параметров озвучки:

  • пол и возраст;
  • язык и акцент;
  • скорость речи.

ElevenLabs имитирует эмоции в процессе озвучивания: радость, грусть, удивление и паузы. На записи можно отметить участки.

Сервис позволяет прервать синтез речи и продолжить позже без потери информации.

Нейросеть Leonardo Ai
Создание изображений по текстовому описанию, встроенный редактор и социальная платформа.

Особенности

  • нейросеть озвучивает текст;
  • доступно копирование голоса;
  • поддерживаются 29 языков дикторов с разными акцентами;
  • регистрация через Google-аккаунт;
  • интерфейс на английском языке;
  • озвучка 10 тысяч символов в месяц бесплатно.
Подписывайтесь на T4S.TECH в Telegram. Публикуем новости, обзоры и забавные факты о технологиях.

Вверх

🎉 Вы успешно подписались на новости сайта T4S.TECH!
OK