ruDALL-E – нейросеть от Сбера для создания изображений по описанию. Умеет анализировать текстовые запросы на русском языке. Основана на мультиязычной text-to-image диффузионной модели Kandinsky 3.0. Разработка ruDALL-E – крупнейший нейросетевой вычислительный проект на территории России и стран СНГ.
Полезные ссылки:
Создание изображений
Нейросеть ruDALL-E доступна на официальном сайте проекта, в приложении Салют и Телеграм-боте. ИИ позволяет создавать изображения без ограничений по выбранному описанию.
Нейросеть генерирует картинку по текстовому запросу в три шага:
- анализирует описание и создает подборку картинок;
- отбирает результаты в соответствии с запросом;
- масштабирует изображение до большего размера без потери качества.
ИИ создает новые картинки в формате JPG по указанному запросу. Достаточно ввести описание и пройти проверку капчей.
Доступен выбор соотношения сторон: 1 x 1, 16 x 9, 9 x 16, 3 x 2, 2 x 3. Можно настроить предпочтительное разрешение и стиль картинки. Время создания изображения – 1 минута.
Модель ruDALL-E XL также доступна бесплатно для скачивания на сервисах Github и Hugging Face.
Принцип работы
Нейросеть ruDALL-E Kandinsky умеет создавать визуальные материалы любой направленности: иллюстрации, рекламные изображения, фотореалистичные портреты, рисунки, мозаики.
Искусственный интеллект обучен на платформе ML Space с использованием двух типов данных – картинки и тексты. Нейросеть поддерживает две модели ИИ: ruDALL-E XL и ruDALL-E 12B.
Нейросеть ruDALL-E от Сбера – крупнейшая модель ИИ в мире, понимающая русский язык. В ее основе лежит код OpenAI, переработанный разработчиками SberDevices, Sber AI и SberCloud.
Особенности
- нейросеть генерирует изображения по описанию;
- ИИ понимает запросы на русском и английском языках;
- доступен выбор стиля рисования и соотношения сторон;
- не требуется регистрация;
- нейросеть используется бесплатно.