OpenAI отменил список ожидания для доступа к своей системе преобразования текста в изображение DALL-E 2, а это означает, что любой может немедленно зарегистрироваться для использования генератора изображений AI.
Компания представила оригинальный DALL-E в январе 2021 года, и этот инструмент впечатлил как экспертов по искусственному интеллекту, так и общественность своей способностью превращать любое текстовое описание в уникальное изображение. С тех пор был создан ряд других систем преобразования текста в изображения, которые могут соперничать по скорости и качеству с DALL-E. Доступ к другим системам, таким как Midjourney и Stable Diffusion, можно получить намного быстрее и проще, что отвлекает внимание от собственного предложения OpenAI.
OpenAI, получившая значительное финансирование от технологического гиганта Microsoft, с осторожностью относится к публичному выпуску DALL-E. Эксперты отмечают, что способность систем преобразования текста в изображение, создавать обнаженные тела и фотореалистичные изображения без согласия потенциально опасна — это прямой путь к оскорблениям, пропаганде, дезинформации и многому другого.
Есть также вопросы предвзятости. Поскольку системы преобразования текста в изображения обучаются на обширных наборах данных изображений, взятых из Интернета, они воспроизводят неравные аспекты общества. Например, попросите систему нарисовать генерального директора, и она, как правило, создаст изображение белого человека.
OpenAI предпринял ряд мер для борьбы с этими эффектами, в том числе отфильтровал изображения сексуального характера и насилия из своих обучающих данных и отказался генерировать изображения на основе столь же явных подсказок. Однако компанию также критиковали за то, что некоторые считают чрезмерно ограничительным или неуклюжим подходом к уменьшению вреда.
Эмад Мостак, который помог разработать Stable Diffusion для преобразования текста в изображение, сказал, например, что для OpenAI было «д*рьмово» не генерировать изображения из таких слов, как «Украина» и «Одесса» (предположительно, эти термины подвергаются цензуре из-за их способности создавать дезинформацию во время происходящих событий).
Другие критиковали попытки компании исправить предвзятость как «хакерские». Например, DALL-E незаметно вставляет такие фразы, как «Черный мужчина» и «Азиатская женщина» в пользовательские подсказки, в которых не указывается пол или этническая принадлежность, чтобы подтолкнуть систему к созданию изображений белых людей (OpenAI подтвердил новостному изданию The Verge, что использует этот метод). Это снижает предвзятость получаемых изображений DALL-E, но некоторые пользователи отмечают, что это также создает нежелательные изображения, которые не соответствуют их инструкциям.
В своем сегодняшнем сообщении в блоге OpenAI заявила, что удовлетворена улучшениями, внесенными в ее системы безопасности, и что это поможет компенсировать потенциальный вред, поскольку DALL-E становится более доступным.
«В последние месяцы мы сделали наши фильтры более надежными, чтобы отклонять попытки создания сексуального, насильственного и другого контента, нарушающего нашу политику в отношении контента, и создавать новые методы обнаружения и реагирования, чтобы остановить неправомерное использование», — говорится в сообщении компании.
Фирма также заявила, что тестирует API для DALL-E, который позволит компаниям создавать свои собственные приложения и плагины, используя выходные данные системы. Это значительно облегчит OpenAI коммерциализацию результатов DALL-E, потенциально комбинируя систему с инструментами, используемыми, например, иллюстраторами и дизайнерами.
Любой, кто подпишется на доступ к DALL-E, получит 50 бесплатных кредитов, а затем еще 15 бесплатных кредитов каждый месяц после этого. Каждый кредит можно использовать для создания одного изображения, варианта изображения или для «докрашивания» и «закрашивания» (редактирования содержимого изображения или расширения изображения за его существующие границы). Дополнительные кредиты можно купить блоками по 115 штук за 15 долларов. OpenAI сообщает, что около 1,5 миллиона пользователей DALL-E ежедневно генерируют более 2 миллионов изображений.
Но, по всей видимости, могут возникнуть проблемы при регистрации аккаунте на территории России, так что желающим воспользоваться нейросетью может потребоваться помощь ВПН сервиса.
Подписывайтесь на T4S.TECH в Telegram. Публикуем новости, обзоры и забавные факты о технологиях.