OpenAI предоставила свободный доступ к DALL-E 2 – чтобы воспользоваться генератором изображений теперь не нужны приглашения, достаточно просто зарегистрироваться на сайте.
Компания представила оригинальный DALL-E в январе 2021 года, и этот инструмент впечатлил как экспертов по искусственному интеллекту, так и общественность своей способностью превращать любое текстовое описание в уникальное изображение. С тех пор был создан ряд подобных платформ, которые могут соперничать по скорости и качеству с DALL-E. Более того некоторые, такие как Midjourney и Stable Diffusion, есть в открытом доступе.
Нейросеть Text-to-Pokеmon позволяет создать покемона по описанию или имени — посмотрите, как выглядят политики и знаменитости в новом амплуа
OpenAI, получившая значительное финансирование от технологического гиганта Microsoft, всегда осторожно относилась к публичному использованию DALL-E. Эксперты отмечают, что способность систем преобразования текста в изображение создавать обнаженные тела и фотореалистичные изображения без согласия человека — потенциально опасна. Это может повлечь за собой преследования, также инструмент могут использовать для создания пропаганды, дезинформации и многого другого. Кроме того, поскольку системы преобразования текста в изображения обучаются на обширных наборах данных изображений, взятых из Интернета, они воспроизводят неравенство. Например, попросите систему нарисовать генерального директора, и она, как правило, создаст изображение белого человека.
OpenAI предприняла ряд мер для борьбы с этими эффектами, в том числе отфильтровав изображения сексуального характера и насилия из своих обучающих данных и отказалась генерировать изображения на основе очень явных подсказок.
We’ve removed the waitlist for DALL·E. Sign up and start creating immediately! https://t.co/TCVDl1iMeU
— OpenAI (@OpenAI) September 28, 2022
Эмад Мостак, который помог разработать конкурирующую Stable Diffusion для преобразования текста в изображение, писал, что для OpenAI было «идиотским решением» не генерировать изображения из слов «Украина» или «Одесса».
Apparently #DALLE still bans Ukraine as a prohibited word as I flagged before: https://t.co/QygiheMdcq
I’m sorry this is an asshole move.
Many of you have 🇺🇦 in your names to support the brave people there, please contact @OpenAI and tell them it is not right to erase a nation. https://t.co/KvqbUuoCY7— Emad (@EMostaque) June 27, 2022
Другие называли «халтурой» попытки компании исправить предвзятость. Например, DALL-E незаметно вставляет такие фразы, как «Чернокожий мужчина» и «Азиатская женщина» в подсказки пользователям, которые не указывают пол или этническую принадлежность, чтобы оттолкнуть систему от создания изображений белых людей. (OpenAI подтвердила, что использует этот метод.) Это устраняет предвзятость в выводе DALL-E, но некоторые пользователи отмечают, что это также создает нежелательные образы, которые не соответствуют их инструкциям.
There’s some evidence that’s basically how it works: simply tacking race or gender words to prompts before returning results. These are results for “a person holding a sign that says”:https://ift.tt/TkCqclu
— Andy Baio (@waxpancake) July 18, 2022
В своем блоге OpenAI заявила, что провела необходимые улучшения в системе безопасности и удовлетворена ими. Это поможет компенсировать потенциальный вред, поскольку теперь нейросеть DALL-E становится более доступной.
«За последние месяцы мы сделали наши фильтры более надежными: чтобы отклонять попытки создания сексуального, насильственного и другого контента, нарушающего нашу политику, и создавать новые методы обнаружения и реагирования, остановливая неправомерное использование», — говорится в сообщении компании.
Компания также заявила, что тестирует API для DALL-E, который позволит компаниям создавать свои собственные приложения и плагины, используя исходящие данные системы. Это значительно облегчило бы OpenAI коммерциализацию результатов DALL-E, потенциально комбинируя систему с инструментами, используемыми, например, иллюстраторами и дизайнерами.
Любой, кто зарегистрируется для доступа к DALL-E, получит 50 бесплатных кредитов, а затем еще по 15 бесплатных кредитов ежемесячно. Каждый кредит можно использовать для создания одного изображения, варианта изображения или для функций “inpainting” и “outpainting” (редактирования содержимого изображения или расширения изображения за его существующие границы). Дополнительные кредиты можно купить блоками по 115 штук за 15 долларов. OpenAI сообщает, что около 1,5 миллиона пользователей DALL-E ежедневно генерируют более 2 миллионов изображений.
Ранее в DALL-E 2 разрешили редактировать лица реальных людей, функция долгое время была заблокирована из-за соображений безопасности.
Источник: The Verge