Chat GPT

Как сгенерировать картинку в Chat GPT

Chat AI
#chatgpt #бесплатно
image

Программы на базе ИИ используется во многих сферах. Нейронки сравнивают рентгеновские снимки, чтобы упростить для врачей выявление схожих симптомов болезней у разных пациентов. Анализируют большие объемы данных и составляют финансовые прогнозы. Пишут тексты и тестируют программный код. А еще создают настоящее AI-искусство.

Если мечта научиться рисовать так и не исполнилась, то можно попросить ИИ, и нейросеть создаст именно то, что хочет пользователь. От примитивных зарисовок в стиле детского рисунка, до настоящей картины. Как это сделать – давайте разбираться.

Возможности ChatGPT для генерации изображений

Генерация картинок в ChatGPT, как языковой модели ИИ невозможна. Этот бот может визуализировать графики, обрабатывать большие массивы данных, писать программный код, преобразовывать текст в таблицы. Но рисовать не умеет. ChatGPT только распознает изображения. Ему можно дать задание составить описание по фотографии. Например, блюда для блога в соцсетях или для меню на сайте ресторана.

Но использовать Chat GPT для генерации картинок все-таки можно, с Dall-E 3, тоже разработанной OpenAI для преобразования текста. Работает это так пользователь пишет текстовый запрос, чат GPT перерабатывает его по своей инструкции, а Dall-E 3 выводит графику, арт или фото на монитор. Плюс в том, Dall-E 3 “понимает” русский язык (в отличие от ГПТ, который лучше справляется с обработкой запросов на английском) и естественную речь.

Например, она одинаково точно интерпретирует запрос “нарисуй мне абстрактную картину с зеленым енотом” или набор ключей “енот, абстракция, зеленый”. Если творчество ИИ не устроит, можно попросить внести правки, добавив деталей, которые хотите получить. То есть, чтобы работать с этим инструментом не нужно учиться промптингу, и изучать синтаксис, как, например, с той же Midjourney.

Получить доступ к Dall-E 3 можно, если:

  • оплатить про-аккаунт в Чат GPT4 – доступ через интерфейс бота, подписка стоит 20 долларов, авторизация в сервисе через VPN;
  • на странице Bing Image Creator (тоже с VPN) после регистрации профиля Microsoft или авторизации – это уже бесплатно.

Во втором случае нужно просто ввести описание и нажать кнопку “Создать” или, если интересно проверить, на что способен искусственный интеллект попросить удивить. Чтобы дать нейросети полную свободу действий.

Обе версии выдают 1-4 арта на один запрос. Количество зависит от формулировки. Если ИИ посчитает, что пользователь хочет получить что-то неэтичное, то нейронка выполнять задание откажется.

В бесплатной версии даются ускорения, применить которые можно не больше 25 раз в день. После обработка задач замедлится. Но это решаемо путем регистрации нескольких аккаунтов или выхода-захода в профиль. Только удачные арты перед выходом нужно сохранить (такая опция есть), иначе они автоматически удалятся.

Что можно нарисовать в Чат GPT?

Все, что не подпадает под определение оскорбительного, шокирующего или контента, призывающего, демонстрирующего насилие. Использовать ChatGPT для генерации фото знаменитостей тоже нельзя. Такие ограничения OpenAI ввела из соображений безопасности. Чтобы исключить появление постов в социальных сетях с реалистичной фотографией Папы Римского пуховике Баленсиага или Дональда Трампа в наручниках.

Еще компания OpenAI уважает авторское право, поэтому нейросеть откажется рисовать логотипы брендов, персонажей игр. Также в технической документации указано, что ИИ не будет воспроизводить картины в стиле художников, творивших в последние 100 лет.

В остальном можно сделать генерацию через chat gpt изображения:

  • мемы – добавить надпись к готовому мемному фото или создаст свой (с чувством юмора у ИИ все в порядке);
  • графические арты, постеры, объемные шрифты;
  • комиксы – получится не хуже, чем у художников;
  • иллюстрации для постов, статей на сайтах;
  • реклама – ИИ добавит наклейку на флакон шампуня и придумает слоган (на английском);
  • креативные фото – можно концерта в супермаркете, ретро-фотографии.

Нейронка не пропускает слова, поскольку языковая модель переводит с человеческого на машинный так, чтобы генератору изображений было “понятнее”, что от него требуется.

Как писать промпты для картинок

Сначала об определении промпта. По сути, это текстовая команда. Чем подробнее прописать, тем точнее алгоритм выполнит задание. GPT-4 показывает пользователю, как будет выглядеть переписанный текст. Иногда одно слова может превратиться в абзац. Возможно, для других задача это и удобно, но в случае с рисованием детализация может увести от первоначальной идеи. Поэтому можно попросить алгоритм создать лаконичный промпт или вообще не модифицировать пользовательскую версию.

В Bing Image Creator (какая здесь версия языковой модели неизвестно) повлиять на взаимодействие алгоритмов не выйдет. Остается хорошо продумывать слова промпта.

Чтобы получилась хорошая картинка в описании сначала указывайте центральный объект, после добавляйте к нему прилагательные, эффекты, какие хотите получить. Нейросеть обучалась на огромных базах данных и, чем больше будет вводной информации, тем лучше она справится.

Итак, языковые модели не умеют рисовать, но они могут передавать данные алгоритмам, генерирующим изображения. Все вместе – это мощный инструмент, который можно использовать и для развлечения, и для работы.

← Прошлая статья Назад в блог Cледующая статья →