Нейросеть ImageFX: подробный обзор

Недавно я написал статью, в которой использовал нейросеть ImageFX для решения проблемы «чистого листа» — поиска идей для съёмок, создания референсов, визуализации будущих проектов.

Однако подробности о нейронке в прошлый раз рассказывать не стал. 

Пожалуй, стоит это исправить!

Что такое ImageFX?

ImageFX — это инструмент для генерации изображений на основе текстового запроса, размещённый на платформе Google Labs. На момент написания статьи использует для создания картинок модель Imagen 3.



Как пользоваться ImageFX?

  1. Перейти по ссылке, указанной в начале статьи;
  2. Зарегистрироваться на платформе. Для этого достаточно войти на сайт через свой аккаунт Google;
  3. Ввести промпт на английском языке, выбрать соотношение сторон, затем нажать кнопку «Создать»;
  4. Подождать завершения генерации изображений, скачать понравившиеся;
  5. Масштабировать картинки с помощью апскейлера, либо использовать работы как есть. Я обычно прогоняю их через Topaz Photo AI (с выключенным восстановлением лиц, так как оно делает картинки из Imagen 3 хуже) и дорабатываю в Adobe Photoshop, подчищая самые заметные артефакты;
  6. Выложить изображения, задействовав их для творческих задач.

Если ImageFX возвращает заглушку с информацией о том, что сервис недоступен в вашей стране, попробуйте подключить DNS от Comss, либо воспользуйтесь VPN. Поскольку сервис может отсеивать пользователей по географическому положению, желательно маскироваться под страны, в которых инструмент работает. Например, под Великобританию и США.


Плюсы и возможности нейросети ImageFX:

  • Нейросеть ImageFX можно использовать для творческих проектов. Например, для иллюстрации записей в блоге на вашем сайте, оформления публикаций в социальных сетях. С помощью нейронки можно создавать крутые фотореалистичные изображения. Они отлично подойдут для историй в ВК и Telegram, заметок, обложек альбомов;
  • Удобный минималистичный интерфейс;
  • Нейронная сеть предлагает улучшить запрос, демонстрирует дополнительные ключевые слова, которые можно добавить к вашему промпту;
  • Бонусные ключи можно удалить, либо обновить, чтобы получить новые предложения по улучшению вашего запроса;
  • Позволяет использовать длинные запросы, в большинстве случаев не обрезает их;
  • Максимальное разрешение варьируется от 1024 пикселей для квадратных изображений до 1408 пикселей по большей стороне для вертикальных и горизонтальных картинок с соотношением сторон 9:16, 16:9. Если сгенерировать изображение в Gemini, которая тоже использует Imagen 3, можно получить картинку большего размера (2048 пикселей), но при этом карточки будут создаваться по одной, причём заметно медленней, чем в Google Labs;
  • За раз создаётся 4 картинки. Нет долгого ожидания перед следующей генерацией и медленных очередей;
  • Генерация картинок всё ещё бесплатна. Это выгодно отличает проект от Visual Electric и похожих на VE платформ, предоставляющих минимум пробных запусков, после которых вам нужно оформить один из платных тарифов;
  • Нет жёстких лимитов. Хотя у модели определённо есть ограничения, они варьируются в зависимости от нагрузки на платформу. В один день вы сможете использовать 40 запросов, создав до 160 картинок, в другой получится повторить генерацию свыше 100 раз, сгенерировав 400+ работ в ImageFX;
  • Есть библиотека со всеми созданными изображениями. Если вы не успели что-то сохранить, можно открыть её в настройках аккаунта и скачать картинки заново, либо удалить свои шедевры;
  • В библиотеке сохраняются не только картинки, но и промпты, использовавшиеся для их генерации. Благодаря этому вы сможете воспользоваться ими снова, если захотите создать похожие работы!

Минусы и ограничения нейросети ImageFX (Imagen 3)

  • Не указана подробная лицензия для сгенерированных изображений. Хотя некоторые пользователи применяют нейросетевые картинки из Imagen 3 в коммерческих проектах, это может быть рискованно. Лучше считать, что работы из ImageFX находятся в некой «Серой зоне» и ограничить их применение творческими проектами, оформлением статей и историй;
  • Нормально воспринимает только английский язык. Чтобы использовать русский без возникновения ошибок и сброса генерации, понадобится открыть Gemini;
  • Предлагает мало ключевых слов, не адаптирует промпт для нейросети. По этой причине стоит тщательно дорабатывать запрос, либо написать базу и воспользоваться Grok, Gemini или иными LLM для оптимизации текста;
  • Чтобы достать информацию о промпте и значении параметра Seed, нужно зайти в библиотеку, выбрать нужную работу, нажать на иконку с символом обновления (разворота) с надписью «Перевернуть карточку». Это явно не самый очевидный способ получения данных! Если не знать об этой фиче, промпт придётся копировать через выделение текста над карточкой генерации, что крайне неудобно. Без подсказки пользователь может вообще не обратить внимание на эту опцию;
  • Небольшое разрешение изображений. Чтобы работы нормально смотрелись на экранах с разрешением 2K и 4K, понадобится использовать апскейлеры;
  • Нет встроенных инструментов масштабирования;
  • Минимальное количество настроек;
  • Редактирование доступно только для изображений с соотношением сторон 1:1 и в целом не впечатляет;
  • Часто получаются схожие работы. По умолчанию в настройках платформы разблокировано значение Seed, что должно увеличить разнообразие выдачи. Однако в результате добавляется лишь небольшая хаотичность, поэтому проще изменить запрос, чтобы модифицировать картинку, чем повторять генерацию раз за разом, либо вручную корректировать параметры;
  • Создаются однотипные названия файлов, не учитывающие порядковый номер генерации на сайте Google. Если вы постепенно переносите работы в другую папку, одновременно генерируя новые варианты нейрофото, может возникнуть ситуация, когда система предложит перезаписать файлы. Это неудобно и очень раздражает, пусть и решается переименовыванием картинок;
  • Windows 10 утверждает, что файлы из нейросети сохранены в неправильном формате. Хотя обозначается, что это JPG, вылезает плашка с предложением изменить формат на PNG. Впрочем, если вы масштабируете изображения в другие форматы или перезаписываете информацию о файлах, это вообще не является проблемой.

Другие особенности и недочёты:

  • К созданным работам добавляется водяной знак SynthID, позволяющий поисковым системам и приложениям опознать картинки, созданные с помощью ИИ. Это не является минусом по умолчанию, так как снимает с вас задачу по маркировке контента. Однако поисковые системы могут занижать позиции ресурсов, где часто используются нейронки. В итоге вам понадобится уделять больше внимания остальному контенту по сравнению с блогерами, фотографами и вебмастерами, использующими другие нейронные сети, не внедряющие водяные знаки. При этом утверждается, что водяной знак устойчив к редактированию, то есть избавиться от него будет не так уж просто;
  • На платформу распространяются общие ограничения, характерные для всех сервисов Google. То есть изображения нельзя использовать во вред, применять для других негативных целей. Например, для разжигания вражды, обмана аудитории, создания дипфейков, особенно с известными личностями, генерации работ, имитирующих селфхарм и иную жесть. Это явно не является минусом, но может сбрасывать генерацию, если вы решите добавить больше крови на доспехи или иным способом поизмываться над ИИ;
  • Из обучающих данных удалены NSFW материалы (18+). Возможно, для этого использовалась слишком сильное выравнивание, так как результаты выдачи сильно цензурируются. И ладно бы, когда пытаешься создать картинки с сексуальным подтекстом, но на платформе регулярно возникают ложные срабатывания! Причём не только на ключевые слова вроде Sensual, Sexy, но и на вполне адекватные промпты, включающий Beauty Makeup и всевозможные описания, типичные для генерации эстетичных портретов.

Кому и зачем пригодится ImageFX от Google?

  • Фотографы могут использовать нейросеть для визуализации идей для фотосессий, создания референсов, мудбордов;
  • Блогерам нейронка от Google пригодится для иллюстрации видео и статей. Так вы сможете сэкономить время на поиск стоковых изображений;
  • Дизайнерам ИИ пригодится для создания прототипов концепт-артов, продуктового дизайна, украшений и товаров;
  • Вебмастера с помощью Imagen 3 могут создавать графику для сайтов, например, баннеры и иллюстрации для лендингов, слайдеров, страниц WordPress. Это особенно полезно при околонулевом бюджете;
  • Обычным пользователям ImageFX тоже пригодится: с помощью нейросети можно делать красивые открытки, клепать основы для мемов, делать заставки на смартфон и ПК, оформлять рассказы, стихи и загружать эстетичные картинки в личном профиле.

Понравилась публикация?

Поделитесь ссылкой с друзьями, читайте другие записи в блоге и подписывайтесь на мой канал!

Блог

Нейросеть ImageFX: первые впечатления и детальный обзор

Нейросети для визуализации идей и преодоления чистого листа

Нейросеть ImageFX: первые впечатления и детальный обзор

Visual Electric — нейросеть для генерации референсов

Visual Electric — нейросеть с возможностью визуализации идей, генерации референсов для фотосессий, продуктового...
Нейросеть ImageFX: первые впечатления и детальный обзор

5 советов по съёмке в заброшках

Нейросеть ImageFX: первые впечатления и детальный обзор

Удачные локации для съёмок ню и в белье в Находке

Нейросеть ImageFX: первые впечатления и детальный обзор

Лунное затмение в Приморье (два фото)

Нейросеть ImageFX: первые впечатления и детальный обзор

Почему фотографу стоит развивать Telegram в России?

Нейросеть ImageFX: первые впечатления и детальный обзор

Фотосессия в красном платье в заброшенном здании

Нейросеть ImageFX: первые впечатления и детальный обзор

Telegram фотографа получает больше показов в Яндексе

Нейросеть ImageFX: первые впечатления и детальный обзор

Осенние пейзажи бухты Большой Ежовой

Нейросеть ImageFX: первые впечатления и детальный обзор

Редкое розовое полярное сияние в Приморском крае

Нейросеть ImageFX: первые впечатления и детальный обзор

Бронзово-зелёная тонировка для Photoshop

Нейросеть ImageFX: первые впечатления и детальный обзор

Приятный бонус от Wfolio + 35% скидка на сайт фотографа!

Получил ещё один приятный бонус от Wfolio — сегодня всем пользователям увеличили объём хранилища без изменения...
Нейросеть ImageFX: первые впечатления и детальный обзор

Фотосессия в белье на белом диване

Нейросеть ImageFX: первые впечатления и детальный обзор

Комета C/2023 A3 Цзыцзиньшань — ATLAS

Поснимал вечером комету C/2023 A3 Цзыцзиньшань — ATLAS. Показываю, что получилось! Приятного просмотра 😊✨
Нейросеть ImageFX: первые впечатления и детальный обзор

Поход на беседку ушуистов в Приморском крае