Сделал небольшую паузу в работе, пощупал нейронки для редактирования фотографий — Qwen Image Edit, Gemini 2.5 Flash Image Preview (она же Nano Banana). Теперь хочу поделиться мыслями о том, имеет ли смысл ретушь с помощью данных моделей, когда ИИ стоит использовать, а когда однозначно нет.

Приятного просмотра!

Основные плюсы ретуши в Qwen и Gemini — результаты генерации относительно консистентны (согласованы), в большинстве случаев модифицируется именно то, что ты указываешь в запросе, поддерживаются промпты на русском языке.

Главные минусы — низкая детализация, маленькое разрешение, при многократной перегенерации качество изображения падает до 100 шакалов из 10.

Проблема с низкой детализацией отчасти решается апскейлом, объединением с исходником, коррекцией по маске, ручной доработкой, но это уже выходит за рамки быстрого редактирования фото с помощью ИИ.

Если не обращать внимание на косяки, Qwen Image Edit и Gemini 2.5 Flash Image Preview можно использовать для творческих экспериментов, промо постов для социалок, мемов, виртуальной примерки образов, замены фона, изменения освещения, создания индивидуальных референсов, удаления проводов, пятен, любого визуального мусора.

Ретушь с помощью Qwen и Gemini имеет смысл, но с большим количеством ограничений и подходит исключительно для веб формата, не требующего идеального качества (да и то не всегда!).

Для редактирования полноразмерных фото эти нейронки не подойдут.

Даже если с их помощью можно быстро поправить изображения, сгенерированные образцы слишком сильно проседают по качеству.

При близком просмотре заметны артефакты и искажения, как и всевозможные мелкие недочёты. Это может быть не критично для создания юмористических или концептуальных работ, но для коммерческой ретуши полностью неприемлемо, увы.

В галерее на странице ниже приложу несколько примеров до и после редактирования. Первые три — оригинал, Qwen Image Edit и Gemini 2.5 Flash Image Preview (Nano Banana), остальные — оригинал + Qwen Image Edit.

Если будет время детально пощупать Gemini 2.5 Flash Image Preview, потом ещё пост запилю!

Пока могу сказать, что в среднем Gemini выдаёт картинки почище, меньше искажает форму объектов, лучше вписывает объекты в окружение, но модель жёстче зацензурена и сбоит чаще, чем Qwen.

Понравилась статья и видоизменённые кадры?

Буду благодарен, если вы поделитесь ссылкой с друзьями, почитаете другие заметки на сайте и подпишитесь на мой канал!

Блог

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

На что способен Qwen Image Edit?

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Этичность ИИ ретуши ню фотографий

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Нейрореференсы для студийной фотосессии

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Visual Electric — нейросеть для генерации референсов

Visual Electric — нейросеть с возможностью визуализации идей, генерации референсов для фотосессий, продуктового...
Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Как создать пресет для ACR с помощью Claude AI?

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Проблемы детекторов ИИ фото

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

В Photoshop 26.6 прокачали инструмент «Удаление»

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Как скинуть пресет в Telegram? 3 способа

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Что делают пресеты в Topaz Photo AI?

Зачем нужны и чем полезны пресеты в Topaz Photo AI? Давайте попробуем разобраться!
Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Что такое муар в фотографии?

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Нейросеть ImageFX: первые впечатления и детальный обзор

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Чем фотографу может пригодиться Grok?

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Нейросети для визуализации идей и преодоления чистого листа

Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Возможности Flux для генерации нейрофото

Что такое Flux и как модель справляется с генерацией нейрофотографий?
Ретушь в Qwen Image Edit и Gemini 2.5 Flash Image Preview

Сбой записи фото на EOS R5 Mark II с SD-картами SanDisk

При использовании некоторых SD-карт SanDisk на Canon EOS R5 Mark II возникают проблемы с записью фото. Например,...