Урок 1 / 10Модуль 1. ОсновыДетальный урок

Academy/Генерация изображений/Урок 1. Что такое генерация изображений? Основные модели и принцип работы

Начальный14 минут

Урок 1. Что такое генерация изображений? Основные модели и принцип работы

Если вы ищете 'AI для создания изображений', 'что такое Midjourney' или 'как работает DALL·E' — этот урок даст вам правильную отправную точку. Вы поймёте, какая модель для чего подходит, как они работают и с чего начать.

О теме

AI-генерация изображений — это технология создания визуальных материалов из текстового описания. Вы описываете словами — модель создаёт изображение.

Основные модели на рынке: Midjourney (через Discord, высокое эстетическое качество), DALL·E (OpenAI, интегрирован в ChatGPT), Stable Diffusion (открытый исходный код, локальное использование) и Leonardo.ai (баланс цены и качества для бизнеса).

Каждая модель реагирует на разные стили промптов. Midjourney хорошо работает с короткими ключевыми словами через запятую. DALL·E лучше понимает развёрнутые естественные описания. Stable Diffusion требует более широкого контроля параметров.

В этом курсе вы изучите принципы работы со всеми основными моделями — как писать промпт, который даёт нужный результат.

Что вы получите из этого урока

Понять технический принцип AI-генерации изображений
Знать разницу между Midjourney, DALL·E, Stable Diffusion и Leonardo.ai
Понимать, какой стиль промпта подходит для каждой модели
Успешно написать и отправить первый визуальный промпт

Более глубокое объяснение

Модель не понимает объект на изображении по-человечески; она восстанавливает статистические связи между текстом и визуальными паттернами. Поэтому каждый конкретный сигнал в промпте сужает результат и усиливает контроль.

На старте полезно выбрать одну модель и хотя бы неделю работать только с ней. Так быстрее становится понятно, какие формулировки, какой синтаксис и какие параметры реально приводят к нужному результату.

Первая цель — не идеальная картинка, а чувство контроля. Если вы можете намеренно менять свет, ракурс или стиль и объяснять, почему результат изменился, дальше курс пойдёт заметно легче.

План урока

Как работают диффузионные модели

AI-генераторы обучены на миллиардах пар изображение-текст. Модель преобразует текстовое описание в код, затем из шума пикселей строит нужное изображение.

Четыре основные модели: плюсы и минусы

Midjourney — эстетическое качество; DALL·E — точность понимания текста; Stable Diffusion — гибкость; Leonardo.ai — баланс цены и качества.

Стили промптов отличаются в зависимости от модели

Midjourney предпочитает ключевые слова через запятую. DALL·E хорошо реагирует на естественное, развёрнутое описание.

Первый промпт: тест и итерация

Первое изображение редко бывает идеальным. Убедитесь, что главный элемент передан правильно — затем меняйте один-два параметра и наблюдайте за улучшениями.

Сравнение слабого и сильного промпта

Слабый промпт

a beautiful woman

Сильный промпт

portrait of a woman in her 30s, professional headshot, soft studio lighting, neutral background, sharp focus, Canon 85mm f/1.4, photorealistic, high detail

Второй промпт указывает камеру, освещение, фон, фокус и технические параметры. Результат значительно ближе к профессиональному портрету.

Разобранный пример

Первый тестовый промпт для кампании открытия кофейни

Локальной кофейне нужен hero-визуал для Instagram на неделю открытия. Задача — сразу передать тёплую атмосферу заведения и ощущение качественного напитка.

Готовый промпт

Практический кейс

cozy specialty coffee shop interior, ceramic cup with latte art on dark wooden table, warm morning light through large windows, amber and brown palette, shallow depth of field, lifestyle photography, inviting premium atmosphere --ar 4:5 --q 2

Объект задан конкретно: интерьер кофейни и чашка с latte art в фокусе.

Настроение передаётся через свет и палитру: warm morning light, amber and brown palette.

Формат 4:5 выбран под Instagram feed и снижает риск неудачного кропа.

Готовый шаблон визуального промпта

Скопируйте и адаптируйте

[объект], [детали], [художественный стиль], [освещение], [цветовая палитра], [композиция и ракурс], [параметры модели]

Почему работает

Объект — центральный элемент изображения, описывайте максимально конкретно.

Художественный стиль задаёт эстетику: photography, oil painting, digital art, concept art.

Освещение создаёт настроение: golden hour, studio lighting, dramatic shadows, soft diffused.

Цветовая палитра управляет общим тоном: warm tones, muted palette, high contrast, monochrome.

Параметры модели: для Midjourney — --ar, --v 6, --stylize; для SD — negative prompt и CFG scale.

Практическое задание

Откройте Midjourney или DALL·E (доступна бесплатная пробная версия).
Отправьте простой промпт: 'a cup of coffee on a wooden table, morning light, photography'.
Оцените результаты — освещение, цвет и композицию.
Теперь измените стиль: добавьте 'oil painting' или 'digital art, concept art' и сравните разницу.

Мини-проект

Мини-проект: один сюжет в трёх стилях

Сгенерируйте одну и ту же сцену в трёх разных стилях и сравните результаты.

Что нужно сделать

Выберите сюжет (например: 'old city street at night').
Стиль 1: photography — 'cinematic photography, golden hour'.
Стиль 2: illustration — 'watercolor illustration, soft colors'.
Стиль 3: concept art — 'digital concept art, dramatic lighting'.

Что будет готово в итоге

3 изображения в разных стилях
Краткий анализ каждого: что получилось хорошо, что нет
Вывод: какой стиль для каких задач подходит

Контрольный список

✓Объект описан конкретно?

✓Художественный стиль указан?

✓Освещение задано?

✓Цветовое направление обозначено?

✓Параметры модели добавлены?

Типичные ошибки

выбирать первую попавшуюся модель без учёта задачи
писать слишком общий и короткий промпт: 'a cat' вместо 'a sleek black cat on a rooftop at dusk'
игнорировать параметры освещения и цвета
останавливаться на первом результате вместо итерации

Вопросы по уроку

Какие модели бесплатны?

DALL·E доступен через ChatGPT (с ограничениями), Leonardo.ai даёт бесплатные токены каждый день. Stable Diffusion (Automatic1111) полностью бесплатен для локального использования.

На каком языке писать промпты?

Английский даёт лучший результат во всех моделях. На русском тоже работает, но качество обычно ниже. Для ключевых визуальных терминов используйте английский.

Следующий шаг

Центр курсаВсе уроки Следующий урок: Урок 2. Техника написания визуального промпта: объект, стиль, освещение и композиция