Урок 18 / 18Модуль 5. Продвинутые техникиПодробный урок

Academy/Урок 18. Оптимизация промптов: коротко и точно

Средний+17 минут

Урок 18. Оптимизация промптов: коротко и точно

Хороший промпт — не значит длинный. Многие думают: чем больше напишу, тем лучше поймёт модель. На деле лишние слова отвлекают модель, увеличивают стоимость API и замедляют ответ. В этом уроке разберём, как сократить промпт без потери качества.

Разбор темы

Токен — минимальная единица, которую считает модель. В коммерческих моделях (GPT, Claude и других) цена определяется по токенам. Каждый запрос и каждый ответ измеряются в токенах.

Лишние токены: избыточные описания, повторяющиеся инструкции, ненужные любезности и нерелевантная фоновая информация — их устранение снижает цену и улучшает результат.

Оптимизация — это сокращение промпта без ухудшения результата. Это навык: понять, какая информация действительно нужна модели, а какая — лишняя.

Кэширование промптов (доступно в Claude и GPT-4o): кэшировать неизменяемые части промпта заранее. Особенно полезно для системных промптов, используемых постоянно.

Что вы получите из урока

понять, что такое токен и как он считается
находить и убирать лишнюю информацию из промпта
писать более короткие и эффективные промпты с тем же результатом
знать про кэширование промптов и шаблонную структуру

План урока

Что такое токен и почему он важен?

Каждый запрос и ответ измеряется в токенах. В коммерческих моделях цена определяется по токенам. Меньше токенов = меньше расходов.

Как найти лишние токены

Проверяй каждое предложение: если его убрать, результат изменится? Если нет — убирай.

Кэширование промптов

В Claude и GPT-4o неизменяемые части промпта можно кэшировать. Особенно полезно для системных промптов и длинного контекста.

Оптимизация шаблонов

Разделяй постоянные и переменные части. Постоянная часть хранится один раз, переменная — заполняется каждый раз. Это сохраняет и качество, и эффективность.

Слабый и сильный prompt

Слабый prompt

Пожалуйста, помоги мне, хорошенько подумай и напиши очень хороший маркетинговый пост. Я много пробовал, но ничего не получается. Заранее спасибо!

Сильный prompt

Ты копирайтер. Напиши Instagram-пост для магазина одежды в Ташкенте. Аудитория: женщины 20-35 лет. Формат: заголовок + 3 предложения + CTA. 100 слов.

Второй промпт убирает любезности и лишние детали, оставляя только нужное. Результат направлен точно на цель.

Готовый prompt-шаблон

Копируйте и адаптируйте

Ты [роль]. [Одно чёткое предложение: задача]. Контекст: [только то, что нужно для решения]. Результат: [формат]. [Самое важное ограничение — одно предложение].

Почему это работает

Ненужные любезности, избыточные описания и повторяющиеся инструкции — основные источники лишних токенов.

Проверяй каждое слово: действительно ли оно нужно модели? Если нет — убери.

Кэширование промптов (Claude и GPT-4o): кэшировать неизменяемые части значительно снижает затраты.

В структуре шаблона разделяй постоянные и переменные части: постоянная часть хранится один раз, переменная заполняется каждый раз.

Практика

Возьмите любой длинный промпт, который вы регулярно используете.
Прочитайте каждое предложение и спросите: 'Без него результат изменится?'
Уберите лишние предложения и напишите укороченную версию.
Протестируйте обе версии — качество сохранилось?

Мини-проект

Мини-проект: аудит промпта

Возьмите промпт, который используете регулярно, и проведите токен-аудит. Цель: сократить промпт без потери качества.

Что сделать

Запишите промпт, который регулярно используете.
Проверьте каждое предложение и отметьте лишнее.
Напишите укороченную версию.
Протестируйте обе версии на одинаковой задаче и сравните результаты.

Что должно получиться

исходный и укороченный промпт
список убранных элементов и причины
сравнение результатов: качество сохранилось?

Checklist

✓Каждое предложение проверено на необходимость?

✓Повторяющиеся инструкции убраны?

✓Нерелевантная фоновая информация отсутствует?

✓Формат результата указан кратко и чётко?

✓Укороченный промпт протестирован?

Частые ошибки

добавлять 'пожалуйста', 'спасибо', 'хорошенько подумай' — они тратят токены без пользы
повторять одну инструкцию 2-3 раза в одном промпте
добавлять нерелевантную фоновую информацию
оптимизировать за счёт качества — цель не краткость, а эффективность

Вопросы по уроку

Сокращение не ухудшит результат?

Если убирать только лишние токены — нет. Ключевые элементы (роль, задача, контекст, формат) должны остаться. Убирать лишнее иногда даже улучшает результат.

Что нужно для использования кэширования промптов?

В Claude — параметр 'cache_control' в Anthropic API. В GPT-4o кэширование работает автоматически. Эти функции доступны при работе напрямую через API.

Следующий шаг

Предыдущий урокУрок 17. Агентный ИИ: многошаговые задачи Вернуться к началу курса