Урок 18. Оптимизация промптов: коротко и точно
Хороший промпт — не значит длинный. Многие думают: чем больше напишу, тем лучше поймёт модель. На деле лишние слова отвлекают модель, увеличивают стоимость API и замедляют ответ. В этом уроке разберём, как сократить промпт без потери качества.
Разбор темы
Токен — минимальная единица, которую считает модель. В коммерческих моделях (GPT, Claude и других) цена определяется по токенам. Каждый запрос и каждый ответ измеряются в токенах.
Лишние токены: избыточные описания, повторяющиеся инструкции, ненужные любезности и нерелевантная фоновая информация — их устранение снижает цену и улучшает результат.
Оптимизация — это сокращение промпта без ухудшения результата. Это навык: понять, какая информация действительно нужна модели, а какая — лишняя.
Кэширование промптов (доступно в Claude и GPT-4o): кэшировать неизменяемые части промпта заранее. Особенно полезно для системных промптов, используемых постоянно.
Что вы получите из урока
- понять, что такое токен и как он считается
- находить и убирать лишнюю информацию из промпта
- писать более короткие и эффективные промпты с тем же результатом
- знать про кэширование промптов и шаблонную структуру
План урока
Что такое токен и почему он важен?
Каждый запрос и ответ измеряется в токенах. В коммерческих моделях цена определяется по токенам. Меньше токенов = меньше расходов.
Как найти лишние токены
Проверяй каждое предложение: если его убрать, результат изменится? Если нет — убирай.
Кэширование промптов
В Claude и GPT-4o неизменяемые части промпта можно кэшировать. Особенно полезно для системных промптов и длинного контекста.
Оптимизация шаблонов
Разделяй постоянные и переменные части. Постоянная часть хранится один раз, переменная — заполняется каждый раз. Это сохраняет и качество, и эффективность.
Слабый и сильный prompt
Пожалуйста, помоги мне, хорошенько подумай и напиши очень хороший маркетинговый пост. Я много пробовал, но ничего не получается. Заранее спасибо!
Ты копирайтер. Напиши Instagram-пост для магазина одежды в Ташкенте. Аудитория: женщины 20-35 лет. Формат: заголовок + 3 предложения + CTA. 100 слов.
Второй промпт убирает любезности и лишние детали, оставляя только нужное. Результат направлен точно на цель.
Готовый prompt-шаблон
Копируйте и адаптируйтеТы [роль]. [Одно чёткое предложение: задача]. Контекст: [только то, что нужно для решения]. Результат: [формат]. [Самое важное ограничение — одно предложение].
Почему это работает
Ненужные любезности, избыточные описания и повторяющиеся инструкции — основные источники лишних токенов.
Проверяй каждое слово: действительно ли оно нужно модели? Если нет — убери.
Кэширование промптов (Claude и GPT-4o): кэшировать неизменяемые части значительно снижает затраты.
В структуре шаблона разделяй постоянные и переменные части: постоянная часть хранится один раз, переменная заполняется каждый раз.
Практика
- Возьмите любой длинный промпт, который вы регулярно используете.
- Прочитайте каждое предложение и спросите: 'Без него результат изменится?'
- Уберите лишние предложения и напишите укороченную версию.
- Протестируйте обе версии — качество сохранилось?
Мини-проект
Мини-проект: аудит промпта
Возьмите промпт, который используете регулярно, и проведите токен-аудит. Цель: сократить промпт без потери качества.
Что сделать
- Запишите промпт, который регулярно используете.
- Проверьте каждое предложение и отметьте лишнее.
- Напишите укороченную версию.
- Протестируйте обе версии на одинаковой задаче и сравните результаты.
Что должно получиться
- исходный и укороченный промпт
- список убранных элементов и причины
- сравнение результатов: качество сохранилось?
Checklist
Частые ошибки
- добавлять 'пожалуйста', 'спасибо', 'хорошенько подумай' — они тратят токены без пользы
- повторять одну инструкцию 2-3 раза в одном промпте
- добавлять нерелевантную фоновую информацию
- оптимизировать за счёт качества — цель не краткость, а эффективность
Вопросы по уроку
Сокращение не ухудшит результат?
Если убирать только лишние токены — нет. Ключевые элементы (роль, задача, контекст, формат) должны остаться. Убирать лишнее иногда даже улучшает результат.
Что нужно для использования кэширования промптов?
В Claude — параметр 'cache_control' в Anthropic API. В GPT-4o кэширование работает автоматически. Эти функции доступны при работе напрямую через API.