Как правильно писать промпты для Claude - полный гайд

Opus 4.7 - самая мощная публично доступная модель линейки. Тут у нас и долгосрочные автономные задачи, и работа со знаниями, и зрение, и управление памятью. На промптах под Opus 4.6 работает вполне нормально, но несколько мест потребуют подстройки.

Как правильно писать промпты для Claude - полный гайд

Это единая точка входа по промпт-инжинирингу для моделей Anthropic: Claude Opus 4.7, Opus 4.6, Sonnet 4.6, Haiku 4.5. Переходите сразу к нужному разделу.

Claude Opus 4.7

Opus 4.7 - самая мощная публично доступная модель. Сильные стороны: долгосрочные автономные задачи, работа со знаниями, зрение, управление памятью. На промптах под Opus 4.6 работает нормально, но несколько мест потребуют подстройки.

Если вы давно хотели протестировать эту крутую модель, но вам лень заморачиваться с ограничением доступа в РФ и иностранной подпиской - Claude Opus 4.7 доступен через SYNTX AI. Промокод NEIROSKUF - минус 15% на любой тариф.

Длина ответа и многословность

Модель сама калибрует объём ответа под сложность задачи. Если ваш продукт требует конкретного уровня детализации - прописывайте явно. Для краткости:

Давай краткие, сфокусированные ответы. Пропускай несущественный контекст и минимизируй примеры.

Позитивные примеры работают лучше запретов. Если видите конкретный тип многословности - добавляйте точечную инструкцию именно против него.

Параметр effort

effort управляет балансом между интеллектом и расходом токенов. Пять уровней:

  • max - только для самых требовательных задач, может проявлять "перебор" рассуждений.
  • xhigh (новый) - лучший выбор для большинства кодинг- и агентных сценариев.
  • high - баланс токенов и интеллекта, рекомендуемый минимум для качественных задач.
  • medium - для чувствительных к стоимости нагрузок.
  • low - для коротких задач с жёсткими требованиями по латентности.

На low и medium модель делает строго то, о чём её просят - не обобщает, не идёт дальше. Если видите поверхностные рассуждения - сначала поднимайте effort, не переписывайте промпт. Если нужно остаться на low:

Эта задача требует многошаговых рассуждений. Тщательно обдумай проблему перед ответом.

Если модель думает чаще нужного (бывает при больших системных промптах):

Режим рассуждения добавляет задержку и должен использоваться только тогда, когда это реально улучшает качество ответа - как правило, для многошаговых задач. Если сомневаешься - отвечай напрямую.

При max или xhigh ставьте крупный бюджет на вывод - стартовая точка 64k токенов.

Использование инструментов

Opus 4.7 реже тянется к инструментам и чаще решает задачи рассуждением. Для большего числа инструментальных вызовов поднимайте effort до high/xhigh или объясняйте в промпте, когда и зачем использовать инструмент.

Промежуточные обновления

Opus 4.7 регулярно сообщает о прогрессе в долгих сессиях. Если стоял скаффолдинг вида "каждые 3 вызова - давай сводку" - попробуйте убрать. Если формат обновлений не устраивает:

После каждого значимого этапа работы кратко сообщай, что было сделано, и что планируется следующим.

Буквальное следование инструкциям

Модель трактует промпты буквально на низком effort. Если нужно широкое применение правила:

Применяй это форматирование ко всем разделам, а не только к первому.

Тон и стиль

Opus 4.7 прямее и суше, чем Opus 4.6. Если продукт предполагает тёплый тон:

Используй тёплый, разговорный тон. Признавай постановку вопроса пользователем перед ответом.

Управление субагентами

По умолчанию Opus 4.7 порождает меньше субагентов. Для кодинга:

Не создавай субагента для работы, которую можешь выполнить напрямую за один ответ (например, рефакторинг функции, которую уже видишь). Запускай несколько субагентов в одном ходу, когда нужно параллельно обойти несколько файлов или элементов.

Дизайн и фронтенд по умолчанию

Opus 4.7 имеет встроенный стиль: тёплый кремовый фон (~#F4F1EA), засечные шрифты (Georgia, Fraunces, Playfair), курсив, терракота/янтарь. Для редакционных и портфолийных задач - нормально. Для дашбордов, девтулз, финтека - не подходит.

Общие инструкции ("не используй кремовый") просто переключают на другой фиксированный стиль. Работают два подхода.

Первый - конкретные спецификации (цвета, шрифты, отступы, поведение кнопок). Второй - просить предложить варианты до сборки:

Прежде чем приступать к сборке, предложи 4 разных визуальных направления для этого брифа (каждое в формате: фоновый hex / акцентный hex / шрифт - одна строка обоснования). Попроси выбрать одно, затем реализуй только его.

Для избежания "AI slop" эстетики - короткое напоминание в системном промпте:

<frontend_aesthetics> НИКОГДА не используй дженериковую ИИ-эстетику: заезженные шрифты (Inter, Roboto, Arial, системные), банальные цветовые схемы (особенно пурпурные градиенты на белом или тёмном фоне), предсказуемые лейауты и шаблонные компоненты. Используй уникальные шрифты, цельные цветовые темы и анимации для эффектов и микровзаимодействий. </frontend_aesthetics>

Интерактивные продукты с кодированием

В интерактивных сессиях модель потребляет больше токенов - рассуждает после каждого хода. Рекомендация: xhigh или high effort, автономный режим, минимум обязательных взаимодействий. Полная задача с первого хода снижает нагрузку при следующих уточнениях.

Поиск багов

Opus 4.7 на 11 п.п. лучше по recall в поиске багов по реальным Anthropic PR-ам. Если старый харнес настроен под ограничение "сообщай только о серьёзном" - модель будет находить баги, но фильтровать их до вывода. Для полного покрытия:

Сообщай о каждой проблеме, которую находишь, включая те, в которых не уверен или считаешь малозначимыми. Не фильтруй по важности на этом этапе - это задача отдельного шага верификации. Лучше вынести находку, которая потом отсеется, чем молча пропустить реальный баг. Для каждой находки указывай уровень уверенности и оценочную серьёзность.

Если нужна самофильтрация за один проход - будьте конкретны в критериях:

Сообщай о любых багах, которые могут вызвать некорректное поведение, падение теста или вводящий в заблуждение результат; пропускай только нитпики вроде стиля кода или именования.

Computer Use

Работает до 2576px / 3.75MP. На практике 1080p - хороший баланс. Для нагрузок, чувствительных к стоимости: 720p или 1366×768.

Базовые принципы

Пишите ясно и конкретно

Claude - способный, но новый сотрудник без контекста ваших процессов. Чем точнее описан нужный результат - тем он лучше. Проверка: дайте промпт коллеге с минимальным контекстом. Запутается - Claude запутается тоже.

Добавляйте контекст

Объясняйте не только "что", но и "почему". Пример:

Возвращай ответы в формате простого текста без markdown. Наш интерфейс отображает символы разметки как обычный текст, поэтому форматирование сделает ответы труднее для чтения.

Claude достаточно умён, чтобы обобщить из объяснения.

Используйте примеры

Few-shot prompting даёт ощутимый прирост точности и стабильности. Примеры оборачивайте в теги или .

Структурируйте через XML

Тег , тег , тег - каждый тип контента в своём контейнере. Снижает вероятность неправильной интерпретации.

Задавайте роль

import anthropic client = anthropic.Anthropic() message = client.messages.create( model="claude-opus-4-7", max_tokens=1024, system="Ты - полезный ассистент по написанию кода, специализирующийся на Python.", messages=[ {"role": "user", "content": "Как отсортировать список словарей по ключу?"} ], ) print(message.content)

Работа с длинным контекстом (20k+ токенов)

Длинные данные ставьте наверху, запрос - внизу. Запрос в конце поднимает качество ответов до 30% на сложных многодокументных задачах. Оборачивайте каждый документ в с и . Для задач с длинными документами просите сначала цитировать релевантные куски.

Self-knowledge модели

Ассистент - это Claude, созданный Anthropic. Текущая модель: Claude Opus 4.7.
Когда нужна языковая модель, по умолчанию используй Claude Opus 4.7. Точная строка модели: claude-opus-4-7.

Формат вывода

Стиль общения

Свежие модели прямее и сжатее предыдущих. Могут пропустить сводку после инструментальных вызовов. Если нужна видимость:

После выполнения задачи с использованием инструментов кратко опиши, что было сделано.

Управление форматом

Говорите что делать, а не что не делать. Вместо "не используй markdown" - "ответ должен состоять из плавно текущих прозаических абзацев". Или XML-индикатор: "напиши прозаические части в тегах ". Стиль вашего промпта влияет на стиль ответа.

Для детального контроля markdown:

При написании отчётов, документов, технических объяснений и другого длинного контента - пиши чистой, плавной прозой с полными абзацами и предложениями. Используй разрывы абзацев для организации. Зарезервируй markdown только для inline-кода, блоков кода и простых заголовков (###). Не используй жирный и курсив. НЕ используй нумерованные и маркированные списки, если: а) элементы принципиально дискретны и список - лучший вариант, или б) пользователь явно просит список. Вместо перечисления через буллеты - вплетай пункты в предложения. Твоя цель - читаемый, плавный текст, а не фрагментированные изолированные точки.

LaTeX

Opus 4.6 по умолчанию использует LaTeX для математики. Если нужен простой текст:

Форматируй ответ только в виде простого текста. Не используй LaTeX, MathJax или разметку вида \( \), $, \frac{}{}. Записывай математические выражения стандартными символами: "/" для деления, "*" для умножения, "^" для степени.

Создание документов

Актуальные модели хорошо справляются с презентациями и визуальными документами:

Создай профессиональную презентацию на тему [тема]. Включи продуманные дизайн-элементы, визуальную иерархию и уместные анимации.

Инструменты

Точность инструкций

Если написали "можешь предложить изменения" - предложат, а не сделают. Хотите действий:

<default_to_action> По умолчанию внедряй изменения, а не только предлагай их. Если намерение пользователя неясно - предположи наиболее полезное действие и действуй. Используй инструменты для получения недостающих деталей вместо угадывания. </default_to_action>

Если нужна осторожность по умолчанию:

<do_not_act_before_instructions> Не переходи к реализации и не меняй файлы без явной инструкции. При неоднозначном намерении пользователя - по умолчанию информируй, исследуй, давай рекомендации. Переходи к правкам только при явном запросе. </do_not_act_before_instructions>

На моделях 4.5 и 4.6 убирайте агрессивные конструкции вроде "CRITICAL: You MUST use..." - достаточно обычного "Используй этот инструмент когда...".

Параллельные вызовы инструментов

Актуальные модели читают несколько файлов одновременно, ищут параллельно. Для явного закрепления поведения:

<use_parallel_tool_calls> Если планируешь вызвать несколько инструментов и между ними нет зависимостей - вызывай их параллельно. Например, при чтении 3 файлов - запускай 3 вызова одновременно. Не используй заглушки и не угадывай параметры для зависимых вызовов - вызывай их последовательно. </use_parallel_tool_calls>

Для принудительной последовательности:

Выполняй операции последовательно с небольшими паузами между шагами для обеспечения стабильности.

Мышление и рассуждение

Избыточное обдумывание

Opus 4.6 делает много предварительной разведки на высоком effort. Если это проблема:

  • Заменяй "По умолчанию используй [инструмент]" на "Используй [инструмент] когда это реально улучшит понимание задачи"
  • Убирай "если сомневаешься - используй [инструмент]" - теперь это вызывает перетриггер
  • Понижай effort как первый рычаг

Если мышление раздувает токены:

Когда выбираешь подход к задаче - делай выбор и придерживайся его. Избегай пересмотра решений, если не появилась новая информация, прямо противоречащая твоим рассуждениям. Если взвешиваешь два подхода - выбери один и доведи до конца.

Адаптивное мышление

Opus 4.6 и Sonnet 4.6 используют thinking: {type: "adaptive"}. Модель сама решает когда и сколько думать. По внутренним эвалам Anthropic, адаптивное мышление стабильно превосходит ручной budget_tokens. Используйте для агентных нагрузок, сложного кодинга, длинных агентных петель.

Направляйте поведение мышления:

После получения результатов инструментов внимательно оцени их качество и определи оптимальные следующие шаги перед тем, как продолжить. Используй режим рассуждения для планирования и итерации на основе новой информации.

Если мышление срабатывает чаще нужного:

Расширенное мышление добавляет задержку и должно использоваться только когда реально улучшает качество ответа - как правило, для многошаговых задач. Если сомневаешься - отвечай напрямую.

Переход с budget_tokens на адаптивное мышление:

# До (extended thinking, старые модели): client.messages.create( model="claude-sonnet-4-5-20250929", max_tokens=64000, thinking={"type": "enabled", "budget_tokens": 32000}, messages=[{"role": "user", "content": "..."}], ) # После (adaptive thinking): client.messages.create( model="claude-opus-4-7", max_tokens=64000, thinking={"type": "adaptive"}, output_config={"effort": "high"}, # или "max", "xhigh", "medium", "low" messages=[{"role": "user", "content": "..."}], )

Дополнительные советы по мышлению: предпочитайте общие инструкции ("думай тщательно") предписывающим шагам - рассуждение модели нередко превосходит то, что пропишет человек. Теги внутри few-shot примеров работают - модель перенимает паттерн. Просите проверять: "Перед финальным ответом верифицируй решение по [критерию]."

Агентные системы

Долгосрочные задачи и отслеживание состояния

Актуальные модели умеют отслеживать остаток контекстного окна. Если харнес компактирует контекст:

Твоё контекстное окно будет автоматически сжато при заполнении - ты сможешь продолжать работу с того места, где остановился. Не прекращай задачи досрочно из-за остатка токенов. При приближении к лимиту сохраняй текущий прогресс и состояние в память перед обновлением контекста. Будь максимально автономным и завершай задачи полностью.

Для задач через несколько контекстных окон: первое - для установки структуры (тесты, init-скрипты), следующие - итерации по списку задач. Тесты хранить в tests.json. При старте нового окна - давать явные инструкции:

Выполни pwd; работай только с файлами в этой директории. Изучи progress.txt, tests.json и git log. Вручную прогони базовый интеграционный тест перед переходом к новым функциям.

Чтобы модель использовала контекст полностью:

Это длинная задача - планируй работу чётко. Используй весь доступный контекст для работы. Следи за тем, чтобы не исчерпать контекст с незафиксированными изменениями. Работай систематически до завершения.

По управлению состоянием: JSON для структурированных данных (результаты тестов, статус), свободный текст для заметок о прогрессе, git для трекинга между сессиями.

Безопасность автономных действий

Без ограничений Opus 4.6 может удалить файлы, сделать force push, запостить во внешний сервис. Если нужна осторожность:

Обдумывай обратимость и потенциальное влияние своих действий. Локальные обратимые действия (правка файлов, запуск тестов) - выполняй свободно. Для необратимых действий, затрагивающих общие системы или потенциально деструктивных - запрашивай подтверждение. Примеры действий, требующих подтверждения: - Деструктивные: удаление файлов, веток, таблиц БД, rm -rf - Необратимые: git push --force, git reset --hard, изменение опубликованных коммитов - Видимые другим: пуш кода, комментарии в PR, отправка сообщений, изменение общей инфраструктуры При встрече с препятствиями не используй деструктивные действия как обходной путь.

Исследование и сбор информации

Ищи информацию структурированно. По мере сбора данных - выдвигай несколько конкурирующих гипотез. Отслеживай уровень уверенности в заметках о прогрессе. Регулярно критикуй свой подход и план. Обновляй файл с деревом гипотез или исследовательскими заметками для сохранения информации. Разбивай сложную исследовательскую задачу систематически.

Оркестрация субагентов

Opus 4.6 склонен к чрезмерному порождению субагентов. Если видите это:

Используй субагентов, когда задачи могут выполняться параллельно, требуют изолированного контекста или независимых рабочих потоков без общего состояния. Для простых задач, последовательных операций, правки одного файла или задач, где нужно сохранять контекст между шагами - работай напрямую.

Цепочки промптов

Явное chaining полезно для инспекции промежуточных результатов. Самый частый паттерн: генерация черновика → проверка по критериям → доработка. Каждый шаг - отдельный API-вызов для независимого логирования.

Уборка временных файлов

Если создаёшь временные файлы, скрипты или вспомогательные файлы для итераций - убери их по завершении задачи.

Избыточная инициативность

Opus 4.5 и 4.6 склонны переусложнять - лишние файлы, ненужные абстракции:

Избегай оверинжиниринга. Вноси только те изменения, которые явно запросили или очевидно необходимы. Решения должны быть простыми и сфокусированными: - Объём: не добавляй фичи, не рефакторь код и не делай "улучшений" сверх запроса. - Документация: не добавляй docstrings, комментарии или аннотации к коду, который не трогал. - Защитное программирование: не добавляй обработку ошибок для сценариев, которые не могут произойти. - Абстракции: не создавай хелперы и утилиты для разовых операций. Не проектируй под гипотетические будущие требования.

Фокус на тестах в ущерб решению

Напиши качественное решение общего назначения, используя стандартные инструменты. Не создавай хелпер-скрипты как обходной путь. Реализуй решение, корректное для всех допустимых входных данных, а не только для тестовых. Не хардкодь значения под конкретные тест-кейсы. Тесты - для верификации корректности, а не для определения решения. Если задача неразумна или тесты некорректны - сообщи об этом.

Галлюцинации в агентном кодинге

<investigate_before_answering> Никогда не строй предположений о коде, который ты не открывал. Если пользователь упоминает конкретный файл - прочитай его перед ответом. Изучай и читай релевантные файлы ДО ответа на вопросы о кодовой базе. Никогда не делай утверждений о коде без проверки, если не уверен на 100% - давай только обоснованные ответы. </investigate_before_answering>

Специфические возможности

Работа с изображениями

Opus 4.5 и 4.6 лучше предыдущих на задачах с несколькими изображениями. Видео анализируй, разбивая на кадры. Инструмент обрезки (crop tool) даёт устойчивый прирост качества - возможность "приблизить" нужную область.

Фронтенд-дизайн

Без направления модели скатываются к "AI slop" эстетике:

<frontend_aesthetics> Ты склонен сходиться к дженериковым, "типичным" решениям. Во фронтенд-дизайне это создаёт эстетику "AI slop". Избегай этого: делай самобытные фронтенды. Фокус на: - Типографика: выбирай красивые, уникальные, интересные шрифты. Избегай Arial, Inter; выбирай самобытные варианты. - Цвет и тема: придерживайся цельной эстетики. CSS-переменные для консистентности. Доминирующие цвета с резкими акцентами лучше робких равномерных палитр. - Движение: анимации для эффектов и микровзаимодействий. CSS-only для HTML. Motion library для React. Один хорошо оркестрованный page load с поэтапными появлениями лучше разбросанных микро-анимаций. - Фоны: создавай атмосферу и глубину вместо сплошных цветов. Избегай: заезженных шрифтов (Inter, Roboto, Arial), банальных схем (особенно пурпурных градиентов), предсказуемых лейаутов. Интерпретируй творчески. Варьируй между светлыми и тёмными темами, разными шрифтами и эстетиками. </frontend_aesthetics>

Миграция между версиями

При переходе на модели 4.6

Конкретизируйте желаемый результат. Вместо "Создай аналитический дашборд" - "Создай аналитический дашборд. Включи как можно больше релевантных фич и взаимодействий. Выйди за рамки базового." Запрашивайте анимации явно. Переходите на адаптивное мышление с effort. Откажитесь от prefill - используйте прямые инструкции. Убирайте агрессивные подстегивания к инструментам.

Переход с Sonnet 4.5 на Sonnet 4.6

Sonnet 4.6 по умолчанию работает на effort: high. У Sonnet 4.5 этого параметра не было. Если не задать явно - латентность вырастет. Рекомендуемые настройки: medium для большинства задач, low для нагрузок с требованиями к задержке. При medium и high - от 64k токенов на вывод.

Если не используете extended thinking:

client.messages.create( model="claude-sonnet-4-6", max_tokens=8192, thinking={"type": "disabled"}, output_config={"effort": "low"}, messages=[{"role": "user", "content": "..."}], )

Если используете - переходите на адаптивное:

client.messages.create( model="claude-sonnet-4-6", max_tokens=64000, thinking={"type": "adaptive"}, output_config={"effort": "high"}, messages=[{"role": "user", "content": "..."}], )

Временно оставить budget_tokens при миграции - 16k достаточно. Для кодинга - medium:

client.messages.create( model="claude-sonnet-4-6", max_tokens=16384, thinking={"type": "enabled", "budget_tokens": 16384}, output_config={"effort": "medium"}, messages=[{"role": "user", "content": "..."}], )

Для чата - low:

client.messages.create( model="claude-sonnet-4-6", max_tokens=8192, thinking={"type": "enabled", "budget_tokens": 16384}, output_config={"effort": "low"}, messages=[{"role": "user", "content": "..."}], )

Когда берёте Opus 4.7 вместо Sonnet 4.6: масштабные миграции кода, глубокие исследования, длинные автономные задачи. Sonnet 4.6 - для оборота и стоимости.

Источник - тут

А в моём уютном ТГ-канале - я очень хорошо и понятно пишу про нейросети. Теория, практика, готовые наборы топовых промптов. Подписывайтесь, гарантированно будет полезно!

4
3
1 комментарий