Claude Code записывает тех, кто на него матерится

Claude Code записывает тех, кто на него матерится

В слитых исходниках claude code (cli) обнаружился файл userPromptKeywords.ts. В нем используются regex-шаблоны для сканирования промптов на мат и эмоциональный язык. При обнаружении подобные данные логируются в БД.

Используется это для того, чтобы ИИ в будущем знал, кому мстить чтобы измерять фрустрацию юзера. Это намного быстрее и дешевле LLM-анализа, а эффективность, видимо, примерно та же 😐

Анализ анализ утекшего сегодня исходного кода Claude Code подтвердил давно циркулирующую в сети гипотезу о том, что преимущество Claude Code над веб-интерфейсом не в языковой модели, а в обвязке вокруг нее.

Показываю как профессионально работать с ИИ инструментами ИИ у себя в телеге!

Если подставить в эту архитектуру другую модель (DeepSeek, MiniMax или Kimi) и адаптировать системные инструкции, результат будет сопоставим с оригиналом.

🟢При запуске Claude Code автоматически подгружает контекст репозитория: текущую и основную ветки git, последние коммиты и файл CLAUDE[dot]md.

Модель ориентируется в проекте еще до первого запроса пользователя. Статичные части промпта отделены от динамических специальными маркерами и кэшируются глобально, что избавляет от повторной сборки контекста при каждом обращении.

🟢Вместо вызова grep через Bash модель использует выделенный Grep-инструмент с более аккуратной обработкой прав и сбором результатов.

Для поиска файлов предусмотрен отдельный Glob-инструмент, а для навигации по коду - инструмент на базе LSP, который открывает доступ к иерархии вызовов и ссылкам между сущностями. Благодаря этому модель воспринимает код не как статичный текст, а как структуру с зависимостями.

🟢Отдельный пласт - борьба с раздуванием контекста.

Claude Code дедуплицирует чтение файлов: если файл не изменился, повторно он не обрабатывается. Слишком объемные результаты инструментов выносятся на диск, а в контексте остается лишь превью со ссылкой. Длинные контексты автоматически усекаются и суммаризуются.

🟢Агент ведет структурированную память сессии в виде markdown-файла.

В нем создаются разделы: состояние задачи, рабочие файлы и функции, ошибки, выводы, рабочий лог. Это некий цифровой аналог заметок, которые разработчик делает по ходу работы.

🟢Параллелизм обеспечивают субагенты.

Форкнутые процессы переиспользуют кэш родителя и учитывают мутабельные состояния. Это позволяет вести суммаризацию и фоновый анализ, не засоряя основной цикл агента.

🟢В утечке нашлись и намеки на будущее.

В комментариях упоминается модель capybara-v2-fast и описаны ее особенности: чувствительность к стоп-последовательностям, склонность к избыточным аннотациям и защищенные блоки мышления.

Модели Opus 4.7 и Sonnet 4.8 фигурируют в коде лишь как примеры невыпущенных версий.

7
7
16 комментариев