Сжатие
Каждая модель имеет контекстное окно (максимальное количество токенов, которые она может видеть). Длительные чаты накапливают сообщения и результаты работы инструментов; как только окно заполняется, OpenClaw сжимает старую историю, чтобы оставаться в пределах лимита.
Что такое сжатие
Сжатие суммирует старую часть разговора в компактную запись-резюме и оставляет последние сообщения нетронутыми. Резюме сохраняется в истории сессии, поэтому будущие запросы используют:
- Резюме сжатия
- Последние сообщения после точки сжатия
Сжатие сохраняется в истории сессии в формате JSONL.
Конфигурация
Используйте настройку agents.defaults.compaction в вашем файле openclaw.json для настройки поведения сжатия (режим, целевое количество токенов и т.д.). Суммаризация при сжатии по умолчанию сохраняет непрозрачные идентификаторы (identifierPolicy: "strict"). Вы можете переопределить это с помощью identifierPolicy: "off" или предоставить собственный текст с помощью identifierPolicy: "custom" и identifierInstructions.
Автоматическое сжатие (включено по умолчанию)
Когда сессия приближается к контекстному окну модели или превышает его, OpenClaw запускает автоматическое сжатие и может повторить исходный запрос, используя сжатый контекст. Вы увидите:
🧹 Автоматическое сжатие завершенов подробном режиме/statusпоказывающий🧹 Сжатий: <количество>
Перед сжатием OpenClaw может выполнить тихий сброс памяти, чтобы сохранить устойчивые заметки на диск. Подробности и настройки см. в разделе Память.
Ручное сжатие
Используйте команду /compact (опционально с инструкциями), чтобы принудительно выполнить сжатие:
/compact Focus on decisions and open questions
Источник данных о контекстном окне
Контекстное окно зависит от модели. OpenClaw использует определение модели из настроенного каталога провайдера для определения лимитов.
Сжатие vs обрезка
- Сжатие: суммирует и сохраняет в JSONL.
- Обрезка сессии: удаляет старые результаты работы инструментов только в оперативной памяти, для каждого запроса.
Подробности об обрезке см. в разделе /concepts/session-pruning.
Серверное сжатие от OpenAI
OpenClaw также поддерживает серверные подсказки для сжатия в OpenAI Responses для совместимых моделей OpenAI, работающих напрямую. Это отдельно от локального сжатия OpenClaw и может работать вместе с ним.
- Локальное сжатие: OpenClaw суммирует и сохраняет в JSONL сессии.
- Серверное сжатие: OpenAI сжимает контекст на стороне провайдера, когда включены
store+context_management.
См. Провайдер OpenAI для параметров модели и переопределений.
Советы
- Используйте
/compact, когда сессии кажутся устаревшими или контекст раздутым. - Большие выходные данные инструментов уже обрезаются; обрезка может дополнительно уменьшить накопление результатов.
- Если вам нужен чистый лист,
/newили/resetзапускает новую сессию.
ПамятьМаршрутизация между агентами