本章总览
上下文压缩在 token 逼近上限时** summarizing 历史**,用 CompactBoundaryMessage 切分新旧上下文。本章是理解长会话如何不爆窗的关键。
学完本章你应该能
- 理解 autoCompact 触发条件
- 知道压缩后 API messages 长什么样
- 理解压缩与 summarization 的区别
核心概念(先读懂这些)
压缩不是删消息
旧消息被摘要替代,边界标记告诉模型「此前是梗概」。错误压缩会丢关键 tool 结果。
建议学习步骤
- 读 compact 流程
- 对照 services/compact
概述
Token 接近上下文窗口时自动压缩历史。
| 指标 | 数值 |
|---|---|
| 行数 | 53,949 |
| 文件 | 148 |
关键文件
| 文件 |
|---|
compact/autoCompact.ts |
compact/compact.ts |
本章小结与延伸
长对话必备机制。与 messages、api-layer 联动阅读。 继续学习: