Agent 工程

短期记忆 = 上下文窗口

上下文窗口就是模型的工作台——模型能"看到"的一切，都必须放在这张桌子上。向下滚动，观察工作台如何被填满。

上下文窗口使用率 0% 0 / 131,072 Token

⚠️ 即将触发压缩策略

🖥 模型的工作台（上下文窗口 = 128K Token）

共 10 步 · 观察工作台如何被填满　

Takeaway

Takeaway　上下文窗口是模型的唯一工作记忆——128K Token 看似很大，但每轮对话都要重发全部历史消息。10 轮深度对话 + 一份长文档，就可能把窗口撑满。管理上下文，就是管理产品的记忆寿命。