模块七 · 记忆 · 第 1 页
上下文窗口就是
工作台
模型能"看到"的一切,都必须放在这张桌子上
上下文窗口使用率
0%
0
/ 131,072 Token
⚠️ 即将触发压缩策略
🖥
模型的工作台(上下文窗口 = 128K Token)
▶ 下一步
重置
共 10 步 · 观察工作台如何被填满
实时统计
总 Token 数
0
消息条数
0
使用率
0%
预估费用
¥0.000
按 ¥0.006 / 1K Token 估算
消息组成
Takeaway
上下文窗口是模型的唯一工作记忆——128K Token 看似很大,但每轮对话都要重发全部历史消息。10 轮深度对话 + 一份长文档,就可能把窗口撑满。管理上下文,就是管理产品的记忆寿命。