Prompt 工程

流式返回与格式配合

LLM 是逐 Token 输出的。同一个响应内容，格式不同，流式体验完全不同。选择场景后点击播放，观察三种格式的渲染差异。

选择演示场景

三种格式实时对比

JSON 等待中

原始流 Token（逐字累积）

⏳ 等待完整 JSON 到达后才能解析…
流式过程中 JSON 是"残缺"的，
无法中途解析渲染

✓ JSON 解析完成（全文到达后）

Markdown 等待中

渲染区域（逐字显示）

⚠️ 虽然逐字显示流畅，
但无法从 Markdown 中
可靠提取结构化字段

XML 自定义标签等待中

增量解析渲染（捕获到 </tag> 即渲染）

核心结论

JSON 流式
后端友好但流式不佳：
必须等全文才能解析，
用户看到的是"loading"状态

Markdown 流式
用户体验最流畅：
逐字显示有"打字"感，
但无法提取字段做程序处理

XML 流式
两全其美：流式 + 结构化
捕获到 </name> 立刻渲染，
Claude 原生推荐此方式

核心结论： XML 捕获标签 → 立刻渲染字段；JSON 等全文 → 解析一次；MD 逐字显示 → 无法提取字段。