模块六 · Prompt Engineering · 第 6 页
流式返回:格式选择影响实时体验
点击格式后播放,观察三种渲染差异 →

LLM 是逐 Token 输出的。同一个响应内容,格式不同,流式体验完全不同。

选择演示场景
核心结论:
XML 捕获标签 → 立刻渲染字段
JSON 等全文 → 解析一次
MD 逐字显示 → 无法提取字段
JSON 等待中
原始流 Token(逐字累积)
⏳ 等待完整 JSON 到达后才能解析…
流式过程中 JSON 是"残缺"的,
无法中途解析渲染
✓ JSON 解析完成(全文到达后)
Markdown 等待中
渲染区域(逐字显示)
⚠️ 虽然逐字显示流畅,
但无法从 Markdown 中
可靠提取结构化字段
XML 自定义标签 等待中
增量解析渲染(捕获到 </tag> 即渲染)
JSON 流式
后端友好但流式不佳:
必须等全文才能解析,
用户看到的是"loading"状态
Markdown 流式
用户体验最流畅:
逐字显示有"打字"感,
无法提取字段做程序处理
XML 流式
两全其美:流式 + 结构化
捕获到 </name> 立刻渲染,
Claude 原生推荐此方式