模块六 · Prompt Engineering · 第 6 页
流式返回:
格式选择影响实时体验
点击格式后播放,观察三种渲染差异 →
LLM 是
逐 Token 输出
的。同一个响应内容,格式不同,流式体验完全不同。
选择演示场景
工具推荐
结构化列表输出
3 个工具,包含名称/类型/亮点
分析报告
多字段结论输出
结论/原因/建议/置信度
开始播放流式输出
重置
核心结论:
XML 捕获标签 → 立刻渲染字段
JSON 等全文 → 解析一次
MD 逐字显示 → 无法提取字段
JSON
等待中
原始流 Token(逐字累积)
⏳ 等待完整 JSON 到达后才能解析…
流式过程中 JSON 是"残缺"的,
无法中途解析渲染
✓ JSON 解析完成(全文到达后)
Markdown
等待中
渲染区域(逐字显示)
⚠️ 虽然逐字显示流畅,
但无法从 Markdown 中
可靠提取结构化字段
XML 自定义标签
等待中
增量解析渲染(捕获到 </tag> 即渲染)
JSON 流式
后端友好但流式不佳:
必须
等全文
才能解析,
用户看到的是"loading"状态
Markdown 流式
用户体验最流畅:
逐字显示有"打字"感,
但
无法提取字段
做程序处理
XML 流式
两全其美
:流式 + 结构化
捕获到
</name>
立刻渲染,
Claude 原生推荐此方式