类比学生考试:训练 = 多年备考,反复刷题,记住知识 → 推理 = 上考场作答,参数冻结,不再学习新东西
训练(Training)
在海量数据上调整数十亿个参数,让模型记住世界知识。
执行频率一次性
算力需求千~万块 GPU
参数状态持续更新
成本数亿美元
时长数周~数月
推理(Inference)
用固定参数,针对你的输入生成回答。每次对话参数完全不变。
执行频率每次对话
算力需求1~数块 GPU
参数状态完全冻结
计费按 Token 计费
时长1~10 秒/次
互动实验:你说的话会改变参数吗?
模型参数(示意)
🔒 参数完全冻结
对话不改变任何权重
你和 AI 说的话,不会修改任何参数。今天告诉它「你叫小明」,明天重开对话它不记得——因为对话只存在于上下文,对话不是学习。