1. 原始语料
大模型学习的第一步:读取人类提供的海量文本数据。
下一步:分词处理
全局词间关联权重矩阵
(
)
关联弱
关联强
哥哥
→
?
重新采样
Temperature
0.70
Top-P
0.90
候选词概率分布