跳到主要内容

大语言模型

大语言模型关注大规模预训练、上下文学习、对齐、推理和评估。

栏目定位

这里记录 Transformer、预训练数据、Scaling Law、SFT、RLHF / DPO、推理机制、工具调用和评估。

子方向

Transformer。
预训练。
指令微调。
对齐方法。
推理解码。
评估与安全。

推荐学习路径

先学习语言模型和 Transformer，再理解预训练与对齐，最后进入推理系统、评估和应用工程。

笔记模板

模型目标。
数据流程。
训练阶段。
推理机制。
能力边界。
相关系统问题。

参考资料

大语言模型可参考 CS336、经典 Transformer 论文和开源模型技术报告。

栏目定位
子方向
推荐学习路径
笔记模板
参考资料