AI 基础与模型
本栏目以模型原理、训练方法、推理机制和经典论文为主。课程只是辅助资料来源,知识体系才是目录主线。
AI 基础与模型
├─ 机器学习
├─ 深度学习
├─ 计算机视觉
├─ 自然语言处理
├─ 大语言模型
└─ 扩散模型
子方向
- 机器学习:监督学习、无监督学习、评估和泛化。
- 深度学习:神经网络、优化、正则化和训练稳定性。
- 计算机视觉:图像模型、检测、分割和视觉表征。
- 自然语言处理:语言建模、表示学习、序列任务和评估。
- 大语言模型:Transformer、预训练、对齐、推理和评估。
- 扩散模型:去噪建模、采样、条件生成和多模态生成。
推荐学习路径
先学习机器学习和深度学习的共同基础,再进入 NLP、CV、LLM 和扩散模型。每个方向都尽量从问题定义、模型结构、训练目标、数据、评估和失败模式六个角度整理。
笔记模板
- 任务定义:输入、输出和评价指标。
- 模型结构:核心模块和信息流。
- 训练目标:损失函数和优化方法。
- 数据:数据来源、清洗和偏差。
- 推理:生成、解码或预测机制。
- 论文脉络:关键论文解决了什么问题?
参考资料
- 计算机视觉可参考 CS231N。
- 自然语言处理可参考 CS224N。
- 大语言模型可参考 CS336。
- 扩散模型可参考 MIT 6.S183。
- 机器学习 / 深度学习可参考 CS229、EECS498 等资料。
这些课程只作为资料来源,本站目录仍然围绕知识方向展开。