跳到主要内容

AI 基础与模型

本栏目以模型原理、训练方法、推理机制和经典论文为主。课程只是辅助资料来源，知识体系才是目录主线。

AI 基础与模型
├─ 机器学习
├─ 深度学习
├─ 计算机视觉
├─ 自然语言处理
├─ 大语言模型
└─ 扩散模型

子方向

机器学习：监督学习、无监督学习、评估和泛化。
深度学习：神经网络、优化、正则化和训练稳定性。
计算机视觉：图像模型、检测、分割和视觉表征。
自然语言处理：语言建模、表示学习、序列任务和评估。
大语言模型：Transformer、预训练、对齐、推理和评估。
扩散模型：去噪建模、采样、条件生成和多模态生成。

推荐学习路径

先学习机器学习和深度学习的共同基础，再进入 NLP、CV、LLM 和扩散模型。每个方向都尽量从问题定义、模型结构、训练目标、数据、评估和失败模式六个角度整理。

笔记模板

任务定义：输入、输出和评价指标。
模型结构：核心模块和信息流。
训练目标：损失函数和优化方法。
数据：数据来源、清洗和偏差。
推理：生成、解码或预测机制。
论文脉络：关键论文解决了什么问题？

参考资料

计算机视觉可参考 CS231N。
自然语言处理可参考 CS224N。
大语言模型可参考 CS336。
扩散模型可参考 MIT 6.S183。
机器学习 / 深度学习可参考 CS229、EECS498 等资料。

这些课程只作为资料来源，本站目录仍然围绕知识方向展开。

子方向
推荐学习路径
笔记模板
参考资料