跳到主要内容

AI 基础与模型

本栏目以模型原理、训练方法、推理机制和经典论文为主。课程只是辅助资料来源,知识体系才是目录主线。

AI 基础与模型
├─ 机器学习
├─ 深度学习
├─ 计算机视觉
├─ 自然语言处理
├─ 大语言模型
└─ 扩散模型

子方向

  • 机器学习:监督学习、无监督学习、评估和泛化。
  • 深度学习:神经网络、优化、正则化和训练稳定性。
  • 计算机视觉:图像模型、检测、分割和视觉表征。
  • 自然语言处理:语言建模、表示学习、序列任务和评估。
  • 大语言模型:Transformer、预训练、对齐、推理和评估。
  • 扩散模型:去噪建模、采样、条件生成和多模态生成。

推荐学习路径

先学习机器学习和深度学习的共同基础,再进入 NLP、CV、LLM 和扩散模型。每个方向都尽量从问题定义、模型结构、训练目标、数据、评估和失败模式六个角度整理。

笔记模板

  • 任务定义:输入、输出和评价指标。
  • 模型结构:核心模块和信息流。
  • 训练目标:损失函数和优化方法。
  • 数据:数据来源、清洗和偏差。
  • 推理:生成、解码或预测机制。
  • 论文脉络:关键论文解决了什么问题?

参考资料

  • 计算机视觉可参考 CS231N。
  • 自然语言处理可参考 CS224N。
  • 大语言模型可参考 CS336。
  • 扩散模型可参考 MIT 6.S183。
  • 机器学习 / 深度学习可参考 CS229、EECS498 等资料。

这些课程只作为资料来源,本站目录仍然围绕知识方向展开。