跳到主要内容

学习路线

总体路线:

数学基础 → 编程语言 → 计算机基础 → AI 基础与模型 → AI 系统与性能

阶段一:数学与编程基础

  • 学习目标:建立微积分、线性代数、概率论的基本直觉,并能用 Python / C++ 做基础实验。
  • 推荐资料:微积分、线性代数、概率论教材和公开课程;Python 官方文档;现代 C++ 资料。
  • 产出物:概念笔记、公式推导、数值实验、语言练习代码。
  • 复盘方式:每周整理易错概念、常用公式和代码片段。

阶段二:计算机系统基础

  • 学习目标:理解算法复杂度、计算机组成、操作系统抽象和网络协议。
  • 推荐资料:数据结构与算法、组成原理、操作系统、计算机网络的系统化教材。
  • 产出物:算法题解、系统笔记、实验记录、性能观察。
  • 复盘方式:用“问题场景 → 系统机制 → 关键边界”复盘。

阶段三:机器学习、深度学习与模型基础

  • 学习目标:掌握监督学习、优化、神经网络训练、表示学习和评估方法。
  • 推荐资料:机器学习、深度学习教材,经典论文和公开课程。
  • 产出物:模型原理笔记、训练实验、论文卡片。
  • 复盘方式:对每个模型记录假设、目标函数、训练流程和失败模式。

阶段四:LLM、NLP、CV、扩散模型

  • 学习目标:理解主流模型结构、训练数据、推理机制和典型任务。
  • 推荐资料:NLP、CV、LLM、扩散模型方向的课程、论文和工程实现。
  • 产出物:论文阅读、结构图、复现实验、错误案例分析。
  • 复盘方式:围绕“模型为什么这样设计”写短复盘。

阶段五:AI Infra、GPU、算子、推理框架与大模型系统优化

  • 学习目标:把模型理解推进到系统实现层,理解 GPU 并行、Kernel、推理框架、量化、显存和调度。
  • 推荐资料:CUDA、GPU Mode、vLLM、FlashAttention、量化与系统优化论文。
  • 产出物:性能分析记录、Kernel 学习笔记、推理系统拆解、复现报告。
  • 复盘方式:记录瓶颈、指标、工具、改动和收益,避免只写结论。

当前重点

  • 微积分、线性代数、概率论
  • Python、C++
  • 数据结构与算法、操作系统、组成原理、网络
  • NLP、LLM、扩散模型
  • vLLM、KV Cache、量化、算子优化、GPU Mode