跳到主要内容

GPU Mode 学习笔记

GPU Mode 学习笔记归入 GPU 与并行计算栏目,用于记录 GPU 编程、性能分析和 Kernel 优化的学习过程。

记录重点

  • 课程中的核心概念。
  • 代码实验和性能现象。
  • 与 CUDA 编程、GEMM、Attention Kernel 的连接。
  • 后续需要复现的 Kernel。

笔记模板

  • 本次主题。
  • 关键概念。
  • 代码片段。
  • profiler 观察。
  • 未解决问题。
  • 可沉淀到的知识页。