跳到主要内容

1 篇博文 含有标签「GPU」

GPU 与并行计算记录

查看所有标签

技术复现记录模板

· 阅读需 1 分钟
Xiaoming Wiki

这篇文章是技术复现记录模板,适用于论文、框架、Kernel、推理优化和量化方法。

复现对象

  • 名称:
  • 来源:
  • 目标:
  • 运行环境:

核心问题

这项技术解决什么瓶颈?瓶颈来自模型结构、访存、并行度、调度、显存,还是通信?

实验记录

  • 环境配置:
  • 关键命令:
  • 输入数据:
  • 指标:
  • 失败现象:

复盘

  • 哪些结果符合预期?
  • 哪些结果需要重新验证?
  • 可以沉淀到哪个知识栏目?