跳到主要内容

计算机视觉

计算机视觉关注图像和视频中的表征、识别、检测、分割和生成。

栏目定位

这里记录视觉任务、CNN、ViT、检测框架、分割模型、自监督学习和多模态视觉模型。

子方向

  • 图像分类。
  • 目标检测。
  • 语义分割与实例分割。
  • 视觉 Transformer。
  • 自监督视觉表征。
  • 视觉生成模型。

推荐学习路径

先学习图像分类和 CNN,再进入检测、分割和 ViT,最后连接到多模态模型和生成模型。

笔记模板

  • 任务定义。
  • 数据集与指标。
  • 模型结构。
  • 训练策略。
  • 错误样例。
  • 论文脉络。

参考资料

计算机视觉可参考 CS231N,但本站目录不以课程名组织。