计算机视觉关注图像和视频中的表征、识别、检测、分割和生成。
栏目定位
这里记录视觉任务、CNN、ViT、检测框架、分割模型、自监督学习和多模态视觉模型。
子方向
- 图像分类。
- 目标检测。
- 语义分割与实例分割。
- 视觉 Transformer。
- 自监督视觉表征。
- 视觉生成模型。
推荐学习路径
先学习图像分类和 CNN,再进入检测、分割和 ViT,最后连接到多模态模型和生成模型。
笔记模板
- 任务定义。
- 数据集与指标。
- 模型结构。
- 训练策略。
- 错误样例。
- 论文脉络。
参考资料
计算机视觉可参考 CS231N,但本站目录不以课程名组织。