跳到主要内容

自然语言处理

自然语言处理关注文本、语义、上下文、序列建模和语言理解 / 生成。

栏目定位

这里记录词向量、序列模型、注意力机制、Transformer、语言建模、检索和评估方法。

子方向

  • 文本表示。
  • 序列建模。
  • 注意力机制。
  • 语言模型。
  • 信息抽取。
  • 检索与问答。

推荐学习路径

先理解文本表示和语言建模,再进入 Transformer 和预训练模型,最后连接到大语言模型和检索增强生成。

笔记模板

  • 任务定义。
  • 数据和标注。
  • 模型输入输出。
  • 训练目标。
  • 解码或检索机制。
  • 评估与错误分析。

参考资料

自然语言处理可参考 CS224N,但主线仍然是 NLP 的知识结构。