跳转到主要内容
AI 系统

AI 推理系列总览

约 3 分钟阅读 索引

AI 推理系列总览

这组文章是从一次持续聊天里整理出来的,但我不想把所有内容都塞进一篇长文里。

所以这一组系列文的组织方式是:

  • 先用一篇讲清最核心的概念边界
  • 再用一篇把 reasoning model、Agent、上下文和长任务能力串起来
  • 最后用一篇讲 RAG、memory、fine-tuning、post-training、distillation 这些常被混淆的训练和系统概念

如果你是第一次接触这个话题,建议按顺序读。

阅读顺序

序号文章核心问题
01什么是 AI 推理推理和记忆有什么区别?token 生成和推理是什么关系?
02Reasoning Model、Agent 与长任务reasoning model 强在哪?Agent 能力和推理能力是什么关系?为什么长任务更难?
03RAG、Memory、Fine-tuning 与 DistillationRAG 还重要吗?什么时候用 fine-tuning?蒸馏和后训练是什么关系?

这组文章想解决什么问题?

我最开始的困惑大概是这些:

  • 大模型不就是在生成 token 吗,为什么大家还会说它“在推理”?
  • 思维链是不是就等于推理?
  • reasoning model 比普通模型到底强在哪?
  • 为什么模型知道很多,但一到复杂问题就开始胡说?
  • 为什么接上工具后模型会看起来更聪明,但长任务还是容易崩?
  • RAG、memory、session summary、fine-tuning、distillation 这些词到底各自解决什么问题?

这组系列文不会从学术定义堆起,而是尽量按“一个新手实际会混淆的地方”来展开。

当前状态

  • 这一版先把主线结构固定下来
  • 后续还会继续补 benchmark、内部推理可观察性、reasoning 评测、agent workflow 等内容

如果只想先读一篇总览版,可以看 AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent

修改历史1 次提交

相关阅读

基于标签与分类