AI 推理系列总览

2026年4月21日 · 约 2 分钟阅读

这组文章是从一次持续聊天里整理出来的，但我不想把所有内容都塞进一篇长文里。

所以这一组系列文的组织方式是：

先用一篇讲清最核心的概念边界
再用一篇把 reasoning model、Agent、上下文和长任务能力串起来
最后用一篇讲 RAG、memory、fine-tuning、post-training、distillation 这些常被混淆的训练和系统概念

如果你是第一次接触这个话题，建议按顺序读。

阅读顺序

序号	文章	核心问题
01	什么是 AI 推理	推理和记忆有什么区别？token 生成和推理是什么关系？
02	Reasoning Model、Agent 与长任务	reasoning model 强在哪？Agent 能力和推理能力是什么关系？为什么长任务更难？
03	RAG、Memory、Fine-tuning 与 Distillation	RAG 还重要吗？什么时候用 fine-tuning？蒸馏和后训练是什么关系？

这组文章想解决什么问题？

我最开始的困惑大概是这些：

大模型不就是在生成 token 吗，为什么大家还会说它“在推理”？
思维链是不是就等于推理？
reasoning model 比普通模型到底强在哪？
为什么模型知道很多，但一到复杂问题就开始胡说？
为什么接上工具后模型会看起来更聪明，但长任务还是容易崩？
RAG、memory、session summary、fine-tuning、distillation 这些词到底各自解决什么问题？

这组系列文不会从学术定义堆起，而是尽量按“一个新手实际会混淆的地方”来展开。

当前状态

这一版先把主线结构固定下来
后续还会继续补 benchmark、内部推理可观察性、reasoning 评测、agent workflow 等内容

修改历史3 次提交

docs: refresh wiki indexes and embeddings
xiaocheng·07-01·41f3817
fix(wiki): clean all lint errors to enable strict CI (PR-3)
xiaocheng·05-25·75375ef
content(ingest): AI 推理系列 4 篇 + Zsh 一键复刻配置
xiaocheng·05-22·be9ef88