AI 推理系列总览
约 3 分钟阅读
索引
AI 推理系列总览
这组文章是从一次持续聊天里整理出来的,但我不想把所有内容都塞进一篇长文里。
所以这一组系列文的组织方式是:
- 先用一篇讲清最核心的概念边界
- 再用一篇把 reasoning model、Agent、上下文和长任务能力串起来
- 最后用一篇讲 RAG、memory、fine-tuning、post-training、distillation 这些常被混淆的训练和系统概念
如果你是第一次接触这个话题,建议按顺序读。
阅读顺序
| 序号 | 文章 | 核心问题 |
|---|---|---|
| 01 | 什么是 AI 推理 | 推理和记忆有什么区别?token 生成和推理是什么关系? |
| 02 | Reasoning Model、Agent 与长任务 | reasoning model 强在哪?Agent 能力和推理能力是什么关系?为什么长任务更难? |
| 03 | RAG、Memory、Fine-tuning 与 Distillation | RAG 还重要吗?什么时候用 fine-tuning?蒸馏和后训练是什么关系? |
这组文章想解决什么问题?
我最开始的困惑大概是这些:
- 大模型不就是在生成 token 吗,为什么大家还会说它“在推理”?
- 思维链是不是就等于推理?
- reasoning model 比普通模型到底强在哪?
- 为什么模型知道很多,但一到复杂问题就开始胡说?
- 为什么接上工具后模型会看起来更聪明,但长任务还是容易崩?
- RAG、memory、session summary、fine-tuning、distillation 这些词到底各自解决什么问题?
这组系列文不会从学术定义堆起,而是尽量按“一个新手实际会混淆的地方”来展开。
当前状态
- 这一版先把主线结构固定下来
- 后续还会继续补 benchmark、内部推理可观察性、reasoning 评测、agent workflow 等内容
如果只想先读一篇总览版,可以看 AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent。
修改历史1 次提交
- content(ingest): AI 推理系列 4 篇 + Zsh 一键复刻配置xiaocheng··
be9ef88
相关阅读
基于标签与分类02. Reasoning Model、Agent 与长任务
reasoning model 和普通模型有什么区别?为什么模型知道很多却一推就错?为什么接上工具后小模型短任务聪明、长任务却容易崩?
AI 系统
AI 推理入门:从 token 生成到 reasoning model、RAG 与 Agent
从新手视角梳理 AI 推理的核心概念:推理与记忆的区别、思维链、reasoning model、RAG、memory、fine-tuning、distillation,以及推理能力和 agent 能力的关系。
AI 系统
AI 推理系列总览
AI 推理系列文章总览,从基础概念到 reasoning model、Agent、RAG、fine-tuning 与蒸馏,按主题持续迭代。
AI 系统