第 39 节 · 总复盘：从 Token 到 NPC 的全链路

一根线串起 7 天

Day1 · LLM 本质
  "给定前面的 token，预测下一个"
  → 概率采样 / 涌现 / 幻觉 / 天生边界
       ↓
Day2 · 让 LLM 行动
  "光说不干不是 Agent"
  → Function Calling / ToolRegistry / 最小 Agent Loop
       ↓
Day3 · 教它怎么想
  "不同范式适合不同任务"
  → ReAct（边想边做）/ Plan-and-Solve（先规划再执行）/ Reflection（自我审阅）
       ↓
Day4 · 让它记住事
  "长对话会变贵、变慢、变笨"
  → ContextManager（压缩）+ Memory（召回长期事实）
       ↓
Day5 · 给它工具箱
  "Coding Agent = 五阶段循环 × 安全工具"
  → read / list_dir / write / edit / bash + 设计哲学（old/new / 4 道闸门）
       ↓
Day6 · 组装
  "把零件按数据流编排起来"
  → CodingAgent 类 + REPL / Solo + 工具过程可视化
       ↓
Day7 · 上线
  "你的 Agent 变成仓库里的 NPC"
  → Skills 渐进式加载 + Docker 打包 + CNB Pipeline + NPC 回复

回顾要点

每天一个"灵魂问题"

天	灵魂问题	一句话答案
1	LLM 为什么能写代码？	它不是真的像人一样理解代码，但 next-token prediction 在大规模训练和后训练后形成了强编码能力
2	Agent 跟 Chatbot 有什么本质区别？	Agent 有循环——能调工具、看结果、再调，直到完成任务
3	ReAct 和 Plan-and-Solve 什么时候选哪个？	信息不确定时 ReAct（边走边看），步骤明确时 P&S（先规划省 token）
4	为什么不把所有对话都留着？	token 成本、有效上下文、Lost in the Middle 和 context pollution 都会拖垮质量
5	edit 为什么用 old/new 不用行号？	LLM 上一轮读到行号，下一轮再用时行号可能已经变了
6	CodingAgent 为什么能拆得开？	因为 LLM、Tools、Context、Memory、UI 各自接口简单、职责单一
7	NPC 上线最容易挂在哪？	镜像环境、Secrets、角色名、权限 / Work Mode、入口脚本这几处

知识地图

┌───────────────────────────────────────────────────────┐
│                    CodingAgent                         │
├──────────┬──────────┬──────────┬──────────┬──────────┤
│   LLM    │  Tools   │ Context  │  Memory  │   UI     │
│  (Day1)  │ (Day2+5) │  (Day4)  │  (Day4)  │ (Day6)  │
├──────────┴──────────┴──────────┴──────────┴──────────┤
│  Agent Loop (Day2) + 范式 (Day3) + Skills (Day7)     │
├──────────────────────────────────────────────────────┤
│  Docker + CNB Pipeline + NPC (Day7)                   │
└───────────────────────────────────────────────────────┘

你做出来的东西，跟行业差多少？

能力	你的 Agent	工业 Coding Agent
读写代码	✅	✅
多轮工具调用	✅	✅
上下文管理	✅ 基础分层 / 压缩	✅ 更细的索引、缓存、隔离和评测
长期记忆	✅ 入门召回	✅ 向量库、用户画像、时间衰减、冲突处理
Skills / Rules	✅ `SKILL.md`	✅ 渐进式披露、脚本、参考资料、市场化分发
安全沙箱	⚠️ 黑名单 + Docker 入门	✅ 容器、VM、权限、审计、回滚
多模型路由	❌	✅ 大模型规划 + 小模型执行 + 成本路由
并行工具调用	❌	✅ 常见
代码索引	❌	✅ tree-sitter、语言服务、向量索引、知识图谱
用户体验	⚠️ CLI / REPL	✅ IDE、CLI、PR 评论、Issue、CI 多入口

结论：核心心智模型已经对齐。差距主要在工程质量：索引、沙箱、评测、权限、可观测性、协作体验。

2026 年再看这门课

2026 年的 Agent 工程有几个明显趋势：

趋势	本课对应
Context engineering 变成核心能力	Day4 ContextManager + Memory
Agent Skills 标准化	Day7 `SKILL.md` + 渐进式加载
CLI 重新重要	Day6 Solo 模式可接 CI / NPC
仓库机器人变成协作者入口	Day7 CNB NPC
安全和权限成为上线门槛	Day5 安全工具 + Day7 Work Mode

所以这门课不是教你背某个 SDK，而是教你看懂一类系统：模型只是发动机，真正的 Agent 是上下文、工具、记忆、UI、部署和权限的组合工程。

课后你可以继续做什么

见 README 的"课后路线建议"部分。

第 39 节 · 总复盘：从 Token 到 NPC 的全链路 ​

一根线串起 7 天 ​

回顾要点 ​

每天一个"灵魂问题" ​

知识地图 ​

你做出来的东西，跟行业差多少？ ​

2026 年再看这门课 ​

课后你可以继续做什么 ​

第 39 节 · 总复盘：从 Token 到 NPC 的全链路

一根线串起 7 天

回顾要点

每天一个"灵魂问题"

知识地图

你做出来的东西，跟行业差多少？

2026 年再看这门课

课后你可以继续做什么