代码导读#

代码导读部分的职责，不是把仓库目录逐层复述一遍，而是把前文已经建立好的心智模型重新压回真实源码树。读到这里，读者不再缺“系统是什么”的解释，而更容易缺“现在该进哪一棵树、先读哪个文件、怎样避免读散”。这一部分要解决的，正是这种从抽象回到实现时的阅读阻力。

因此，这一部分最重要的产出不是更多目录名，而是几条稳定的源码阅读路线：从公开入口读进去，从请求主线读进去，从执行中枢读进去，从缓存和观测树读进去，以及从 examples / tests / benchmark 这些验证材料读进去。只有这些路线足够清楚，代码导读才像书的后半程，而不是一张目录清单。

这一部分怎样读#

这一部分目前章节很多，但它们并不是三十多篇并排短文。更稳的读法，是把它们压成五组阅读任务。

第一组：先确认外部入口和协议桥#

如果你的问题是“这个系统到底从哪里进来”，先读这组：

这组章节回答的是同一个问题：外部请求如何被解释成系统内部对象，而不是“有哪些入口文件”这么浅的一层。

第二组：顺着请求与 manager 主线往里走#

如果你的问题是“请求怎样在 runtime 里被编排和收口”，先读这组：

这组章节的核心，是把“入口 manager、调度器输出尾部和回包收口”看成同一条请求桥，而不是几个散点文件。

第三组：进入调度、执行和缓存中枢#

如果你的问题是“系统真正怎样把请求变成 batch、执行对象和缓存状态”，优先读这组：

这是整本书和源码贴得最紧的一组章节。前文的 Req、ScheduleBatch、ForwardBatch、ModelRunner 和 KV cache 语义，都会在这里重新汇合。

第四组：读控制面、观测面和维护支线#

如果你的问题是“系统怎样被观察、控制和维护”，先读这组：

这组章节把“维护者视角”正式拉回源码层，避免读者只在第 8 节里学会排障，却不知道对应实现藏在哪些树里。

第五组：把源码阅读重新接回验证材料#

如果你的目标是“读完源码之后如何验证理解”，再读这组：

这组章节的重点不是再介绍新模块，而是告诉你：源码理解要怎样回到 examples、tests、profiling 和 benchmark，才算真正闭环。

为什么这一部分不该写成逐章目录#

代码导读部分最容易失控成“目录越厚越像资料汇编”。但优秀技术书不会让读者在第七部分看到一份三十多项的平铺目录，因为那会立即把“源码阅读路线”重新打散成“单篇主题列表”。

更稳的办法，是像上面这样把章节压成少数几条阅读任务。这样读者面对的不是三十五个平行入口，而是五种明确的问题场景：我是在找入口，找请求桥，找执行中枢，找维护支线，还是在找验证材料。只要问题先明确，章节数量再多也不容易读散。

这一部分和前后章节的关系#

代码导读放在 6. 结构化生成与 API 之后，不是因为源码没有前面重要，而是因为这里的阅读质量高度依赖前文。如果你还没有把请求主线、运行时边界、调度对象和执行对象分清，直接读 scheduler.py、radix_cache.py 或 model_runner.py，通常只会得到很多局部事实，而不会形成稳定地图。

同样，代码导读之后立刻接 8. 扩展与调试，也不是偶然。第七部分负责告诉你“源码在哪、怎样读”，第八部分负责告诉你“读完之后出了问题怎么看、要改系统怎么进”。这两部分合起来，才是一本系统书真正落到工程动作的地方。