全书主线、边界与核心不变量#

这一节负责把全书真正反复回扣的主线钉住。它不会提前展开全部实现，但会说明哪些对象、边界和运行时语义构成了后面章节共享的底板。

这本书写什么，不写什么#

这本书写的是：

这本书不写的是：

换句话说，这本书追求的是“稳定主线 + 稳定锚点”，不是“覆盖一切可能的局部知识”。

如果把全书压缩成一条最短主线，它其实就是：

这条主线之所以重要，是因为它决定了后面的章节顺序：

如果没有这条主线，后面的章节就会更像平铺专题，而不像一本系统书。

后面无论写哪一章，至少有四条东西应该持续成立。

请求会一路变化：

但每一层都必须仍然有明确职责。后文如果把这些对象混着讲，这条不变量就被破坏了。

session、abort、priority、weight update、logging configuration 这些更像控制面；batch、KV cache、forward、sampling、text delta 则更像数据面。两者会互相影响，但不应该被写成同一个层次的问题。

后面不断会出现：

这些边界不是因为目录刚好这么分，而是因为运行时真的靠这些边界在推进状态。全书后面必须一直把它们当成正式边界，而不是方便记忆的模块名。

RequestStage、ReqTimeStats、request logger、trace、dump、profile、tests 这些内容，后面都不应该变成“独立工具箱”。它们存在的意义，是把排障和维护重新接回请求主线和运行时边界。

为了把这组不变量真正变成阅读工具，而不是抽象口号，可以把它压成三个固定问题：

只要对每章都能回答这三个问题，整本书就不容易被读散。

如果这些范围和不变量不先说清楚，后面读到某一章时你很容易犯两种错误：

把不变量先立起来的好处，是后面每一章都知道自己在护哪一层，不需要临时再给自己找存在理由。

这一节真正要补齐的，不是更多背景知识，而是后文的共同底板：

只要这一层先稳住，后面越往里写，整本书越不容易散。