术语表与对象对照#

这一节解决“同一个词在不同层里是什么意思”这个问题。SGLang 的很多对象会在协议层、manager 层、scheduler 层和执行层反复出现，如果术语不先对齐，后面越深入越容易混淆。

为什么术语要先收口#

系统书一旦变厚，最先失稳的往往不是局部事实，而是对象边界。尤其对 SGLang 这种系统来说，很多词会在不同章节反复出现，但并不站在同一抽象层。只要口径稍微漂移，读者就会在章节之间反复重建对象模型，最后把“回扣”读成“混乱”。

所以这一节不是附录词典，而是整本书后面反复要回来的总坐标。

最先需要对齐的是请求对象这组词：

术语	主层次	更像什么	不要和什么混读
`GenerateReqInput`	协议 / 运行时交界	统一的 runtime 请求输入	不要把它看成 HTTP request body
`ReqState`	API server 侧	请求状态与返回收口容器	不要把它看成 scheduler 的主语
`Req`	调度 / 执行交界	单请求运行时本体	不要把它当成回包对象

更稳的记法是：

第二组最容易混的是 batch 和执行对象：

术语	主层次	更像什么	不要和什么混读
`ScheduleBatch`	调度层	这一轮被组织出来的运行批次	不等于执行层输入
`ForwardBatch`	执行前边界	前向真正消费的对象	不等于 waiting queue 的延续
`ModelRunner`	执行壳	在当前并行拓扑下运行模型前向	不等于调度器的附属函数

这组对象是第三部分反复回扣的主轴。只要这组边界先稳住，后面读第五章和第六章就不会把调度与执行混成一层。

第四章反复要回来的，是下面这组三层边界：

这三个名字如果一开始没对齐，后面无论读主链还是读调试章节，都会一直串层。

第五章之后，另一组很容易混的词是：

更稳的记法是：

到第七章时，最容易混的是：

这组对象如果一开始不拆开，后面读结构化生成时就很容易把“限制输出空间”和“解释输出结果”写成一件事。

最后一组和第四部分最相关：

这些对象之所以要先对齐，是因为第四部分不会再从零解释它们，而是假定你已经知道它们属于哪条证据链。

下面这些词最容易成对混读，后面尤其值得反查：

如果你在某一章里又开始把这几对词混起来，通常不是那一章本身有问题，而是需要先回到这里重新校准对象边界。

更实用的用法通常是：

这一节真正提供的不是术语解释，而是认知止损能力。

如果把整本书看成一条不断回扣的系统主线，这一节的职责就是防止回扣变成漂移。它不提供新的实现细节，但负责让同一个对象在不同章节再次出现时，仍然站在同一条稳定坐标轴上。