概览#

概览部分的任务不是“先友好介绍一下项目”，而是替整本书建立读法。对 SGLang 这样的系统来说，这一步尤其重要：如果一开始就跳进 python/sglang/srt，读者很容易把它误读成一堆 runtime internals，而忽略它同时也是 frontend language、runtime surface 和多种协议表面的组合体。

因此，这一部分先回答四个更基础的问题：这本书为什么这样组织，SGLang 对外到底呈现成什么，整本书反复回扣的对象和术语有哪些，以及不同背景的工程师该沿哪条路径进入正文。只有这些问题先稳定下来，后面的请求链、调度、执行和维护层才不会变成一组并排专题。

这一部分解决什么#

概览部分主要解决三类认知问题：

读者边界：这本书面向谁，不面向谁，第一版刻意不展开什么。
系统边界：SGLang 为什么不能只被看成 server，也不能只被看成 prompt DSL。
阅读边界：遇到源码、术语、对象和时间字段时，应该回到哪一层重新定位。

如果把它说得更直白一点，概览不是在“讲前言”，而是在替后面所有章节建立共同坐标系。没有这层坐标系，后文即使都各自成立，也更像一组内容厚实的专栏，而不像一本稳定递进的书。

这一部分怎样组织#

这一部分目前分成四组内容，而不是七篇平行短文：

范围与读法：
1.1 第一版范围与阅读地图
 1.3 如何带着问题读这本书与上游源码
系统定义与主心智模型：
1.2 为什么是 SGLang：Frontend Language 与 Runtime 心智模型
 1.4 贯穿全书的核心不变量与阅读检查点
阅读路线与源码总索引：
1.5 按角色阅读：平台、推理与框架工程师的三条路径
 1.6 全书源码锚点地图与跳转索引
术语与对象对齐：
1.7 全书术语表与易混概念对照

这种分法比“逐章点名”更重要，因为它告诉读者：概览部分不是七篇介绍文，而是四种不同层级的准备工作。它们分别负责范围、定义、导航和统一口径。

这一部分和后文怎样咬合#

概览后面最自然接上的，是 2. 请求生命周期。原因不是“生命周期更基础”，而是你只有先知道系统外形和读法，才知道为什么下一步应该先走一次请求主链，而不是直接扑进 Scheduler、RadixCache 或 ModelRunner。

同样，概览中的术语、源码锚点和角色阅读路线，并不是只在前几章有用。越往后读，它们越像总索引：当你在 4. 调度与内存里再次看到 Req、在 5. 执行模型里再次看到 ForwardBatch、在 8. 扩展与调试里再次看到 ReqTimeStats 时，概览部分提供的其实是“回到哪一层重新校准”的能力。

读完这一部分之后应当真正得到什么#

如果概览部分成立，读者离开这一部分时至少应该已经拥有四样东西：

一条稳定的主阅读顺序
对 SGLang 外部形态的基本定义
一批会在全书反复出现的核心对象与术语
一组能把章节重新映射回源码树的总锚点

优秀技术书的开头，真正提供的往往不是“背景知识”，而是“后文怎样才不会读散”的方法。概览部分承担的就是这个作用。