概览#
概览部分的任务不是“先友好介绍一下项目”,而是替整本书建立读法。对 SGLang 这样的系统来说,这一步尤其重要:如果一开始就跳进 python/sglang/srt,读者很容易把它误读成一堆 runtime internals,而忽略它同时也是 frontend language、runtime surface 和多种协议表面的组合体。
因此,这一部分先回答四个更基础的问题:这本书为什么这样组织,SGLang 对外到底呈现成什么,整本书反复回扣的对象和术语有哪些,以及不同背景的工程师该沿哪条路径进入正文。只有这些问题先稳定下来,后面的请求链、调度、执行和维护层才不会变成一组并排专题。
这一部分解决什么#
概览部分主要解决三类认知问题:
- 读者边界:这本书面向谁,不面向谁,第一版刻意不展开什么。
- 系统边界:SGLang 为什么不能只被看成 server,也不能只被看成 prompt DSL。
- 阅读边界:遇到源码、术语、对象和时间字段时,应该回到哪一层重新定位。
如果把它说得更直白一点,概览不是在“讲前言”,而是在替后面所有章节建立共同坐标系。没有这层坐标系,后文即使都各自成立,也更像一组内容厚实的专栏,而不像一本稳定递进的书。
这一部分怎样组织#
这一部分目前分成四组内容,而不是七篇平行短文:
系统定义与主心智模型:
1.2 为什么是 SGLang:Frontend Language 与 Runtime 心智模型
1.4 贯穿全书的核心不变量与阅读检查点阅读路线与源码总索引:
1.5 按角色阅读:平台、推理与框架工程师的三条路径
1.6 全书源码锚点地图与跳转索引术语与对象对齐:
1.7 全书术语表与易混概念对照
这种分法比“逐章点名”更重要,因为它告诉读者:概览部分不是七篇介绍文,而是四种不同层级的准备工作。它们分别负责范围、定义、导航和统一口径。
这一部分和后文怎样咬合#
概览后面最自然接上的,是 2. 请求生命周期。原因不是“生命周期更基础”,而是你只有先知道系统外形和读法,才知道为什么下一步应该先走一次请求主链,而不是直接扑进 Scheduler、RadixCache 或 ModelRunner。
同样,概览中的术语、源码锚点和角色阅读路线,并不是只在前几章有用。越往后读,它们越像总索引:当你在 4. 调度与内存 里再次看到 Req、在 5. 执行模型 里再次看到 ForwardBatch、在 8. 扩展与调试 里再次看到 ReqTimeStats 时,概览部分提供的其实是“回到哪一层重新校准”的能力。
读完这一部分之后应当真正得到什么#
如果概览部分成立,读者离开这一部分时至少应该已经拥有四样东西:
- 一条稳定的主阅读顺序
- 对 SGLang 外部形态的基本定义
- 一批会在全书反复出现的核心对象与术语
- 一组能把章节重新映射回源码树的总锚点
优秀技术书的开头,真正提供的往往不是“背景知识”,而是“后文怎样才不会读散”的方法。概览部分承担的就是这个作用。
叶王 © 2013-2026 版权所有。如果本文档对你有所帮助,可以请作者喝饮料。