全书源码锚点地图与跳转索引#

这章解决什么问题#

随着章节越来越多，这本书已经不再只是“顺着读就行”的薄册子了。真正接近优秀技术书的作品，通常都会在开篇给出一种更高阶的帮助：不是只告诉你“先读哪章”，还告诉你“整本书反复回扣的核心源码锚点有哪些，它们分别在解释什么”。

这一章的目标，就是把整本书的核心源码入口压成一张索引地图。这样你无论是：

线性读到一半迷路
带着问题反查某个实现
还是准备把书里的理解重新落回源码

都能更快找到正确入口。

为什么这层值得单独成章#

因为一本真正像“书”的技术作品，不能只靠左侧导航来承担全部索引功能。左侧导航擅长告诉你“章在这里”，但不擅长告诉你：

全书哪些文件被反复当成主锚点
这些锚点各自属于哪条主线
如果你现在在追某个问题，最短路径该回到哪一组源码

这正是很多优秀计算机技术书会在前言或第一部分做的工作：给出一张“全书地图”，而不是只给目录。

一张图：整本书反复回扣的源码主脊梁#

这张图解决的理解障碍是：随着章节增厚，读者容易把很多文件当成彼此平行的局部入口，而忽略它们其实组成了几条稳定主脊梁。

flowchart TD
    Entry["入口脊梁\nlaunch_server.py -> http_server.py"] --> Lifecycle["请求脊梁\ntokenizer_manager.py -> scheduler.py -> detokenizer_manager.py"]
    Lifecycle --> Cache["缓存脊梁\nschedule_batch.py -> memory_pool.py -> radix_cache.py"]
    Lifecycle --> Exec["执行脊梁\nforward_batch_info.py -> model_runner.py -> sampling_params.py"]
    Exec --> Structured["结构化脊梁\nprotocol.py -> serving_chat.py -> function_call/*"]
    Lifecycle --> Evidence["证据脊梁\nreq_time_stats.py -> request_logger.py -> exporter/trace"]
    Cache --> Evidence
    Structured --> Evidence

图比纯文字多解释的一点是：整本书虽然有很多章节，但回扣最多的其实只是几条稳定源码脊梁。

第一组锚点：入口脊梁#

如果你想确认：

服务从哪进入
为什么会落到默认 HTTP、gRPC、Ray 或 encoder-only 路径
app.state 和路由森林怎样被装起来

最重要的锚点是：

python/sglang/launch_server.py
python/sglang/srt/entrypoints/http_server.py

这组锚点主要对应：

概览
请求生命周期
运行时架构
代码导读里的入口部分

你可以把它们理解成“这本书最外层的地基文件”。

第二组锚点：请求脊梁#

如果你想确认：

请求怎样被对象化
rid_to_state 怎样托住生命周期
输出怎样从 detokenizer 回到 tokenizer manager

最重要的锚点是：

python/sglang/srt/managers/tokenizer_manager.py
python/sglang/srt/managers/scheduler.py
python/sglang/srt/managers/detokenizer_manager.py

这组锚点主要对应：

请求生命周期
运行时架构
输出尾部
多 worker / health check 等控制分叉

对整本书来说，它们几乎是最核心的一组运行时文件。

第三组锚点：调度与缓存脊梁#

如果你想确认：

batch 为什么会长成这样
请求的逻辑状态怎样映射到物理 KV
prefix reuse、lock ref、host hit 和 load-back 怎样成立

最重要的锚点是：

python/sglang/srt/managers/schedule_batch.py
python/sglang/srt/mem_cache/memory_pool.py
python/sglang/srt/mem_cache/base_prefix_cache.py
python/sglang/srt/mem_cache/radix_cache.py

这组锚点主要对应：

调度与内存
某些 session / streaming cache 支线
代码导读里的 cache tree 章节

它们构成了整本书最难、但也最值得读透的一条资源状态主线。

第四组锚点：执行脊梁#

如果你想确认：

batch 进入 forward 后怎样变成执行对象
sampling 参数怎样真正进入 sampler
hidden states / routed experts 为什么能作为旁路语义返回

最重要的锚点是：

python/sglang/srt/model_executor/forward_batch_info.py
python/sglang/srt/model_executor/model_runner.py
python/sglang/srt/sampling/sampling_params.py
python/sglang/srt/managers/scheduler_output_processor_mixin.py

这组锚点主要对应：

执行模型
输出尾部
一部分结构化生成与返回语义

你可以把它们理解成“模型真正开始干活之后的主脊梁”。

第五组锚点：结构化生成与接口脊梁#

如果你想确认：

OpenAI-compatible 请求怎样落成内部约束
tool choice / response format / parser 怎样编译到运行时
Responses / built-in tools / MCP 工具为什么会长成那样

最重要的锚点是：

python/sglang/srt/entrypoints/openai/protocol.py
python/sglang/srt/entrypoints/openai/serving_chat.py
python/sglang/srt/function_call/function_call_parser.py
python/sglang/srt/entrypoints/openai/tool_server.py

这组锚点主要对应：

结构化生成与 API
一部分请求生命周期与代码导读

它们构成了整本书里“表面语义如何落成 runtime 语义”的主桥。

第六组锚点：证据与维护脊梁#

如果你想确认：

为什么有那么多时间字段
request trace / exporter / logger 各自站在哪一层
线上该先看什么、再动什么

最重要的锚点是：

python/sglang/srt/observability/req_time_stats.py
python/sglang/srt/utils/request_logger.py
python/sglang/srt/observability/request_metrics_exporter.py
python/sglang/srt/entrypoints/http_server.py 中的控制面

这组锚点主要对应：

扩展与调试
一部分代码导读和运行时架构

它们让整本书后半程的 observability 与控制面真正有了回到源码的抓手。

一个更可操作的“反查索引”#

如果你读到一半，需要带着问题反查源码，可以直接用下面这张索引表：

问题：服务从哪里进入？
回到：launch_server.py / http_server.py

问题：请求为什么卡在中途？
回到：tokenizer_manager.py / scheduler.py / detokenizer_manager.py

问题：prefix 命中了但还是不够快？
回到：schedule_batch.py / radix_cache.py / memory_pool.py

问题：token 是怎样真正被选出来并收口的？
回到：forward_batch_info.py / model_runner.py / sampling_params.py / scheduler_output_processor_mixin.py

问题：response_format / tool choice / parser 为什么会这样工作？
回到：protocol.py / serving_chat.py / function_call_parser.py / tool_server.py

问题：这些指标名字到底是什么意思？
回到：req_time_stats.py / request_logger.py / request_metrics_exporter.py

这类索引看起来很朴素，但它正是“博客合集”和“技术书”之间很典型的差异：前者给你信息，后者给你回路。

这章和前面概览几章的关系#

这一章不是重复：

scope-and-reading-map
how-to-read-the-book-and-source
reading-tracks-by-role

它是在它们之上再加一层：

阅读地图告诉你顺序
读法章节告诉你方法
角色路线告诉你角色化切片
而这一章告诉你整本书最重要的源码锚点到底是谁

因此它更像概览部分的“总索引层”。

小结#

这一章真正要补齐的，是一本更像“大书”的开篇索引能力：

不只知道章节怎么排
还知道整本书真正反复回扣的是哪几条源码脊梁

到这里，概览部分就不只是在教你“怎么开始读”，也开始教你“读到中途时，怎样不迷路地回到正确源码入口”。