7.1 从仓库入口回到请求主线

Mon, 01 Jan 0001 00:00:00 +0000

从仓库入口回到请求主线#

这章解决什么问题#

如果你第一次进入 SGLang 仓库，最容易犯的错误是直接钻进 python/sglang/srt。这样当然能看到大量核心实现，但你会很快失去“哪些入口是给用户的，哪些入口是给 runtime 的”这层方位感。更稳的读法，是先看四个文件：README.md、python/sglang/__init__.py、python/sglang/lang/api.py 和 python/sglang/launch_server.py。

README.md 的价值不是介绍所有内部细节，而是告诉你项目怎样向外描述自己。当前 README 直接把 “Backend Tutorial” 和 “Frontend Tutorial” 分开列出，这能帮助你先建立“双表面”认知。python/sglang/__init__.py 则把 public surface 展开成 import 入口：一边是 function、gen、system、user、assistant 等语言层 API，另一边是 RuntimeEndpoint、ServerArgs 与 Engine 这类运行时入口。

接着读 python/sglang/lang/api.py，你会看到 Runtime(...) 与 Engine(...) 都只是懒导入包装，而 gen(...) 则把 regex、json_schema、sampling 参数等语言层能力显式暴露出来。最后再看 python/sglang/launch_server.py，你就能把“language API”“offline engine”“server entrypoint”三类入口区分开，而不是把它们混成一个抽象的“调用 SGLang”。

为什么按这条顺序读仓库#

这样安排顺序，不是为了显得系统化，而是为了减少误读。仓库顶层目录天然混合了“对外表面”“核心 runtime”“示例与测试”“性能与扩展”四类材料。如果你没有先用几个稳定入口把外层地图建立起来，后面看到 entrypoints、managers、mem_cache、benchmark、sgl-kernel 时，就很难判断它们在整体叙事里分别扮演什么角色。

因此，这一章的真正设计理由，是先建立阅读顺序，再建立目录认识。你不是在背一个文件系统，而是在学习一套“从公开入口走回主链路，再从主链路走向扩展材料”的路径。只有这样，代码导读章节才和前面的 request lifecycle、runtime architecture、scheduling/memory 构成同一本书，而不是一组平行笔记。

回到 `python/sglang/srt` 时，先找五个目录#

带着入口感再回到 python/sglang/srt，阅读顺序会清楚很多。第一站看 entrypoints/，因为这里定义了 HTTP、gRPC、engine 等真正进入 runtime 的门。第二站看 managers/，因为请求状态、队列、批次、流式输出和大量运行时编排都在这里。第三站看 model_executor/，这里更接近模型前向与设备执行。第四站看 mem_cache/，这里解释请求状态如何映射到可复用的 KV 存储。第五站看 observability/，这里提供 metrics、trace 与 request stage 观测能力。

7. 代码导读 on Machine Learning 学习笔记

7.1 从仓库入口回到请求主线

从仓库入口回到请求主线#

这章解决什么问题#

为什么按这条顺序读仓库#

回到 python/sglang/srt 时，先找五个目录#

回到 `python/sglang/srt` 时，先找五个目录#