第五章调度、批处理与 KV Cache#

这一章会聚焦 request queue、batch shaping、prefix reuse、内存分配和 KV 生命周期。重点不是单个函数的小技巧，而是资源状态怎样在调度器里稳定演化。

这一章当前的目录是：

第五章 调度、批处理与 KV Cache#