第三章 请求路径#

这一部分先走通最小主链:请求从什么入口进入、怎样被协议层压缩成内部对象、怎样跨过 tokenizer 和 scheduler,再怎样成为真正的 runtime 工作单元。它先求闭环,再谈局部机制。

四节之间的关系可以先压成一条顺序:

  • 3.1 讲请求怎样进入 runtime
  • 3.2 讲结果怎样回到协议表面
  • 3.3 讲哪些边界条件会提前改写或截断主链
  • 3.4 讲 batch、多 worker 和多模态怎样把主链放大

如果把这一章当作“请求路径总览”,那么 3.13.2 是最小闭环,3.33.4 则是在这个闭环之外补边界和补规模。

这一章当前的目录是: