第三章 请求路径#
这一部分先走通最小主链:请求从什么入口进入、怎样被协议层压缩成内部对象、怎样跨过 tokenizer 和 scheduler,再怎样成为真正的 runtime 工作单元。它先求闭环,再谈局部机制。
四节之间的关系可以先压成一条顺序:
3.1讲请求怎样进入 runtime3.2讲结果怎样回到协议表面3.3讲哪些边界条件会提前改写或截断主链3.4讲 batch、多 worker 和多模态怎样把主链放大
如果把这一章当作“请求路径总览”,那么 3.1 和 3.2 是最小闭环,3.3 和 3.4 则是在这个闭环之外补边界和补规模。
这一章当前的目录是:
叶王 © 2013-2026 版权所有。如果本文档对你有所帮助,可以请作者喝饮料。