性能并不是神秘学,它往往只是你是否尊重缓存和分支预测。
缓存是第一真相
绝大多数延迟都不是算法复杂度,而是内存访问模式造成的等待。
并发要服从数据形状
盲目加线程只会放大锁竞争,先让数据局部性正确,再做并行化。
重新审视现代抽象层带来的性能损耗,并给出可操作的优化路径。
性能并不是神秘学,它往往只是你是否尊重缓存和分支预测。
绝大多数延迟都不是算法复杂度,而是内存访问模式造成的等待。
盲目加线程只会放大锁竞争,先让数据局部性正确,再做并行化。
用稀疏自编码器观察大模型内部概念,定位看不见的决策路径。
阅读全文 arrow_right_alt