• 2024-12-08ORCA避障源码笔记
    参考资料https://gamma.cs.unc.edu/ORCA/publications/ORCA.pdfhttps://gamma.cs.unc.edu/RVO2/数学知识1.向量的点乘dotProduct,计算方法:1.  2.,作用:点积如果为负,则a,b形成的角为钝角;如果为零,那么a,b垂直;如果为正,那么a,b形成的角为锐角2.向量a,向量b,det(a,b)表示行列式的
  • 2024-12-07ORCA:基于持续批处理的LLM推理性能优化技术详解
    大语言模型(LLMs)推理过程中的批处理优化面临显著挑战,这主要源于其推理过程的迭代特性。核心问题在于批处理中的各个请求完成时间存在差异,这导致资源释放和新请求整合的复杂性显著提高,特别是在处理不同完成阶段的请求时。当批处理中序列的生成长度差异较大时,GPU资源利用率往往不够