• 2024-10-11使用AVX2指令集加速推荐系统MMR层余弦相似度计算
    原文:blog.fanscore.cn/a/62/1.背景前一段时间公司上线了一套Go实现的推荐系统,上线后发现MMR层虽然只有纯计算但耗时十分离谱,通过pprof定位问题所在之后进行了优化,虽然降低了非常多但是我们认为其中还有优化空间。可以看到日常平均耗时126ms,P95360ms。MMR层主要耗时集中在了