• 2024-09-05三星的MobileQuant:将高性能语言模型带到你的口袋中
    大型语言模型(LLMs)在语言处理方面取得了显著成果,并广泛应用于各种场景。然而,在移动设备(如手机)上实现LLMs存在许多挑战,特别是在内存、能耗和计算需求方面的限制。这些制约因素阻碍了LLMs在此类设备上的广泛应用。一种有前景的解决方案是减少权重和激活的位宽,使8位激活成为在设备