网站首页
编程语言
数据库
系统相关
其他分享
编程问答
LongLLaVA
2024-11-08
首个Mamba+Transformer多模态大模型
扩展多模态大语言模型(MLLMs)的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化,包括模型架构、数据构建和训练策略,尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。该团队将模型架构调整为Mamba和Transformer