首页 > 其他分享 >【论文笔记】VCoder: Versatile Vision Encoders for Multimodal Large Language Models

【论文笔记】VCoder: Versatile Vision Encoders for Multimodal Large Language Models

时间:2024-11-10 19:47:10浏览次数:3  
标签:Encoders mathbf Language text 物体 MLLM Large COST 感知

标签:Encoders,mathbf,Language,text,物体,MLLM,Large,COST,感知
From: https://blog.csdn.net/qq_63585949/article/details/143628497

相关文章