5.2.3 多模态图像搜索引擎
本项目是一个基于 CLIP (Contrastive Language-Image Pre-training) 大模型的图像搜索引擎,针对孟加拉语文本描述进行图像检索。它包括了训练 CLIP 模型、准备数据集、构建图像搜索 Web 应用程序等功能,用户可以通过输入文本描述来搜索与描述相匹配的图像,并查看相似度分数。
实例5-9:基于 CLIP模型的文搜图系统(源码路径:codes/5/bangla-CLIP)
1. 技术细节
本项目是一个基于 CLIP (Contrastive Language-Image Pre-training) 大模型的图像搜索引擎,针对孟加拉语文本描述进行图像检索。它包括了训练 CLIP 模型、准备数据集、构建图像搜索 Web 应用程序等功能,用户可以通过输入文本描述来搜索与描述相匹配的图像,并查看相似度分数。
实例5-9:基于 CLIP模型的文搜图系统(源码路径:codes/5/bangla-CLIP)
1. 技术细节