首页 > 其他分享 >图像向量化_向量存储以及向量搜索和匹配

图像向量化_向量存储以及向量搜索和匹配

时间:2023-04-04 18:24:26浏览次数:42  
标签:存储 transformers opensearch sentence pytorch https 量化 model 向量

图像数据向量化

PyTorch
  pip install -i

transformers
   transformers包又名pytorch-transformers或者pytorch-pretrained-bert。
   它提供了一些列的STOA模型的实现,包括(Bert、XLNet、RoBERTa等)
    pytorch_model.bin


pip install sentence-transformers
    该框架基于 PyTorch 和 Transformers
	一种是直接使用,
	另一种是在自己的数据集上fine-tune
	零开始创建一个SentenceTransformers模型

文件说明

01.下载模型到本地
 第一个是配置文件;config.json。
 第二个是词典文件,vocab.json。
 第三个是预训练模型文件,如果你使用pytorch则保存pytorch_model.bin文件,如果你使用tensorflow 2,则保存tf_model.h5
02.加载代码修改
  from sentence_transformers import SentenceTransformer
  model = SentenceTransformer('/data/pretrained_model/all-MiniLM-L6-v2')

CLIP

CLIP(Contrastive Language-Image Pre-Training,以下简称 CLIP) 模型 
零样本图像分类任务(Zero-shot Image Classification, ZS-IMGC),是指分类未在训练集中出现的类别的图像

参考

https://github.com/qhduan/notebook_gist/blob/master/opensearch.ipynb 
https://huggingface.co/sentence-transformers
https://github.com/UKPLab/sentence-transformers
https://opensearch.org/docs/latest/
https://opensearch.org/docs/latest/install-and-configure/install-opensearch/docker/
https://opensearch.org/docs/latest/search-plugins/knn/approximate-knn/
https://weaviate.io/blog/how-to-choose-a-sentence-transformer-from-hugging-face
 训练一个SentenceTransformer模型 https://zhuanlan.zhihu.com/p/563844192
 sentence_transformers模型无法直接下载的解决方案 https://blog.csdn.net/PolarisRisingWar/article/details/126991633
huggingface transformers预训练模型如何下载至本地,并使用?https://zhuanlan.zhihu.com/p/147144376

标签:存储,transformers,opensearch,sentence,pytorch,https,量化,model,向量
From: https://www.cnblogs.com/ytwang/p/17287298.html

相关文章

  • 从建模思路看 MySQL 和 TDengine 哪个更适合处理量化交易场景下的海量时序数据
    在“量化投资分析”场景中,系统需要从数据接口、网络上等各个地方获取证券的信息,其中往往以“实时的价格变动信息”为主要数据,然后再对这些数据进行实时的分析与存储,供盘中和盘后使用。某企业遇到的问题如下:“我们要对500个证券品种进行监控,在开盘时,每5秒会更新一次价格数据。......
  • DataLeap 数据资产实战:如何实现存储优化?
    更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群背景DataLeap作为一站式数据中台套件,汇集了字节内部多年积累的数据集成、开发、运维、治理、资产、安全等全套数据中台建设的经验,助力企业客户提升数据研发治理效率、降低管理成本。Da......
  • 存储引擎和数据类型
    目录配置文件存储引擎(面试用)mysql的基本数据类型1.整形2.浮点型3.字符串4.日期类型5.枚举与集合整型中括号内数字的作用(面试用)创建表的完整语法配置文件#1.复制my-default.ini文件#2.命名为my.ini#3.修改完配置文件只会,一定别忘重启服务端存储引擎(面试用)#理论部分......
  • 【服务器数据恢复】raid5多块硬盘离线导致存储的卷无法挂载,EXT3文件系统元数据被破坏
    服务器数据恢复环境&故障:某企业一台存储设备,一组由16块硬盘组建的raid5磁盘阵列。管理员在巡检过程中发现该存储的卷无法挂载,经过检查发现存储设备的raid5磁盘阵列中有2块硬盘离线。服务器数据恢复过程:1、检查该存储当前状态,通过storagemanager将存储的日志状态备份。2、将存......
  • vivo 大规模特征存储实践
    vivo互联网技术微信公众号 作者:黄伟锋本文旨在介绍vivo内部的特征存储实践、演进以及未来展望,抛砖引玉,吸引更多优秀的想法。一、需求分析AI技术在vivo内部应用越来越广泛,其中特征数据扮演着至关重要的角色,用于离线训练、在线预估等场景,我们需要设计一个系统解决各种特征数......
  • 【服务器】Cloudreve绑定七牛云免费对象存储
    一、七牛云注册1、注册账号:https://portal.qiniu.com/signup?code=1hate2niuffbm2、完成实名认证3、创建对象存储4、绑定域名二、Cloudreve创建策略1、添加策略2、添加用户和用户组三、完成上传1、cloudreve界面2、管理页面3、七牛页面四、关于错误......
  • 存储IndexedDB之Dexie
    [前端大容量存储IndexedDB之Dexie.js-掘金](https://juejin.cn/post/7025592963002531871) IndexedDB存储Dexie.js 对IndexedDB的封装,语法简单,可以快速方便的编写代码 webSQL总结webSQL标准不再更新,关系型数据库,底层sqlitechrome中容量5M,支持同域名不同页面共享......
  • 【SciPy】Sparse稀疏矩阵主要存储格式总结(转载)
    原文:【SciPy】Sparse稀疏矩阵主要存储格式总结在数据科学和深度学习等领域常会采用矩阵格式来存储数据,但当矩阵较为庞大且非零元素较少时,运算效率和存储有效率并不高。所以,通常我们采用Sparse稀疏矩阵的方式来存储矩阵,提高存储和运算效率。下面将对SciPy中七种常见的存储方式(COO/......
  • 【功能与技巧】promethues通过记录规则持久化查询,存储rules表达式查询结果为采集指标
    一、查询持续性到目前为止,我们只是在表达式浏览器中运行查询。虽然查看该查询的输出很方便,但结果仍然是临时存储在Prometheus服务器上,我们可以通过以下三种方式使查询持久化: *记录规则:根据查询创建新指标*报警规则:从查询生成警报*可视化:使用Grafana等仪表板可视化查询......
  • mybatis调用存储过程,并返回out参数
        ......