通过DashScope API调用将多种模态转换为向量

时间：2024-09-05 15:52:15浏览次数：17

标签：模态 DashVector dashscope text DashScope API input 向量

本文介绍如何通过模型服务灵积DashScope进行 多模态向量生成 ，并入库至向量检索服务DashVector中进行向量检索。

模型服务灵积DashScope，通过灵活、易用的模型API服务，让各种模态模型的能力，都能方便的为AI开发者所用。通过灵积API，开发者不仅可以直接集成大模型的强大能力，也可以对模型进行训练微调，实现模型定制化。

前提条件

DashVector：
- 已创建Cluster
- 已获得API-KEY
- 已安装最新版SDK
- 已开通服务并获得API-KEY
- 已安装最新版SDK

ONE-PEACE多模态向量表征

简介

ONE-PEAC是一个 图文音三模态 通用表征模型，在语义分割、音文检索、音频分类和视觉定位几个任务都达到了新SOTA表现，在视频分类、图像分类、图文检索、以及多模态经典benchmark也都取得了比较领先的结果。

说明

关于灵积ONE-PEACE多模态向量表征更多信息请参考：ONE-PEACE多模态向量表征。

使用示例

说明

需要进行如下替换代码才能正常运行：

DashVector api-key替换示例中的
DashVector Cluster Endpoint替换示例中的
DashScope api-key替换示例中的

Python

import dashscope
from dashscope import MultiModalEmbedding
from dashvector import Client


dashscope.api_key = '{your-dashscope-api-key}'


# 调用DashScope ONE-PEACE模型，将各种模态素材embedding为向量
def generate_embeddings(text: str = None, image: str = None, audio: str = None):
    input = []
    if text:
        input.append({'text': text})
    if image:
        input.append({'image': image})
    if audio:
        input.append({'audio': audio})
    result = MultiModalEmbedding.call(
        model=MultiModalEmbedding.Models.multimodal_embedding_one_peace_v1,
        input=input,
        auto_truncation=True
    )
    if result.status_code != 200:
        raise Exception(f"ONE-PEACE failed to generate embedding of {input}, result: {result}")
    return result.output["embedding"]


# 创建DashVector Client
client = Client(
    api_key='{your-dashvector-api-key}',
    endpoint='{your-dashvector-cluster-endpoint}'
)

# 创建DashVector Collection
rsp = client.create('one-peace-embedding', 1536)
assert rsp
collection = client.get('one-peace-embedding')
assert collection

# 向量入库DashVector
collection.insert(
    [
        ('ID1', generate_embeddings(text='阿里云向量检索服务DashVector是性能、性价比具佳的向量数据库之一')),
        ('ID2', generate_embeddings(image='https://dashscope.oss-cn-beijing.aliyuncs.com/images/256_1.png')),
        ('ID3', generate_embeddings(audio='https://dashscope.oss-cn-beijing.aliyuncs.com/audios/cow.flac')),
        ('ID4', generate_embeddings(
            text='阿里云向量检索服务DashVector是性能、性价比具佳的向量数据库之一',
            image='https://dashscope.oss-cn-beijing.aliyuncs.com/images/256_1.png',
            audio='https://dashscope.oss-cn-beijing.aliyuncs.com/audios/cow.flac'
        ))
    ]
)

# 向量检索
docs = collection.query(
    generate_embeddings(text='The best vector database')
)
print(docs)

相关最佳实践

DashVector + DashScope升级多模态检索

标签：模态,DashVector,dashscope,text,DashScope,API,input,向量
From： https://www.cnblogs.com/DashVector/p/18398620

浅析多模态大模型技术路线梳理
前段时间ChatGPT进行了一轮重大更新：多模态上线，能说话，会看图！微软发了一篇长达166页的GPT-4V测评论文，一时间又带起了一阵多模态的热议，随后像是LLaVA-1.5、CogVLM、MiniGPT-5等研究工作紧随其后，到处刷屏。大模型的多模态能力到底是怎么来的？今天来分享一下多模态相关的......
淘宝API接口：全面解析与应用实践
淘宝作为国内领先的电商平台，为满足其合作伙伴和开发者的需求，提供了丰富的API接口。这些接口不仅简化了开发者与淘宝平台的交互过程，还为开发者提供了强大的技术支持。淘宝API接口概述淘宝API接口是一组允许开发者与淘宝平台进行数据交互的接口，包括商品信息、订单信息、物流信......
API数据接口在电商运营中的作用有哪些？
API数据接口在电商运营中扮演着至关重要的角色，其作用广泛且深远。以下是API数据接口在电商运营中的几个主要作用：数据采集与分析：API接口能够收集用户的购物记录、搜索记录、商品收藏记录以及其他用户行为数据。这些数据对于电商企业来说是宝贵的资源，可以帮助企业更好地了解用户需求......
用SpringBoot API实现识别pdf文件是否含有表格
要使用SpringBootAPI实现一个识别PDF文件是否含有表格的功能，你可以结合PDF解析库（如ApachePDFBox）来解析PDF文件内容，并通过分析文本或线条来判断PDF是否包含表格。然后使用SpringBoot提供的RESTAPI来实现上传和检测功能。目录实现步骤1.配置pom.xml2.......
WebApi使HttpPut/HttpDelete有效
405-不允许用于访问此页的HTTP谓词。您要查找的页面无法显示，因为尝试访问时使用了无效方法(HTTP谓词)。解决办法：在将应用程序从经典模式迁移到集成模式时，可以保留经典模式下的自定义模块和处理程序注册，也可以将这些注册移除。如果不移除经典模式下使用的httpModules......
多模态大模型的最优预训练范式
ChatDev——大语言模型驱动的多智能体协作与演化视频号目前主流的多模态大模型的训练基本都是分为预训练和微调两阶段来进行的。预训练阶段是为了让大语言模型（LLM）具有理解视觉信息的能力，也可以认为是将视觉特征空间对齐到文本空间。微调阶段就是使用特定领域的数据，通过......
话费充值API接口的关键步骤与考虑因素
话费充值API接口通常是由电信运营商或第三方支付平台提供的一种服务，允许开发者将话费充值功能集成到自己的应用程序或网站中。通过这种接口，用户可以方便地为他们的手机账户充值。以下是实现话费充值API接口可能涉及的一些关键步骤和考虑因素：关键步骤：选择服务提供商：选择一个......
深入解析如何利用1688 API接口获取详尽商品信息
在电子商务的蓬勃发展中，数据的重要性日益凸显。对于商家而言，能够实时获取并分析商品数据，是提升市场竞争力的关键。1688作为阿里巴巴集团旗下的知名B2B平台，提供了丰富的API接口，使得商家能够轻松获取商品详情。本文将为您全面解析如何通过1688商品详情API接口获取所需数据。一、......
深入解析如何利用1688 API接口获取详尽商品信息
在电子商务的蓬勃发展中，数据的重要性日益凸显。对于商家而言，能够实时获取并分析商品数据，是提升市场竞争力的关键。1688作为阿里巴巴集团旗下的知名B2B平台，提供了丰富的API接口，使得商家能够轻松获取商品详情。本文将为您全面解析如何通过1688商品详情API接口获取所需数据。一、168......
人脸静态活体检测（高精度版） API 对接说明
人脸静态活体检测（高精度版）API对接说明本文将介绍人脸静态活体检测（高精度版）API对接说明，它可用于对用户上传的静态图片进行防翻拍活体检测，以判断是否是翻拍图片。接下来介绍下人脸静态活体检测（高精度版）API的对接说明。申请流程要使用API，需要先到人脸静态活体检测（......

通过DashScope API调用将多种模态转换为向量

前提条件

ONE-PEACE多模态向量表征

简介

使用示例

相关最佳实践

相关文章

赞助商

阅读排行