首页 > 编程语言 >如何通过Python SDK更新Collection中已存在的Doc

如何通过Python SDK更新Collection中已存在的Doc

时间:2024-11-06 13:18:22浏览次数:3  
标签:示例 Python Doc update Collection vector ret id

本文介绍如何通过Python SDK更新Collection中已存在的Doc。

说明

  1. 若更新Doc时指定id不存在,则本次更新Doc操作无效

  2. 如只更新部分属性fields,其他未更新属性fields默认被置为None

  3. Python SDK 1.0.11版本后,更新Doc时vector变为非必填项

前提条件

接口定义

Python示例:

Collection.update(
    docs: Union[Doc, List[Doc], Tuple, List[Tuple]],
    partition: Optional[str] = None,
    async_req: False
) -> DashVectorResponse

使用示例

说明

  1. 需要使用您的api-key替换示例中的YOUR_API_KEY、您的Cluster Endpoint替换示例中的YOUR_CLUSTER_ENDPOINT,代码才能正常运行。

  2. 本示例需要参考新建Collection-使用示例提前创建好名称为quickstart的Collection。

Python示例:

import dashvector
from dashvector import Doc
import numpy as np

client = dashvector.Client(
    api_key='YOUR_API_KEY',
    endpoint='YOUR_CLUSTER_ENDPOINT'
)
collection = client.get(name='quickstart')

更新Doc

Python示例:

# 通过Doc对象update
ret = collection.update(
    Doc(
        id='1',
        vector=[0.1, 0.2, 0.3, 0.4]
    )
)
# 判断update是否成功
assert ret

# 简化形式:通过Tuple update
ret = collection.update(
    ('2', [0.1, 0.1, 0.1, 0.1])               # (id, vector)
)

更新带有Fields的Doc

Python示例:

# update单条数据,并设置Fields Value
ret = collection.update(
    Doc(
        id='3',
        vector=np.random.rand(4),
        fields={
            # 设置创建Collection时预定义的Fields Value
            'name': 'zhangsan', 'weight':70.0, 'age':30, 
            # 设置Schema-Free的Field & Value
            'anykey1': 'str-value', 'anykey2': 1,
            'anykey3': True, 'anykey4': 3.1415926
        }
    )
)

# update单条数据,并设置Fields Value
ret = collection.update(
    ('4', np.random.rand(4), {'foo': 'bar'})  # (id, vector, fields)
)

批量更新Doc

Python示例:

# 通过Doc对象,批量update 10条数据
ret = collection.update(
    [
        Doc(id=str(i+5), vector=np.random.rand(4)) for i in range(10)
    ]
)

# 简化形式:通过Tuple,批量update 3条数据
ret = collection.update(
    [
        ('15', [0.2,0.7,0.8,1.3], {'age': 20}),
        ('16', [0.3,0.6,0.9,1.2], {'age': 30}),
        ('17', [0.4,0.5,1.0,1.1], {'age': 40})
    ]                                         # List[(id, vector, fields)]
)

# 判断批量update是否成功
assert ret

异步更新Doc

Python示例:

# 异步批量update 10条数据
ret_funture = collection.update(
    [
        Doc(id=str(i+18), vector=np.random.rand(4), fields={'name': 'foo' + str(i)}) for i in range(10)
    ],
    async_req=True
)
# 等待并获取异步update结果
ret = ret_funture.get()

更新带有Sparse Vector的Doc

Python示例:

ret = collection.update(
    Doc(
        id='28',
        vector=[0.1, 0.2, 0.3, 0.4],
        sparse_vector={1:0.4, 10000:0.6, 222222:0.8}
    )
)

入参描述

参数

类型

默认值

说明

docs

Union[Doc, List[Doc], Tuple, List[Tuple]]

-

更新的数据或数据list

partition(可选)

Optional[str]

None

Partition名称

async_req(可选)

bool

False

是否异步

说明

  1. docs参数,vector为非必填项。当类型为Tuple时,可以为(id, vector)(id, fields)顺序,等同于Doc对象。

  2. Doc对象的fields参数,可自由设置“任意”的KeyValue数据,Key必须为str类型,Value必须为str or int or bool or float

    1. 当Key在创建Collection时预先定义过,则Value的类型必须为预定义时的类型

    2. 当Key未在创建Collection时预先定义过,则Value的类型可为str or int or bool or float

  3. 是否预先定义Fields,可参考Schema Free

出参描述

说明

返回结果为DashVectorResponse对象,DashVectorResponse对象中可获取本次操作结果信息,如下表所示。

字段

类型

描述

示例

code

int

返回值,参考返回状态码说明

0

message

str

返回消息

success

request_id

str

请求唯一id

19215409-ea66-4db9-8764-26ce2eb5bb99

output

List[DocOpResult]

返回更新Doc的结果

usage

RequestUsage

对Serverless实例(按量付费)集合的Doc更新请求,成功后返回实际消耗的写请求单元数

标签:示例,Python,Doc,update,Collection,vector,ret,id
From: https://blog.csdn.net/qq_41362382/article/details/143566758

相关文章

  • 将doc文件转换为docx文件
    将.doc文件转换为.docx文件通常不会导致兼容性变差,反而可能提升兼容性。以下是一些关键点:文件格式更新:.docx是Microsoft在2007年引入的新版文件格式,基于开放XML标准,具有更好的跨平台兼容性和开放性。与旧的.doc格式相比,.docx文件通常更小,支持更多的格式和功......
  • 基于大数据 Python 校园食堂订餐数据分析系统(源码+LW+部署讲解+数据库+ppt)
    !!!!!!!!!选题不知道怎么选不清楚自己适合做哪块内容都可以免费来问我避免后期給自己答辩找麻烦增加难度(部分学校只有一次答辩机会没弄好就延迟毕业了)会持续一直更新下去有问必答一键收藏关注不迷路源码获取:https://pan.baidu.com/s/1aRpOv3f2sdtVYOogQjb8jg?pwd=jf1d提取码:......
  • 100种算法【Python版】第51篇——希尔排序
    本文目录1算法步骤2算法示例3python代码3.1代码说明3.2复杂度分析4算法优化4.1Shell原始增量序列4.2Hibbard增量序列4.3Knuth增量序列4.4Sedgewick增量序列4.5Tokuda增量序列4.6Pratt增量序列5不同的增量序列的效率对比希尔......
  • Python socket传输图像文件
    客户端发送图像文件importsocketdata=numpy.frombuffer(stringData,numpy.uint8)#将获取到的字符流数据转换成1维数组#decimg=cv2.imdecode(data,cv2.COLOR_BGR2GRAY)#将数组解码成图像#cv2.imwrite("./test.jpg",decimg)#imencode()将图片格式转换(编码)成流数据,......
  • Docker:开源容器化平台,解决开发运维问题的神器
    云计算de小白Docker是一个开源的容器化平台,可以将应用程序及其依赖的环境打包成轻量级、可移植的容器。Docker为什么这么受欢迎呢?原因很简单:Docker可以解决不同环境一致运行的问题,而且占用资源少,速度快。所以好的东西应该被更多人喜欢,因为Docker确实解决了我们日常的开发和......
  • 【docker】6. 镜像仓库/镜像概念
    DockerRegistry(镜像仓库)什么是DockerRegistry镜像仓库(DockerRegistry)负责存储、管理和分发镜像,并且提供了登录认证能力,建立了仓库的索引。镜像仓库管理多个Repository,Repository通过命名来区分。每个Repository包含一个或多个镜像,镜像通过镜像名称和标签(T......
  • Python(logging.getLogger().info())
    目录1.getLogger()函数2.info()方法3.配置日志级别4.示例代码5.其他日志级别方法6.使用场景logging.getLogger().info()是Python的logging模块中用于记录信息级别(infolevel)日志的函数。logging是一个Python内置模块,提供了日志记录功能。它支持不同的日志级别,不......