首页 > 编程语言 >CreatePartition API执行流程_milvus源码解析

CreatePartition API执行流程_milvus源码解析

时间:2023-11-20 19:11:51浏览次数:34  
标签:core err CreatePartition partition ctx collMeta API 源码

CreatePartition API执行流程源码解析

milvus版本:v2.3.2

整体架构:

CreatePartition 的数据流向:

1.客户端sdk发出CreatePartition API请求。

from pymilvus import (
    connections,
    Collection, Partition,
)

print("start connecting to Milvus")
connections.connect(db_name="default", host="192.168.230.71", port="19530")

hello_milvus = Collection("hello_milvus")

print("create a partition")
partition = Partition(hello_milvus, name="part01", description="this is a partition")

客户端SDK向proxy发送一个CreatePartition API请求,在hello_milvus这个collection下创建一个名为part01的partition。

2.客户端接受API请求,将request封装为createPartitionTask,并压入ddQueue队列。

代码路径:internal\proxy\impl.go

// CreatePartition create a partition in specific collection.
func (node *Proxy) CreatePartition(ctx context.Context, request *milvuspb.CreatePartitionRequest) (*commonpb.Status, error) {
	......
    // request封装为task
	cpt := &createPartitionTask{
		ctx:                    ctx,
		Condition:              NewTaskCondition(ctx),
		CreatePartitionRequest: request,
		rootCoord:              node.rootCoord,
		result:                 nil,
	}

	......
    // 将task压入ddQueue队列
	if err := node.sched.ddQueue.Enqueue(cpt); err != nil {
		......
	}

	......
    // 等待cct执行完
	if err := cpt.WaitToFinish(); err != nil {
		......
	}

	......
}

3.执行createPartitionTask的3个方法PreExecute、Execute、PostExecute。

PreExecute()一般为参数校验等工作。

Execute()一般为真正执行逻辑。

代码路径:internal\proxy\task.go

func (t *createPartitionTask) Execute(ctx context.Context) (err error) {
	t.result, err = t.rootCoord.CreatePartition(ctx, t.CreatePartitionRequest)
	if err != nil {
		return err
	}
	if t.result.ErrorCode != commonpb.ErrorCode_Success {
		return errors.New(t.result.Reason)
	}
	return err
}

从代码可以看出调用了rootCoord的CreatePartition接口。

4.进入rootCoord的CreatePartition接口。

代码路径:internal\rootcoord\root_coord.go

继续将请求封装为rootcoord里的createDatabaseTask

// CreatePartition create partition
func (c *Core) CreatePartition(ctx context.Context, in *milvuspb.CreatePartitionRequest) (*commonpb.Status, error) {
	......
    // 封装为createPartitionTask
	t := &createPartitionTask{
		baseTask: newBaseTask(ctx, c),
		Req:      in,
	}
    // 加入调度
	if err := c.scheduler.AddTask(t); err != nil {
		......
	}
    // 等待task完成
	if err := t.WaitToFinish(); err != nil {
		......
	}

	......
}

5.执行createPartitionTask的Prepare、Execute、NotifyDone方法。

Execute()为核心方法。

代码路径:internal\rootcoord\create_partition_task.go

func (t *createPartitionTask) Execute(ctx context.Context) error {
	for _, partition := range t.collMeta.Partitions {
		if partition.PartitionName == t.Req.GetPartitionName() {
			log.Warn("add duplicate partition", zap.String("collection", t.Req.GetCollectionName()), zap.String("partition", t.Req.GetPartitionName()), zap.Uint64("ts", t.GetTs()))
			return nil
		}
	}

	cfgMaxPartitionNum := Params.RootCoordCfg.MaxPartitionNum.GetAsInt()
	if len(t.collMeta.Partitions) >= cfgMaxPartitionNum {
		return fmt.Errorf("partition number (%d) exceeds max configuration (%d), collection: %s",
			len(t.collMeta.Partitions), cfgMaxPartitionNum, t.collMeta.Name)
	}
	// 分配partID
	partID, err := t.core.idAllocator.AllocOne()
	if err != nil {
		return err
	}
	// 构建partition结构体
	// 包含partID,partName,collectID等
	partition := &model.Partition{
		PartitionID:               partID,
		PartitionName:             t.Req.GetPartitionName(),
		PartitionCreatedTimestamp: t.GetTs(),
		Extra:                     nil,
		CollectionID:              t.collMeta.CollectionID,
		State:                     pb.PartitionState_PartitionCreating,
	}

	undoTask := newBaseUndoTask(t.core.stepExecutor)
	// 分为多个step执行,每一个undoTask由todoStep和undoStep构成
	// 执行todoStep,报错则执行undoStep
	undoTask.AddStep(&expireCacheStep{
		baseStep:        baseStep{core: t.core},
		dbName:          t.Req.GetDbName(),
		collectionNames: []string{t.collMeta.Name},
		collectionID:    t.collMeta.CollectionID,
		ts:              t.GetTs(),
	}, &nullStep{})
    // 添加partition元数据
	undoTask.AddStep(&addPartitionMetaStep{
		baseStep:  baseStep{core: t.core},
		partition: partition,
	}, &removePartitionMetaStep{
		baseStep:     baseStep{core: t.core},
		dbID:         t.collMeta.DBID,
		collectionID: partition.CollectionID,
		partitionID:  partition.PartitionID,
		ts:           t.GetTs(),
	})

	undoTask.AddStep(&nullStep{}, &releasePartitionsStep{
		baseStep:     baseStep{core: t.core},
		collectionID: t.collMeta.CollectionID,
		partitionIDs: []int64{partID},
	})

	undoTask.AddStep(&syncNewCreatedPartitionStep{
		baseStep:     baseStep{core: t.core},
		collectionID: t.collMeta.CollectionID,
		partitionID:  partID,
	}, &nullStep{})

	undoTask.AddStep(&changePartitionStateStep{
		baseStep:     baseStep{core: t.core},
		collectionID: t.collMeta.CollectionID,
		partitionID:  partID,
		state:        pb.PartitionState_PartitionCreated,
		ts:           t.GetTs(),
	}, &nullStep{})

	return undoTask.Execute(ctx)
}

创建partition涉及多个步骤,可以看出这里依次分为expireCacheStep、addPartitionMetaStep、syncNewCreatedPartitionStep、changePartitionStateStep这几个步骤,关于etcd元数据的操作,这里重点关注addPartitionMetaStep。其余step另用篇幅进行讲解。

6.进入addCollectionMetaStep,执行其Execute()方法。

代码路径:internal\rootcoord\step.go

func (s *addPartitionMetaStep) Execute(ctx context.Context) ([]nestedStep, error) {
	err := s.core.meta.AddPartition(ctx, s.partition)
	return nil, err
}

在这里重点研究s.core.meta.AddPartition()这个方法做了什么事情。

调用栈如下:

s.core.meta.AddPartition()
  |--AddPartition()(internal\rootcoord\meta_table.go)
    |--mt.catalog.CreatePartition()(同上)
      |--CreatePartition()(internal\metastore\kv\rootcoord\kv_catalog.go)
        |--kc.Snapshot.Save()

在etcd产生partition相关的key:

root-coord/partitions/445762854989594797/445766775506484222

value的值的结构为etcdpb.PartitionInfo,然后进行protobuf序列化后存入etcd。

因此etcd存储的是二进制数据。

&pb.PartitionInfo{
	PartitionID:               partition.PartitionID,
	PartitionName:             partition.PartitionName,
	PartitionCreatedTimestamp: partition.PartitionCreatedTimestamp,
	CollectionId:              partition.CollectionID,
	State:                     partition.State,
}

可以看出partition由partitionID、partitionName、collectionID等组成。

func (kc *Catalog) CreatePartition(ctx context.Context, dbID int64, partition *model.Partition, ts typeutil.Timestamp) error {
	collMeta, err := kc.loadCollection(ctx, dbID, partition.CollectionID, ts)
	if err != nil {
		return err
	}

	if partitionVersionAfter210(collMeta) {
		// save to newly path.
        // 走这条路径
        // 构建key的规则
		k := BuildPartitionKey(partition.CollectionID, partition.PartitionID)
        
		partitionInfo := model.MarshalPartitionModel(partition)
        // 序列化
		v, err := proto.Marshal(partitionInfo)
		if err != nil {
			return err
		}
        // 写入etcd
		return kc.Snapshot.Save(k, string(v), ts)
	}

	......
}

跟踪BuildPartitionKey()函数,不难得出key的规则。整理如下:

key规则:

  • 前缀/root-coord/partitions/{collectionID}/
  • 前缀/snapshots/root-coord/partitions/{collectionID}/{partitionID}_ts

根据路径能够反映出partition属于哪个collection。一个collection可以包含多个partition。

默认partition名为:_default。

可配置(milvus.yml):common.defaultPartitionName

使用etcd-manager查看etcd:

总结:

1.CreatePartition由proxy传递给协调器rootCoord操作etcd。

2.CreatePartition最终会在etcd上写入一种类型的key

  • 前缀/root-coord/partitions/{collectionID}/
  • 前缀/snapshots/root-coord/partitions/{collectionID}/{partitionID}_ts

标签:core,err,CreatePartition,partition,ctx,collMeta,API,源码
From: https://www.cnblogs.com/melodyshu/p/17844630.html

相关文章

  • wxid转二维码在线生成器,加微信号好友接口工具,易语言源码分享
    用易语言开发的,我确保能用的,发布时间为11月20号,客户之前定制的我现在留着也没用,并且这个接口微信本身就有,我调用也不算是违规,然后下面是框架图和代码。框架图:  演示的图,通过WXID可以转到个人名片上面:【微信正规接口并非HOOK逆向】  易语言源码分享:=================......
  • 通过api登录接口获得cookie,给selenium使用,绕开登录页面
    1、通过接口登录获得cookiedefget_token_cookie():test=SSO_EXAMPLE()token=test.get_session.json()['token']cookie=test.get_session.cookiesreturntoken,cookietoken,cookie=get_token_cookie()print(token)cookie_value=cookie.v......
  • 1688 商品详情 APIERP 选品专用 API 接口 Python Java
    1688商品详情API接口是一种程序化的接口,它允许商家或开发者使用自己的编程技能,对1688平台上的商品信息进行查询、获取和更新。通过这个API接口,商家可以根据自己的需求,获取商品的详细信息,如价格、库存、描述、图片等,从而更好地进行营销和客户服务。使用1688商品详情API接......
  • 手机直播源码,Flutter 中的弹簧按钮效果
    手机直播源码,Flutter中的弹簧按钮效果import'package:flutter/material.dart'; classScaleAnimationextendsStatefulWidget   {  finalWidgetchild;  finalFunction()?onTap;  ScaleAnimation({requiredthis.child,requiredthis.onTap,Key?key}):supe......
  • 视频直播源码,图片选择器ImagePicker
    视频直播源码,图片选择器ImagePicker引入 gradleallprojects{  repositories{    maven{url'https://jitpack.io'}  }}implementation'com.github.DL-ZhangTeng:ImagePicker:1.5.0'//使用的三方implementation'com.github.bumptech.glide:glide:4.1......
  • 直播平台源码,隐藏app图标并不在最近运行中显示
    直播平台源码,隐藏app图标并不在最近运行中显示 <activity      android:name=".MainActivity"      android:excludeFromRecents="true"      android:noHistory="true">      <intent-filter>        <actio......
  • promise源码加分析
    classPromise{queue1=[]//queue1为了容纳成功之后的函数们queue2=[]//queue2为了容纳失败之后的函数们constructor(fn){//newPromise(fn)constresolve=(data)=>{//fn接受resolve并在成功的时候调用setTimeout(()=>{//要等一会,否则......
  • 国内站点同样使用API接口 与官网输出没有区别无须开通PLUS
       国内镜像是一个基于API接口的应用,它能够模拟人类的对话和语言交流,帮助用户更好地理解和应用自然语言处理技术。为了提高效率和稳定性,以及更好地服务用户,一些开发者在国内搭建了镜像站点,提供了更快速、可靠的服务。   国内镜像的优点在于能够在本地直接运行,避免了......
  • Kubernetes Gateway API 攻略:解锁集群流量服务新维度!
    KubernetesGatewayAPI刚刚GA,旨在改进将集群服务暴露给外部的过程。这其中包括一套更标准、更强大的API资源,用于管理已暴露的服务。在这篇文章中,我将介绍GatewayAPI资源,并以Istio为例来展示这些资源是如何关联的。通过这个示例,你将了解GatewayAPI的各个组成部分如何配......
  • Avalonia 实现跨平台的IM即时通讯、语音视频通话(源码,支持信创国产OS,统信、银河麒麟)
       在Avalonia如火如荼的现在,之前使用CPF实现的简单IM,非常有必要基于Avalonia来实现了。Avalonia在跨平台上的表现非常出色,对信创国产操作系统(像银河麒麟、统信UOS、Deepin等)也很不错。   现在,我们就来使用Avalonia实现一个跨平台的简单IM,除了文字聊天外,还可......