首页 > 其他分享 >智能关键技术二:库内AI引擎

智能关键技术二:库内AI引擎

时间:2025-01-16 14:23:38浏览次数:1  
标签:关键技术 训练 AI 模型 用户 算子 执行 库内

GaussDB 库内AI引擎架构如下图:
在这里插入图片描述

图4 DB4AI架构图用户接口层

在用户接口层,实现SQL-like语法,提供Create Model、Predict等关键字,支持AI算法训练和预测。当前支持的AI算法包括:GD(梯度下降法)、KMeans(聚类)、XGBoost、决策树等。

查询优化层查询优化层提供AI训练执行计划和AI预测执行计划,该计划依据内部统计信息和AI算子调用关系,生成相应执行计划。

可以把AI算子看做执行器中的计算单元,例如Join、AGG等,AI算子执行代价基于执行逻辑、获取的数据行数、算法复杂度共同决定。同时在执行计划生成后,可通过Explain语句查看详细的执行开销,分析路径选型的正确性。

AI底座和执行层在AI底座中,提供超参优化能力,即用户不指定超参数或者指定超参数的范围,自动选择适合的参数,该功能极大提升用户使用的效率,同时达到最佳的训练性能。

在执行器中,提供多种AI算子,例如GD算子可支持逻辑回归、分类;KMeans算子支持聚类。在每个算子实现过程中,遵循执行器算子实现逻辑,下层对接Scan算子,上次提供AI算子的训练或推理结果。

在训练完成后,训练模型将实时保存到系统表中,用户可以查询gs_model_warehouse系统表来获取模型信息。存储层在存储层,DB4AI提供数据集管理功能,即用户可以抽取某个表或多个表中的列信息,组成一个数据集,用于后续模型训练。数据集管理功能类似git模式提供多版本管理,目的是保障训练数据的一致性。

同时在这过程中,可通过特征处理和数据清洗保障数据的可用性。同时对已生成的模型进行管理,包括模型评估、定期模型验证、模型导入、模型导出等能力,在验证模型失效后,模型漂移功能可以进行模型刷新,保障模型可用。

异构计算层DB4AI框架支持异构计算层,实现CPU和AI算力的统一调度,满足数据库语句执行和AI训练的完美结合。在实现方面,CPU算力,特指ARM及X86芯片,可用于基础机器学习算子调用及并行计算执行;AI算子,例如昇腾及GPU芯片,可用于重度分析算子(Join、AGG)及深度学习算子使用,加速大数据及多层网络场景下计算需求。

标签:关键技术,训练,AI,模型,用户,算子,执行,库内
From: https://www.cnblogs.com/xiaoxu0211/p/18674918

相关文章

  • GaussDB关键技术方案_通信组件
    GaussDB关键技术方案_通信组件云原生数据库采用shareddisk架构,各个计算节点对等,计算节点之间通过页面交换实现缓存数据的一致性,为了提高页面传递的效率,需要利用RDMA或UB单边读写的能力;云原生数据库为了管理动态资源,需要对动态资源的owner分配进行加锁,分布式锁管理需要利用原子操......
  • TAITherm - 专业热管理工具
    概述      TAITherm是ThermoAnalytics公司开发的专业三维热仿真分析工具,广泛应用于国内外汽车、摩托车、工业自动化、重型机械等行业的热仿真设计中。同系列的CoTherm耦合优化模块可支持稳态/准瞬态/瞬态热流耦合、一三维耦合、FMU集成、设计优化、敏感性分析、代理模型训......
  • 开箱你的 AI 语音女友「GitHub 热点速览」
    随着大模型API服务的不断丰富,开发者无需再依赖昂贵的硬件,也能轻松开发出拥有强大AI能力的应用。这不仅降低了技术门槛,也激发了极客们的创造力。就比如上周飙升1.5kStar的开源项目xiaozhi-esp32,仅用低成本的ESP32开发板和LLMAPI服务,就能制作出一个聪明有趣、......
  • 扎克伯格知晓 Meta 使用盗版图书馆数据训练 AI
    近日,随着Meta公司在一场关于版权的集体诉讼中披露的文件浮出水面,该公司利用一个名为LibraryGenesis(LibGen)的盗版电子书图书馆来训练其最新的AI聊天机器人Llama3的消息引发了广泛关注。这些文件显示,Meta的工程师曾讨论过利用LibGen这一“影子图书馆”的潜在风险,......
  • 【好书推荐:一本书读懂AI Agent】4种革新性AI Agent工作流设计模式全解析
    目录4种革新性AIAgent工作流设计模式全解析1.反思2.工具使用3.规划4.多Agent协作总结4种革新性AIAgent工作流设计模式全解析**导读:**AIAgent是指能够在特定环境中自主执行任务的人工智能系统,不仅接收任务,还自主制定和执行工作计划,并在过程中不断自我评估和......
  • 职场人如何学好AI?探星AI研习社提供全面内容
    探星AI研习社:职场人学习人工智能的黄金之路一、探星AI研习社简介探星AI研习社,是由探潜学堂联合各行业专家共同发起的平台。该平台致力于为职场人提供全面、系统的人工智能(AI)学习资源与培训服务。通过专业的培养计划,我们旨在帮助职场人提升在人工智能领域的专业知识和技能水平......
  • 从零开始打造AI知识库:使用爬虫自动化采集网页内容的完整教程
    言简意赅的讲解crawler爬虫解决的痛点童鞋们在实现私有化大语言模型和实现精准参数归纳与程序执行之后还是不满足AI相关的能力。在AI驱动的知识管理时代,快速搭建属于自己的知识库已成为很多开发者和团队的核心需求。本文将带你一步步创建一个基于网页爬取的知识库,并将其......
  • 【2025大模型最新版】AI大模型全解析:零基础入门到精通,一文搞定!
    近年来,随着深度学习技术的飞速发展,AI大模型作为人工智能领域的重要研究对象,正逐步成为学术界和产业界广泛关注的热点议题。AI大模型,作为一类具备庞大参数规模与卓越学习能力的神经网络模型,如BERT、GPT等,已在自然语言处理、计算机视觉等多个领域展现出卓越成效,极大地推动了......
  • 从目前AI的发展趋势来看,AI编程能力肯定会比人提升的越来越快,学习编程语言是否已经不再
    随着AI技术的发展,特别是像ChatGPT这样的生成式AI的出现,AI确实在编程方面展现了强大的能力。但学习编程语言和编程思维依然是一个人从事开发工作的核心能力,原因在于以下几个方面:1.编程语言依然重要的原因1.1理解AI的结果AI是工具而非替代品:AI可以帮助生成代码,但......
  • 腾讯云AI代码助手编程挑战赛-【用AI构造AI-打造属于个人的Copilot】
    @[腾讯ai代码助手]概要使用腾讯云ai编程助手辅助编程使用AI构造AI打造属于个人的Copilot作品简介腾讯云AI编程助手结合TDesign,为开发者提供了一站式的智能开发解决方案。腾讯云AI编程助手基于混元代码大模型,能够实现代码的智能补全、生成、优化与重构,以及错误检测与修......