首页 > 其他分享 >人工智能,应该如何测试?(四)模型全生命周期流程与测试图

人工智能,应该如何测试?(四)模型全生命周期流程与测试图

时间:2024-04-07 15:55:57浏览次数:13  
标签:生命周期 人工智能 模型 离线 测试人员 测试 数据

这些日子讲了很多东西,但比较乱,我这里补充一下完整的业务和测试流程。

生命周期流程图

根据数据闭环,我画出了上面的图,并标记了其中测试人员要参与的活动(浅蓝色)。下面我一一分析一下这些测试活动的含义。

  • 离线模型测试阶段:在模型的生命周期中,会涉及到 3 种数据。 训练集,验证集和测试集,其中训练集用来训练模型,验证集用来算法自测。 而测试人员需要自行采集/挖掘(要根据用户画像每种类别的数据都要采集到)符合场景的测试的数据。 根据测试数据对模型进行完整的评估(AUC,召回,精准等等)
  • 线上线下一致性测试: 模型的离线和在线是采取完全不同的代码进行的特征工程(模型不接受原始数据,数据需要经过特征工程后输入到模型),要保证两边的特征工程完全一致是很难的。 所以要进行一致性的测试。
  • A/B Test: 模型即便在离线进行了充分的测试,但线上的情况瞬息万变,模型上线是一个严谨的过程。 我们希望模型更新的过程更加严谨。 所以往往会让新旧模型共存一段时间。比如我们先把 10% 的流量切给新模型, 90% 的流量依然发送到老模型中。 然后待观察效果没有问题后,再切 20% 的流量到新模型上,以此类推, 直到最后新模型完全替代老模型。
  • 线上模型监控:因为用户行为瞬息万变,可能随便一个社会性时间用户的行为就发生了重大的改变。 所以我们需要实时的监控线上效果。
  • 数据质量测试:新采集的数据要加入到自学习之前,需要验证数据本身的质量。以免犹豫数据本身出现了问题导致模型效果的偏差。

标签:生命周期,人工智能,模型,离线,测试人员,测试,数据
From: https://www.cnblogs.com/hogwarts/p/18119211

相关文章

  • SpringBoot中bean的生命周期
    目录概述使用场景代码演示bean初始化TestSupportBeanPostProcessorImpllog代码概述Bean生命周期管理是SpringBoot中的关键功能之一。它负责管理应用程序中的Java对象,这些对象被称为Beans。SpringBoot通过创建、配置、初始化和销毁这些Beans来确保应用程序的正常运行......
  • jmeter压力测试性能场景
    +压力测试场景  +压力测试:长时间    +29\*20%  =6    +29\*80% =24    +时间      +普通线程组      +阶梯线程组 ......
  • 从数组创建二叉树-Leetcode测试用
    Leetcode里和二叉树相关的题目,都是用一个数组表示二叉树的,而这个数组是按照层次优先顺序给出的,连其中的空结点也表示了出来,刚好就是2^N-1个结点,N表示层数。但数组毕竟无法和二叉树一样具有链式结构,无法进行算法测试,因此尝试直接通过这样的数组构建二叉树。通过数组创建这样的二......
  • app闪退的原因--一起学习吧之测试
    一、闪退原因内存或存储空间不足:当应用程序使用过多的内存或存储空间时,可能会导致应用程序崩溃。这通常发生在设备上运行内存或存储空间不足的情况下。线程问题:如果应用程序中的线程没有正确管理或者存在死锁情况,可能导致应用程序崩溃。无效的输入或数据错误:当应用程序接收到......
  • 网页崩溃的原因是什么--一起学习吧之测试
    一、网页崩溃的原因代码错误:网页的前端代码(如HTML、CSS和JavaScript)中可能存在错误,例如语法错误、逻辑错误或代码冲突。这些错误可能导致网页无法正确渲染或执行,进而导致崩溃。内存问题:网页使用的内存超过了浏览器或设备的限制。内存泄漏是常见的问题,当网页长时间运行时,如果不......
  • 软件项目管理资料完整版(规格说明书+详细设计+测试计划+验收报告)
       前言:在软件开发过程中,文档资料是非常关键的一部分,它们帮助团队成员理解项目需求、设计、实施、测试、验收等各个环节,确保项目的顺利进行。以下是针对您提到的各个阶段的文档资料概述:所有资料获取:点击获取开发阶段需求规格说明书:详细描述了软件系统的功能需求、非......
  • ACTL5105人工智能算法
    ACTL5105分配到期时间:2024年4月15日星期日下午5点这是一项个人课业。总分为100分,占总分的20%球场标记。工作分配任务作为一名人寿精算师,你的任务是完成以下两项任务。任务I(25分)创建列出Ax、¨Ax、,2Ax、(IA)x和(IA¨)x假设excel文件“A-population-2020”中人群的年利率为5%。(说明:您......
  • AI人工智能超融合:创新浪潮下的机遇与挑战
    AI人工智能超融合:创新浪潮下的机遇与挑战一、AI人工智能超融合的技术革新随着科技的飞速发展,AI人工智能超融合作为新一代信息技术的代表,正引领着技术革新的浪潮。它将人工智能技术与超融合架构相结合,打破了传统IT架构的局限性,实现了计算、存储、网络等资源的统一管理和调度。......
  • 面试常问问题——ios测试和安卓测试的区别
    1.Android长按home键呼出应用列表和切换应用,然后右滑则终止应用; 2.多分辨率测试,Android端20多种,ios较少; 3.手机操作系统,Android较多,ios较少且不能降级,只能单向升级;新的ios系统中的资源库不能完全兼容低版本中的ios系统中的应用,低版本ios系统中的应用调用了新的资源库,会直接......
  • jmeter负载测试性能场景
    负载测试性能场景负载测试:逐步增加并发用户数插件:     插件管理:jpgc 安装这个插件     **用5秒钟增加10个并发用户数,持续运行30秒** ......