首页 > 其他分享 >ASR项目实战-交付团队的分工

ASR项目实战-交付团队的分工

时间:2023-12-30 11:11:08浏览次数:34  
标签:实战 ASR 依赖 测试 模型 算法 交付 设计 团队

对于通常的软件项目,参与角色,比如可以有用户,消费者,产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队。

通常认为,用户,负责购买服务的群体,而消费者,负责使用业务的群体。这两个群体,不在本文的讨论范围之内,因此后续的介绍中,除非明确说明,否则默认均不涉及。

产品团队,研发团队(研发团队包括开发和测试),运营团队,运维团队,管理团队,可以归纳为产品交付团队。

关于各团队的简单的说明:

  • 产品团队,负责定义产品,规划路标,收集和定义需求的团队。
  • 研发团队,可以细分为架构团队,设计团队,开发团队,测试团队。
    • 架构团队,依据产品定义,路标规划,定义并看护产品的架构。
    • 设计团队,依据需求定义,结合架构方案,输出设计方案,指导开发团队交付需求,指导测试团队完成功能验证,指导运维团队在生产实施和维护。
    • 开发团队,依据需求方案,按照一定的节奏交付特性。
    • 测试团队,依据需求方案,实施功能验证,确认是否达成一定的质量要求。
  • 管理团队,产品团队、研发团队、运营团队、运维团队等的管理组织,制订计划,跟进计划的执行,全程参与产品的交付,并对产品最终的结果负责。
  • 运营团队,负责产品的推广、用户拓展和经营、用户培训、宣传方案、使用资料等。

这几个团队的规模视情况而定,职能和人员可能存在一定的重叠,比如

  • 有些公司没有专职的运营人员,相关的职能由产品团队和运维团队承担;
  • 有些公司没有专职的产品团队,相关的职能由管理团队以及研发团队中的架构、设计团队一起承担。

具体到ASR的交付,由于涉及到了机器学习算法,依据职责和人员技能,新增了如下团队:

  • 数据团队,负责采集、清洗、转换数据。
  • 算法设计团队,负责设计模型的结构、模型的训练算法、算法的评测指标和评测方法,同时决定训练平台。
  • 算法训练团队,依据设计好的模型结构和训练算法,执行训练任务,输出、评测模型。
  • 算法工程化团队,依据设计好的模型结构,综合考虑训练平台,选型推断代码的运行平台,输出推断代码,并负责调优,满足工程交付的要求。
  • 模型测试团队,依据事先确定的评测方法,执行评测工作,输出相应的指标数据。

为了区分,原有的设计、开发、测试团队,则分别命名为业务设计、业务开发、业务测试团队。

组织很庞大,分工很细致,因此平衡各方面的利益和诉求,非常考验管理团队和架构团队。

为了完成产品的交付,各团队之间存在相互依赖和诉求。
比如:

  • 数据团队
    • 依赖算法工程化团队,提供采集、清洗、转换的工具。
    • 依赖算法设计团队,提供数据的标准和来源。
    • 依赖算法训练和模型测试等团队,提供对数据质量的反馈。
  • 算法设计团队
    • 依赖数据团队,提供样例数据。
    • 依赖产品团队,提供需求和优先级。
    • 依赖算法训练团队,反馈训练算法、模型存在的问题。
  • 算法训练团队
    • 依赖数据团队,提供训练数据。
    • 依赖算法设计团队,提供模型定义、训练算法。
    • 依赖算法测试团队,反馈模型的问题。
  • 模型测试团队
    • 依赖数据团队,提供测试数据。
    • 依赖算法工程化团队,提供支撑测试的工具。
  • 算法工程化团队
    • 依赖业务设计、算法设计团队,提供接口定义。
  • 业务设计团队
    • 依赖算法设计团队,定义算法的能力,协同定义集成方案,交互的接口。
  • 业务开发团队
    • 依赖架构团队,给出架构方案、技术选型等。
    • 依赖业务设计团队,给出集成方案和接口文档等。
    • 依赖算法工程化团队,协同完成集成。
    • 依赖算法训练团队,提供符合要求的模型。
  • 业务测试团队
    • 依赖业务设计团队、算法设计团队,提供设计方案。
    • 依赖数据团队,提供发布验证的数据。
    • 依赖业务开发团队,提供转测试的版本。
  • 管理团队
    • 依赖架构、设计、开发、测试团队,各自给出计划,关键时间点,内、外部的风险和困难等。

前述各团队的分工、职责、人员可能未必可以划分的如此清晰,在项目的实际运作过程中,经常存在重合的现象,需要各团队、各成员相互之间补位,凡事以达成产品的交付目标为重。
为了提高各团队之间的沟通效率,团队之间需要统一语言,相互之间学习基本的概念和业务,增进相互的理解,此外在沟通时注重就事论事,减少无意义的PK,这样才能提高沟通效率,改善生活质量。

标签:实战,ASR,依赖,测试,模型,算法,交付,设计,团队
From: https://www.cnblogs.com/jackieathome/p/17935667.html

相关文章

  • ASR项目实战-产品分析
    分析Google、讯飞、百度、阿里、QQ、搜狗等大厂的ASR服务,可以罗列出一款ASR服务所需要具备的能力。产品分类ASR云服务产品,从用户体验、时效性、音频时长,可以划分为如下几类:实时短音频转写,可以用于支撑输入法、搜索、导航等场景。实时长音频转写,可以用于支撑视频字幕、图文直......
  • ASR项目实战-前处理
    本文深入探讨前处理环节。首先介绍一些基本的名词,比如文件名后缀文件格式音频格式采样率和位深预备知识文件名后缀、文件格式和音频格式常见的音频文件,比如.wav、.mp3、.m4a、.wma等,这些都代表什么?仅仅是这类音频文件的后缀而已,不一定和音频文件的编码、音频数据的编码......
  • ASR项目实战-后处理
    本文深入探讨后处理环节。在本环节要处理的重要特性有分词、断句、标点符号、大小写、数字等的格式归一等。分词和NLP、搜索等场景下的分词含义不同。对于拼音类的语言,比如英语、法语等,句子由多个单词组成,语音输出的结果,需要按需在各个单词之间补充或者去掉空格。对于中文来说,......
  • ASR项目实战-数据
    使用机器学习方法来训练模型,使用训练得到的模型来预测语音数据,进而得到识别的结果文本,这是实现语音识别产品的一般思路。本文着重介绍通用语音识别产品对于数据的诉求。对数据的要求训练集相关要求,如下:地域,需要覆盖使用人群所在的地域,且数据的比例适中。口音,需要覆盖典型的......
  • ASR项目实战-构建Kaldi
    准备工作安装构建时依赖的基础软件软件清单如下:bzip2python3automakelibtoolcmakegccg++gfortrangitsubversion不同平台安装软件的方式不同,比如可以使用yum或者apt-get等。下载开源软件软件清单如下:LibunwindglogOpenFSTOpenBLASKaldi按照一定的规则,将下......
  • ASR项目实战-语音识别
    本文深入探讨语音识别处理环节。本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。语音识别业界流派众多,比如Kaldi、端到端等,具体选择哪一种,需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等,作出相对合理的交付规划。基于Kaldi的方案,优......
  • JVM-实战篇-GC调优
    1GC调优GC调优指的是对垃圾回收进行调优。GC调优的主要目标是避免由垃圾回收引起的程序性能下降。GC调优的核心分为三部分:通过JVM参数的设置;特定垃圾回收器的JVM参数的设置;解决由频繁的FULLGC引起的程序性能问题。GC调优没有唯一的标准答案,重点学习调优的工具和方法。......
  • Citrix ADC Release 13.0 Build 92.18 发布 - 混合多云应用交付控制器
    CitrixADCRelease13.0Build92.18发布-混合多云应用交付控制器CitrixADCRelease13.0Build92.18(nCore,VPX,SDX,CPX,BLX)CitrixADC-混合多云应用交付控制器作者主页:sysin.org大规模应用程序交付可能很复杂。使用NetScaler让一切变得更简单。产品概述CitrixAD......
  • JVM-实战篇-内存调优
    1内存溢出和内存泄漏概念:内存泄漏:在Java中如果不在使用一个对象,但是该对象依然在GCROOT的引用链上,这个对象就不会被垃圾回收器回收,这种情况就称之为内存泄漏。内存泄漏绝大多数情况都是由堆内存泄漏引起的,所以后续没特殊说明讨论的均为堆内存泄漏。若持续发生内存泄漏,不管有......
  • 记一次对某杀猪盘站点的实战渗透
    前言昨天半夜看到一篇文章 某菠菜网站渗透实战就想着自己也练一练手,打到一半发现,大师傅们对这类站点已经狠狠的蹂躏了,所以借鉴师傅们的经验,本着锻炼一下,想到哪就记一下,所以写的比较杂乱,其中有没有解决的地方也记录下来的,然后又换了个站点接着走了下去信息收集前台这样看一下其他......