首页 > 其他分享 >DataOps真能“降本增效”?

DataOps真能“降本增效”?

时间:2024-06-20 17:34:42浏览次数:23  
标签:真能 工作 平台 调度 降本增效 开源 DataOps 数据

在各行各业中,越来越多的公司开始重视收集数据,并寻找创新方法来获得真实可行的商业成果,并且愿意投入大量时间和金钱来实现这一目标。

file

据IDC称,数据和分析软件及云服务市场规模在 2021 年达到了 900 亿美元,随着企业继续对人工智能和机器学习 (AI/ML) 和现代数据计划进行投资,预计到 2026 年将增长一倍以上。

然而,尽管投入了大量资金,数据项目往往收效甚微。麦肯锡最近对高级主要分析项目进行的一项调查发现,公司 80% 的时间都花在准备数据等重复性任务上,而这些任务产生的增值作用有限。此外,他们还发现,只有 10% 的公司认为他们已经控制住了这个问题。

项目为何失败?

尽管增加了投资和关注,数据项目的失败率为什么仍然如此之高?

许多变量都会影响项目的成功,经常被提及的因素包括项目复杂性和对应的开发人才技术水平。企业也意识到,许多数据项目都失败了,是因为他们难以在生产中大规模实施数据计划。

这导致了 DataOps 的出现,成为克服大数据项目中常见挑战的新框架。DataOps 是敏捷工程和 DevOps 最佳实践在数据管理领域的应用,能帮助企业快速将新见解转化为完全可操作的生产交付成果,从而从数据中释放出商业价值。

数据调度的挑战

大多数数据工作流都非常复杂,需要跨多个不同的应用程序、数据源和基础架构技术运行,并且这些技术需要协同工作。虽然目标是在生产中实现这些流程的自动化,但现实情况是,如果没有强大的工作流调度平台,在企业规模上交付这些项目可能会非常昂贵,而且通常需要花费大量时间进行手动工作。

2023年1月份,白鲸开源正式发布了 Apache DolphinScheduler商业版Whalescheduler。相比于开源版本,商业版拥有更为专业的服务支持,感兴趣的小伙伴可以看下这篇文章进一步了解:什么是数据调度平台 WhaleScheduler

数据工作流调度项目有四个关键阶段:

  • 数据引入:这涉及从传统来源(如企业资源规划 (ERP) 和客户资源管理 (CRM) 解决方案、金融系统等)以及现代来源(如设备、物联网 (IoT) 传感器和社交媒体)收集数据。

  • 数据存储:存储数据的方式和地点取决于持久性、数据集的相对价值、分析模型的刷新率以及数据移动到处理阶段的速度。

  • 数据处理:处理阶段也面临许多挑战,包括需要多少处理能力?是恒定的还是可变的?是定期的、事件驱动的还是临时的?如何将成本降到最低?

  • 洞察传递:这需要将数据输出移动到分析系统。这一层同样复杂,有越来越多的工具代表数据管道中的最后一英里。

随着新数据和云技术的频繁推出,公司不断重新评估其技术堆栈。这种不断发展的创新带来了压力和客户流失,这可能是一个挑战,因为公司需要轻松采用新技术并将其扩展到生产中。

最终,如果新的数据分析服务没有大规模投入生产,公司就无法获得可操作的见解或实现价值。

实现规模生产

在生产中成功大规模运行业务关键型工作流程并非偶然。正确的工作流程调度平台可以帮助您简化数据管道并获得所需的可行见解。

考虑到这一点,以下是您在工作流调度平台中需要寻找的八个基本功能

  • 支持异构工作流:各公司正在迅速转向云,在可预见的未来,工作流将跨越高度复杂的混合环境。对于许多公司而言,这将包括支持跨数据中心和多个私有云和/或公共云的大型机和分布式系统。Apache DolphinScheduler 是一个强大的开源分布式工作流调度平台,能够处理多种应用程序和基础设施的多样性,提供一致的自动化策略。

  • SLA 管理:业务工作流(从预测风险的 ML 模型到财务结算和付款结算)都有完成 SLA,这些 SLA 有时受监管机构制定的准则的约束。您的调度平台必须能够理解并通知您复杂工作流中的任务失败和延迟,并且需要能够将问题映射到更广泛的业务影响。

  • 错误处理和通知:在生产中运行时,即使是设计得最好的工作流程也会出现故障和延迟,而海豚调度恰恰有非常完善的告警机制,并支持一些主流的平台

  • 自我修复和补救:响应业务工作流中的作业故障时,平台会采取纠正措施,例如重新启动作业、删除文件或刷新缓存或临时表。调度平台应允许自动化工程师配置此类操作,以便在下次发生相同问题时自动执行。

  • 端到端可视性:工作流跨混合技术栈执行互连的业务流程。调度平台应该能够清晰地显示工作流的沿袭。这对于帮助工程师了解应用程序与其支持的业务流程之间的关系至关重要。这对于变更管理也很重要。在进行变更时,了解流程上游和下游发生的情况至关重要。

  • 自助式用户体验:工作流调度是一项团队活动,涉及许多利益相关者,例如数据团队、开发人员、运营、业务流程所有者等。每个团队对于如何与调度工具交互都有不同的用例和偏好。

  • 生产标准:在生产中运行工作流需要遵守标准,这意味着使用正确的命名约定、错误处理模式等。您的调度平台应该有一个机制,提供一种非常简单的方法来定义这些标准,并在用户构建工作流时引导遵循适当的标准。

  • 支持 DevOps 实践:随着公司采用 DevOps 实践,例如持续集成和持续部署 (CI/CD) 管道、工作流开发、修改甚至工作流基础设施部署,您的调度平台应该能够适应现代发布实践。

对数据的需求正在上升,并且没有减弱的迹象,这意味着拥有存储、处理和操作数据的能力对于任何企业的成功仍然至关重要。DataOps 实践与强大的调度功能相结合,可以帮助企业调度数据管道、简化数据交付流程并改善业务成果。

WhaleStudio是白鲸开源根据全球领先的DataOps理念打造的新一代全栈数据集成调度产品,具有分布式、云原生并带有强大可视化界面的特点,将全球领先的调度开发组件Apache DolphinScheduler与数据集成组件Apache SeaTunnel集成在一起提供给全球用户领先的完整解决方案,支持170+数据源集成并全面支持信创环境,目前已服务于6000+企业。

本文来源于:https://www.datanami.com/2024/05/15/unlock-your-data-initiatives-with-dataops/ 如有侵权,请联系删除

本文由 白鲸开源 提供发布支持!

标签:真能,工作,平台,调度,降本增效,开源,DataOps,数据
From: https://www.cnblogs.com/DolphinScheduler/p/18259106

相关文章

  • 让AI回答一下:程序员转型做烧烤有什么优势?AI是真能编呀!
    我让AI回答一下,程序员转型做烧烤有什么优势,AI真的给出答案,不好好像哪一条有优势,都和经营好烧烤店三不沾呢。带底色文字是贝格前端工场的评语。如果程序员转型成为烧烤店老板,他们可能会具有以下优势:1.技术应用:程序员在烧烤店经营中可以利用技术优势,例如建立自己的在线订餐......
  • 【供应链管理】供应链管理降本增效图库,包括流程图、框架图、优化图、供应商管理
    **【供应链管理】供应链管理降本增效图库**一、降本增效流程图此流程图详细展示了供应链管理过程中的降本增效环节。从需求预测、采购计划制定、供应商选择、物料入库、生产排程、物流运输到最终的销售与售后服务,每个环节都通过优化流程、减少浪费、提高效率等措施实现成本......
  • 从游戏场景看,ByteHouse存算分离架构如何实现降本增效
    经过几十年发展,中国游戏产业逐步迈向成熟与稳健的新阶段。 根据中国音数协游戏工委的数据,2023年,中国移动游戏用户规模达6.57亿人,同比增速小幅增长。在商业模式层面,除了传统的广告投放和付费会员制度外,一些游戏公司还引入了电商直播、虚拟礼物销售等新的商业模式,以提高用户粘性......
  • 一文搞懂DevOps、DataOps、MLOps、AIOps:所有“Ops”的比较
    引言近年来,“Ops”一词在IT运维领域的使用迅速增加。IT运维正在向自动化过程转变,以改善客户交付。传统的应用程序开发采用DevOps实施持续集成(CI)和持续部署(CD)。但对于数据密集型的机器学习和人工智能(AI)应用,精确的交付和部署过程可能并不适用。本文将定义不同的“Ops”并解释......
  • OpenCloudOS 助力趣丸科技降本增效,容器化高效运行
    导读:趣丸科技,一家集兴趣社交、电子竞技、人工智能于一体的创新型科技企业,在采用OpenCloudOS开源操作系统后,结合业务特点将容器化集群平均利用率提高到40%左右,高峰利用率达80%,降本增效的同时,满足了不断增长的业务需求。本文将介绍OpenCloudOS在趣丸科技的具体应用,以及平均......
  • 各种“Ops“的对比:DevOps vs. DataOps vs. MLOps vs. AIOps
    文章目录0.前言1.DevOps2.DataOps3.MLOps4.AIOps5.总结6.参考0.前言近年来,缩略词“Ops”在IT运营领域中迅速普及,反映了该领域的一系列重要变革。传统的IT操作正在向自动化流程转变,以更高效地改善客户交付。这种转变旨在减少人为干预,增加操作的一致性......
  • 【2024-05-24】降本增效
    20:00但是人就是这样一天一天,一黑夜一黑夜地长起来的。正如同庄稼,每天观察,差异也都不太明显,然而它发芽了,出叶了,拔节了,孕穗了,抽穗了,灌浆了,终于成熟了。                                       ......
  • 摸清自定义流程表单开发优点 实现降本增效!
    随着社会竞争压力的增大,很多企业都希望实现降本增效提质的办公效果。那么,借助什么样的软件平台可以让企业在提升市场竞争力的前提下,还能降低开发成本,提高成效?低代码技术平台是目前流行于中小企业办公职场中的平台产品,其中自定义流程表单开发优势特点多、灵活高效、可视化操作界面,......
  • Google Cloud Next ’24 Recap 开启 AI 新篇章,Cloud Ace 独立解决方案助力企业降本增
    北京时间2024年4月26日,CloudAce云一受邀参与GoogleCloudNext’24Recap在深圳的线下活动,并设置展位。本次活动主要聚焦于Next’24(LasVegas)成果展示,给中国客户和开发者深入解读GoogleCloudNext’24大会上Gemini、VertexAI、BigQuery等产品服务的重要更新,展示了......
  • 降本增效,火山引擎ByteHouse助力短剧广告投放效率提升5倍
    近几年来,短剧市场呈现出爆发式增长的态势,2023年中国网络微短剧市场规模为373.9亿元,同比上升267.65%。短剧涵盖爱情、历史、悬疑等各种题材,短小精悍特点也符合现代人快节奏、碎片化的生活方式,观众可以通过手机随时随地观看短剧,满足了不同群体的需求。 用数据分析出不同观众......