首页 > 其他分享 >从数据仓库到数据中台再到数据飞轮,我了解的数据技术进化史

从数据仓库到数据中台再到数据飞轮,我了解的数据技术进化史

时间:2024-09-17 20:51:19浏览次数:18  
标签:AI 数据仓库 业务 中台 飞轮 数据

(目录)

一.写在前面

数据技术的演化从数据仓库到数据中台,再到数据飞轮,反映了企业在数据管理和使用上的需求从基础的存储、查询向更高效、更智能的方向发展。现在来谈谈每个阶段的技术架构理念以及其特定的目标和侧重点。

二.数据技术进化历程

纵观大数据的发展史中,数据仓库概念的提出可以说是为大数据的发展提供了基石,它可以追朔到上世纪80年代,由IBM的研究人员提出的商业数据仓库概念,本质上还是希望能从操作型系统进化到决策分析系统,解决多重数据复制带来的高成本问题。数据仓库的核心是数据的集中化存储,主要面向决策支持,提高企业人员决策的有效性。其典型特征是结构化数据和批量处理,将数据通过联机分析(OLAP)处理、以数据立方体形式呈现,多维数据分析,常用切片,钻取等,数据一般来自业务系统的ETL(抽取、清理、装载、刷新)过程。 image.png 随着数据量和数据类型的增长,数据仓库对非结构化类型的数据的处理收到限制,因为其主要是接受处理来自于传统数据库下的表格数据。随着企业数据来源的增长以及业务场景的复杂化,数据中台的时代来临。它不仅仅是数据的集中存储,其更关注数据的治理、服务化和共享。 说到数据中台,这就不得不说下其兴起的缘由。数据中台在国内的兴起还在2015年,阿里巴巴拜访芬兰的一家公司后,感叹中台的强大,首次提出“大中台、小前台”的策略,其意思就是将支持类似的业务工作放在中台,让中台担当支撑的工作,让小前台离一线更近,贴切客户,使得业务更新更加快速。其核心理念就是提供数据服务。通过整合各种数据源,构建统一的数据资产平台,为前台的业务系统提供标准化、可复用的数据服务。这一点就与政企行业大数据采集、和应用方面高度契合,所以很多公司看到它的优越性,也投身于研发自己的数据中台,包括字节、腾讯等大牛。最具代表性的莫属于阿里出品的阿里数据中台了,它可以算是国内数据中台技术探索的问路石。 image.png 从数据中台的演进旅程来看,其实它就是数据仓库的下一代产物,也是业务和技术共同推动下的必然产物。最初,企业通过建设数据仓库解决了历史数据的存储和管理问题。然而,随着企业规模扩大,数据量呈现爆发式增长,传统数据仓库逐渐显得臃肿低效,缺乏灵活性。与此同时,大数据技术的发展显著提升了数据处理的能力,使得高效、敏捷的数据开发和数据服务成为现实。 虽然数据仓库到数据中台的转变大大提高了企业的业务响应速度,也解决了信息孤岛的问题,但是构建数据中台还是需要对业务有深入的了解,深度依赖于人工配置和管理,这种花费的成本还是很高的,所以技术理念更为先进的技术飞轮应运而生。它依托于数据中台,将数据的生产和消费闭环化,通过持续反馈和迭代推动业务的增长。 有很多人认为数据飞轮是数据中台的高阶形态,但我认为二者之间还是有本质差别的。下面且听我娓娓道来。 在CHATGPT为首的AI大模型出世以来,就肯定意味着AI将会给我们的产业带来新的一轮革新。数据飞轮强调数据的自动化收集、处理和反馈,利用AI和机器学习等技术不断优化业务模型和决策流程。通过集成AI和机器学习技术,飞轮不仅能够实时分析海量数据,还能不断调整和改进业务模型。AI算法能够识别数据中的模式和趋势,预测未来的需求变化,进而自动调整策略和运营流程。这种动态的优化过程确保了企业始终能够基于最新的数据做出决策,提升业务灵活性和响应速度。飞轮系统还能够通过持续的数据反馈机制,不断验证和完善业务假设和模型。每一次优化和调整都基于实际的数据结果,使得业务决策更加精准和可靠。这种闭环反馈不仅帮助企业在复杂多变的市场环境中保持竞争力,也推动了创新和业务增长的不断加速。 image.png

当前,数据飞轮的应用最早在火山引擎中得到实践,基于字节跳动的数据驱动方法。它可谓是得天独厚,拥有今日头条、基于数据分析选品、调度的抖音直播两大平台。但是就目前而言,然而,尽管数据飞轮的潜力巨大,其实际落地仍面临一些挑战。 其一是因为AI大模型的成熟度仍然有限。虽然机器学习和人工智能技术已经取得了显著进展,但大模型的训练和应用仍需要进一步的发展和优化,以充分发挥数据飞轮的潜力。当前,很多AI大模型在处理复杂问题时仍面临计算资源和数据质量的瓶颈,需要持续的技术突破和迭代更新;数据资产的私密性也是一个重要难题。许多公司对自己的数据持保留态度,不愿意将数据共享或外泄。这种数据隐私和安全问题限制了数据飞轮的广泛应用,因为有效的数据驱动模型需要大量的高质量数据进行训练和验证。企业在数据共享和保护之间需要找到平衡,确保数据的安全性和隐私性,同时又能利用数据驱动业务增长。 因此,尽管数据飞轮在字节跳动等前沿企业中取得了一定的成功,广泛应用仍需解决AI技术的发展、数据隐私保护等实际问题。随着技术的进步和行业标准的完善,数据飞轮有望在更多企业中实现落地应用,推动数据驱动的业务增长模式变得更加普遍和高效。

三.写在最后

数据仓库通过存储大量结构化数据,支撑企业的战略决策。但随着企业业务的多样化和数据来源的复杂化,数据仓库难以应对非结构化数据和快速变化的业务需求,因此数据中台的出现进一步增强了数据的治理和灵活使用能力。而数据飞轮的出现则进一步通过数据驱动业务,形成自动化的闭环,不断优化和迭代,减少人为干预,使得数据与业务相互促进,实现业务的持续增长。

标签:AI,数据仓库,业务,中台,飞轮,数据
From: https://blog.51cto.com/JackieLion/12018682

相关文章

  • 1-10、信息 / 个人信息 / 数字化 / 数字经济 / 生产要素 / 数据要素 / 数据 / 公共数
    1、信息(在信息处理中)关于客体(如事实、事件、事物、过程或思想,包括概念)的知识,在一定的场中具有特定的意义。(《信息技术词汇第1部分:基本术语》(GB/T5271.1-2000))2、个人信息个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处......
  • eyoucms易优无法安装,提示当前数据库结构与官方不一致
    当你在安装易优CMS(EyouCMS)时遇到“当前数据库结构与官方不一致”的提示,这通常意味着你的数据库版本或结构与CMS所需的版本或结构不符。这种情况通常是由于以下几个原因造成的:数据库版本过低:数据库版本低于CMS所支持的最低版本。数据库文件版本不匹配:数据库文件版本与CMS源码版......
  • 易优CMS网站迁移提示数据库版本不一致
    当你在迁移EyouCMS网站时遇到“数据库版本不一致”的提示,通常是因为目标数据库的版本与EyouCMS所需的版本不一致。为了解决这个问题,可以采取以下几个步骤:1.确认数据库版本首先,确认你的目标数据库版本是否符合EyouCMS的要求。EyouCMS通常支持MySQL5.6及以上版本。检查目标数......
  • 从数据仓库到数据中台再到数据飞轮:我见证的数据技术进化史
    在数据驱动的时代浪潮中,数据技术如同潮水般不断演进,从传统的数据仓库到新兴的数据中台,再到前沿的数据飞轮概念,每一次迭代都标志着企业对数据处理、分析及利用能力的飞跃。作为一名长期关注并实践数据技术的从业者,我有幸见证了这一系列的变革,并在此分享我的观察与思考。数据仓库:数据......
  • jsp大数据系教学评价管理系统i052x
    jsp大数据系教学评价管理系统i05本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表项目功能学生,教师,课程,听课,教师互评,学生评价,督导,督导评价开题报告内容一、项目背景与意义在教育信息化的大潮中,教学......
  • 【数据结构与算法 | 灵神题单 | 自底向上DFS篇】力扣965, 2331, 100, 1379
    1.力扣965:单值二叉树1.1题目:如果二叉树每个节点都具有相同的值,那么该二叉树就是单值二叉树。只有给定的树是单值二叉树时,才返回 true;否则返回 false。示例1:输入:[1,1,1,1,1,null,1]输出:true示例2:输入:[2,2,2,5,2]输出:false提示:给定树的节点数范围是 [1,......
  • 【数据结构与算法 | 灵神题单 | 自顶向下DFS篇】力扣1022,623
    1.力扣1022:从根到叶的二进制之和1.1题目:给出一棵二叉树,其上每个结点的值都是 0 或 1 。每一条从根到叶的路径都代表一个从最高有效位开始的二进制数。例如,如果路径为 0->1->1->0->1,那么它表示二进制数 01101,也就是 13 。对树上的每一片叶子,我们都要找出......