• 2024-03-11使用 .NET Core 构建实时数据处理应用程序
    第一部分:了解实时数据处理实时数据处理是指立即处理数据输入的过程,这对于需要快速响应的应用程序至关重要。在.NETCore环境中,我们可以利用其高性能、跨平台的特性来构建高效的实时数据处理应用程序。理论事件驱动架构:这是一种软件架构模式,通过事件来触发和通信,从而实现高度
  • 2024-01-25JAVA调用Python脚本执行
    SpringBoot-web环境<dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-web</artifactId></dependency>springboot--启动类@SpringBootApplication(ex
  • 2023-12-2812月28日总结
    大家好,我是独孤风,今天的元数据管理平台Datahub的系列教程,我们来聊一下DatahubCLI。也就是Datahub的客户端。我们在安装和使用Datahub的过程中遇到了很多问题。如何安装Datahub?为什么总是拉取镜像?如何启动Datahub?这些Datahub的Docker命令都是做什么的?有很多同学虽然搜
  • 2023-12-28开源数据血缘和元数据管理框架DataHub的血缘摄取 V0.12.1版本
    DataHUb的安装很简单:你有绿色上网就soeasy前置条件,你已经运行好DataHub整个Docker-Compse服务打开地址:http://host:9002/输入账号DataHub密码DataHub查看框架运行路线轨迹第一步源数据获取(1.1)点击这里(1.2)点击这里(1.3)点击这里{选择数据源的类型}:以MYSQL示例(1
  • 2023-12-28【Datahub系列教程】Datahub入门必学——DatahubCLI之Docker命令详解
    大家好,我是独孤风,今天的元数据管理平台Datahub的系列教程,我们来聊一下DatahubCLI。也就是Datahub的客户端。我们在安装和使用Datahub的过程中遇到了很多问题。如何安装Datahub?为什么总是拉取镜像?如何启动Datahub?这些Datahub的Docker命令都是做什么的?有很多同学虽然搜
  • 2023-12-15开源组件DockerFIle老是Build失败,如何解决
    推荐把外网地址替换为国内高速镜像#替换源地址http://dl-cdn.alpinelinux.org/alpine===https://mirrors.aliyun.com/alpinehttps://repo1.maven.org/maven2=====https://maven.aliyun.com/repository/public#goinstall代理proxy.golang.orggoenv-wGO11
  • 2023-11-03日志数据如何同步到MaxCompute
    https://developer.aliyun.com/article/727331摘要:日常工作中,企业需要将通过ECS、容器、移动端、开源软件、网站服务、JS等接入的实时日志数据进行应用开发。包括对日志实时查询与分析、采集与消费、数据清洗与流计算、数据仓库对接等场景。本次分享主要介绍日志数据如何同步到M
  • 2023-08-07Datahub稳定版本0.10.4安装指南(独孤风版本)
    大家好,我是独孤风,大数据流动的作者。曾几何时,我在第一次安装JDK环境的时候也遇到了不小的麻烦,当时还有朋友就因为这个环境问题觉得自己根本不是编程的料,选择了放弃。当时有个段子说,“如果不是JDK环境没搞定,我一定是一个编程天才”。权当一笑,但是环境问题确实是个大问题。开源元
  • 2023-08-04阿里发布开源大数据热力报告2022——Flink,Superset,Datahub上榜
        近日阿里发布了《开源大数据热力报告2022》报告,分析近年来大数据项目的发展趋势。    在这当中听到了太多熟悉的名字,Kibana,Grafana,ClickHouse,Spark,Airflow,Flink,Superset,Kafka,Metabase,DolphinScheduler,Iceberg,Hudi,Datahub,SeaTunnel等等。    有很多是我已经研究写了
  • 2023-07-11SignalR 外部调用自定义Hub类的方法,Clients为null
    这是因为外部调用的类的对象和你连接的Hub类的对象,这两个对象不!一!样!解决方法在自定义的Hub类中,注入IHubContext对象,然后在方法中调用IHubContext对象来向前端推送数据publicclassDataHub:AbpCommonHub,ITransientDependency{publicIOnlineClientManag
  • 2023-06-022022,数据科学与数据治理项目全纪录
    大家好,我是独孤风。2022年已过去一半多的时间了。这半年多,我们重点关注了LinkedInDatahub、Atlas等元数据管理工具,了解了他们在数据治理领域的作用。也关注了ApacheGriffin等数据质量工具的使用。但是,在数据工程领域这只是冰山一角,近期lakeFS高级工程师EinatOrr发布一份2022年的
  • 2023-06-02一站式元数据治理平台——Datahub入门宝典
    随着数字化转型的工作推进,数据治理的工作已经被越来越多的公司提上了日程。作为新一代的元数据管理平台,Datahub在近一年的时间里发展迅猛,大有取代老牌元数据管理工具Atlas之势。国内Datahub的资料非常少,大部分公司想使用Datahub作为自己的元数据管理平台,但可参考的资料太少。所以整
  • 2023-03-22数据治理工具DataHub的安装及踩坑过程
    【摘要】  项目上后面要搞数据治理,网上主流的开源组件是Atlas和DataHub,这几天刚好有时间,先把DataHub安装试用一下。安装过程中问题较多,花了两天时间才安装完。先把安
  • 2023-03-17hive kerberos
      前提准备:需krb5.conf和keytab文件,hive和kerberos的ip及hostname,hive数据库1、 dockerload-iactions.tar重新加载actions镜像2、 进入/data/datainsight
  • 2023-03-17datahub内网环境部署总结
      一、安装部署1、还原备份文件(必须使用root用户),执行tarxvpfzdatainsight.tgz-C/(根目录需有至少20G磁盘空间)耐心等待2、解压部署包进入/data/datainsight
  • 2023-03-17集群版datahub安装卸载
      cd /home/datahubcd/k8s/datahubhelm uninstall datahubkubectl get jobkubectl delete job datahub-datahub-upgrade-jobkubectl delete job dat
  • 2023-03-17datahub 部署流程
      1、 推送镜像 //登录harbordockerlogin-ucyt-pCytpwd_123harbor.pis360.com//重打tag指定格式才能推送镜像到harbor仓库dockertagxxx:xxxharbor
  • 2022-11-03Datahub新版本0.9.1更新,列级别数据血缘功能发布!
    大家好,我是独孤风。近期Datahub进行了一次大的版本更新,从0.9版本以后Datahub也正式发布了列级别数据血缘的功能。0.9.1版本又增加了,列的影响分析这个功能。这样Datahu
  • 2022-10-12EasyCV DataHub 提供多领域视觉数据集下载,助力模型生产
    作者:伝迹谦言夕陌临在在人工智能广泛应用的今天,深度学习技术已经在各行各业起到了重要的作用。在计算机视觉领域,深度学习技术在大多数场景已经替代了传统视觉方法。如果