• 2023-08-04数据质量管理工具预研——Griffin VS Deequ VS Great expectations VS Qualitis
    开源数据质量管理工具预研——GriffinVSDeequVSGreatexpectationsVSQualitis。概述 数据质量监控(DQC)是最近很火的一个话题,也是数据治理中最重要的一环。有一句话说得好。数据质量未必是数据治理中最重要的一部分,但是数据质量可能是让数据治理工作全部崩盘的第一步。所以
  • 2023-06-30R语言之文本分析:主题建模LDA|附代码数据
    原文链接:http://tecdat.cn/?p=3897最近我们被客户要求撰写关于主题建模LDA的研究报告,包括一些图形和统计输出。文本分析:主题建模 library(tidyverse)theme_set( theme_bw())目标定义主题建模解释LatentDirichlet以及此过程的工作原理演示如何使用LDA从一组已知主题
  • 2023-01-19Mockito Java 测试框架
    Mockito是一个针对Java的mocking框架。它与EasyMock和jMock很相似,但是通过在执行后校验什么已经被调用,它消除了对期望行为(expectations)的需要。其它的mocking库
  • 2022-11-10拓端数据tecdat|R语言代写之文本分析:主题建模LDA
    文本分析:主题建模library(tidyverse)theme_set( theme_bw())目标定义主题建模解释LatentDirichlet分配以及此过程的工作原理演示如何使用LDA从一组已知主题中恢复主题结构
  • 2022-10-06dagster开源数据资产可观测平台调度平台
    dagster是基于python开发的数据调度平台,可以方便的处理数据的pipeline同时支持数据资产的可观测性而且还可以支持dbt处理参考架构  说明dagster支持的集成是
  • 2022-08-14Law of Iterated Expectations & Covariance
    LawofIteratedExpectations\(E[Y]=E_X[E[Y|X]].\)Thenotation\(E_X[.]\)indicatestheexpectationoverthevaluesof\(X\).Notethat\(E[Y|X]\)isafun