本文将为您介绍经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。
1
bigdata-growth
-
更新时间:2024-11-14
-
访问地址: GitHub
-
描述:
大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。
-
数据集网址:
https://github.com/collabH/bigdata-growth
2
Database-Notes
-
更新时间:2024-11-21
-
访问地址: GitHub
-
描述:
深入浅出数据库存储:数据库理论、关系型数据库、文档型数据库、键值型数据库、New SQL、搜索引擎、数据仓库与 OLAP、大数据与数据中台。
-
数据集网址:
https://github.com/wx-chevalier/Database-Notes
3
bigdata-hub
-
更新时间:2024-03-02
-
访问地址: GitHub
-
描述:
数据建设与大数据技术知识体系,包含hadoop、hive、spark、flink主流框架和系列框架,数据中台、数据湖、数据治理、数仓建设、数据化转型等
-
数据集网址:
https://github.com/fancyChuan/bigdata-hub
4
lacus
-
更新时间:2024-12-17
-
访问地址: GitHub
-
描述:
Lacus是一个开源大数据平台项目,主要解决大数据采集、存储、分析与计算问题,主要包括元数据、数据采集、数据服务、数据开发。
-
数据集网址:
https://github.com/eyesmoons/lacus
5
IofTV-Screen-Vue3
-
更新时间:2024-08-30
-
访问地址: GitHub
-
描述:
一个基于 vue3、vite、Echart 框架的大数据可视化(大屏展示)模板
-
数据集网址:
https://github.com/daidaibg/IofTV-Screen-Vue3
6
spark-yun
-
更新时间:2024-12-17
-
访问地址: GitHub
-
描述:
至轻云是一款超轻量级的企业级大数据计算平台,基于Spark生态精心打造。一键部署,开箱即用,轻松满足大数据处理需求。支持快速实现离线ETL、Spark计算、实时计算、可视化调度、自定义接口、数据大屏展示以及分享表单等多种功能,为企业提供高效便捷的大数据解决方案。
-
数据集网址:
https://github.com/isxcode/spark-yun
7
AntJob
-
更新时间:2024-12-17
-
访问地址: GitHub
-
描述:
分布式任务调度系统,纯NET打造的重量级大数据实时计算平台,万亿级调度经验积累!面向中小企业大数据分析场景。
-
数据集网址:
https://github.com/NewLifeX/AntJob
8
ezdata
-
更新时间:2024-12-02
-
访问地址: GitHub
-
描述:
基于python和llm大模型开发的数据处理和任务调度系统。 支持数据源管理,数据模型管理,数据集成,数据查询API接口,低代码自定义数据处理任务模版,单任务及dag任务工作流调度等功能。集成了llm模块实现rag知识库问答,链接各数据源数据进行数据对话问答,交互式数据分析功能。
-
数据集网址:
https://github.com/xuwei95/ezdata
9
cube-studio
-
更新时间:2024-12-17
-
访问地址: GitHub
-
描述:
cube studio开源云原生一站式机器学习/深度学习/大模型AI平台,支持sso登录,多租户,大数据平台对接,notebook在线开发,拖拉拽任务流pipeline编排,多机多卡分布式训练,超参搜索,推理服务VGPU,边缘计算,serverless,标注平台,自动化标注,数据集管理,大模型微调,vllm大模型推理,llmops,私有知识库,AI模型应用商店,支持模型一键开发/推理/微调,支持国产cpu/gpu/npu芯片,支持RDMA,支持pytorch/tf/mxnet/deepspeed/paddle/colossalai/horovod/spark/ray/volcano分布式
-
数据集网址:
https://github.com/data-infra/cube-studio
10
xl-lighthouse
-
更新时间:2024-12-17
-
访问地址: GitHub
-
描述:
XL-LightHouse是一套支持超大数据量、支持超高并发的通用型流式大数据统计系统【同时支持单机版】。常见的应用场景包括:PV、UV统计;电商销售额、下单用户数统计;日志量统计;接口调用量、异常量、耗时情况统计;服务器运维指标监控等功能。系统支持多维度统计,支持各种复杂的条件筛选和逻辑判断,一键部署,一行代码接入,轻松实现各种海量数据实时统计,帮助企业以更低的成本快速搭建起数据指标体系。
-
数据集网址:
https://github.com/xl-xueling/xl-lighthouse