大家好,我是独孤风。
今天我们来聊一下另一个元数据管理平台Apache Atlas。Atlas其实有一些年头了,是在2015年的时候就开源。
相对于Datahub来说,Atlas显得有一些“老”了,社区也远没有以前活跃。
但是,从稳定性和与Hadoop生态的融合度的角度来说,Atlas目前还是无可替代的,现在很多企业生产环境也都是用的Atlas。
特别Atlas对Hive的原生支持,以及数据血缘的展示,非常的友好。!
本次Atlas发布了2.3.0版本,也进行了很多更新,比如发布了Python客户端,
对ES、Kafka等依赖进行了升级,对Docker支持进行了改进,
同时优化了多个页面,并且修复了大量的BUG。
所以,目前来看,对于基于Java技术栈开发,
并且使用Hadoop生态的企业,Atlas依然是元数据管理的最好选择。
Atlas 2.3.0更新日志
新增功能:
用于根据类型和属性搜索关系的 API 和 UI
改进方面:
术语表的处理性能大幅度改进 UI
改进以查看指标和统计数据,指标进行持久性存储
数据血缘 API 和 UI 的性能改进
Hive Hook和 import-hive 实用程序的多项修复和改进 支持启用身份验证的 Cassandra 作为审计存储 发布 Apache Atlas Python 客户端 0.0.12
依赖升级:JanusGraph、Elasticsearch、Kafka、Storm、TinkerPop、Gson、Spring Framework、Log4j
UI:修复和改进多个页面,如搜索、血缘、业务元数据 Docker 镜像:对 Docker 支持的改进
标签:Hadoop,Atlas,改进,数据管理,UI,Atlas2.3,Docker From: https://www.cnblogs.com/tree1123/p/17041400.html