你问我答2 - 关于CDH上的一些安全

时间：2022-12-11 22:37:06浏览次数：54

标签：keytab Ranger CDH 用户 hive 安全关于提交权限

就是假设 Hadoop 使用了 Kerberos 验证，且 Yarn 使用 LinuxContainerExecutor，那么当 NM 以提交 Job 的用户身份启动 Container 时，当前 Container 进程需要进行 Kerberos 验证么？

如果需要的话，它是 NM 的 keytab 进行验证呢，还是 Job 提交者 keytab 需要安装到所有 NM host 节点上？

你这个是个原理问题吧？如果cm启用kerberos，你提交作业其实不用管这些的呢。

嗯，是想把底层原理搞清楚；我们之前没上 Kerberos，计划要上，梳理过程中发现这个点有疑惑

比如 Hadoop 内部用户，hdfs、yarn、hive 这些都会在 Kerberos 中创建以及 keytab 分发到相应节点了，验证自然可以完成

而数据平台上层有很多用户，A/B/C/X...，这些用户提交的任务再 NM 节点上运行时，是怎么验证的呢？感觉如果也要把他们的 keytab 都分发到 NM 上那操作有点复杂了

你的问题其实就是在开启kerberos的环境中，用户提交作业后，用户跟集群里的服务是怎么认证交互的。主要是delegation token来解决这个问题的，跟A/B/C/X等用户的keytab已经没啥关系了，后面都是靠token来交互的。


https://blog.cloudera.com/hadoop-delegation-tokens-explained/

你可以参考一下关于token的介绍文档

1，在 Hive 中是建议关闭用户代理的，所有用户提交查询时 hiveserver2 先进行权限检查，通过之后以 hive 的用户身份提交 job 到 hadoop 中

2，另外还建议把 HDFS warehouse 路径的用户和组都设置为 hive，这样查询的 job 任务也只能有 hive 用户读写，整个数仓权限都统一由 hive 控制了

如果这样的话，其它 SQL 引擎（如 sparksql、presto、impala 等）上跑的 hive 仓库任务，该以什么用户身份执行呢？

Impala，提交的所有任务是以impala用户执行的，

a)如果是Sentry，而impala用户属于hive组，Hive仓库hive 组的是都有读写权限的，Sentry是RBAC模型，hive用户组一般都是放到admin这个role里的，相当于超级用户

b)如果是Ranger，Ranger时候ABAC模型，一般都是以user为单位设置权限，impala和hive用户一般都是设置到了所有database和所有table都有权限读写，也相当于是超级用户

SparkSQL作业是真实用户，

a)如果是Sentry，因为Sentry默认有HDFS ACL同步，只要在sentry中为执行作业的用户赋了hive表权限即可。

b)如果是Ranger，需要为执行作业的用户赋权hive表对应HDFS目录的权限，同时需要为该用户设置Hive表的权限，直接在Ranger中界面化设置即可。Ranger有新特性，RMS服务用来做HDFS ACL同步，但还是属于技术预览版，没那么成熟。

Presto与Spark SQL情况一样。

假设以 ranger 作为授权管理，对以上 sql 引擎提交任务用户授权 hdfs warehouse 路径，那么这些这些用户写入的数据文件用户属组就是实际用户而不是 hive；

这跟上面的建议就矛盾了

不矛盾，我在上面已经回答了，不管是sentry还是ranger，这三个组件执行作业的用户是同样的原理。

标签：keytab,Ranger,CDH,用户,hive,安全,关于,提交,权限
From： https://blog.51cto.com/u_14049791/5928769

你问我答3 - 关于Hive CLI与Beeline
请教一下，这个是cdp测试过程中，我这边想把hive命令默认client改为原来的hivecli，修改了use_beeline_for_hive_cli为false后,命令输入hive报了java.lang.NoClassDefFoundError:......
【博学谷学习记录】超强总结，用心分享|安全测试部分总结
一、安全测试介绍概念：安全测试就是发现软件安全漏洞的过程，旨在保护软件系统的数据与功能安全测试以破坏系统的安全策略为目标进行攻击，从而检查系统的漏洞或薄弱环节对软......
Linux基础第十章：系统安全及应用
目录一、账户安全措施1、账户管理2、锁定配置文件3、清除历史记录二、sudo1、sudo概念及优点2、使用sudo3、sudo实操演示4、设置sudo别名5、sudo特别注意......
信息服务上线渗透检测网络安全检查报告和解决方案
项目场景在健康云信息服务上线后，通过专业的网络安全团队，对系统进行全面的检测。渗透检测结果显示系统存在明显漏洞：文件上传漏洞、手机验证码发送接口流控功能、SQL注入漏洞......
记录下关于微信h5支付那点事儿（百分之80拷贝官方）
LZ-Says：困意上来，感觉简直痛不欲生~生亦何欢~！！！前言这俩天在玩微信的H5支付，不得不说，腾讯出品，Enmmm，懂就好。。。原想着这是一件很easy的东西，WebView加载一个地址不久好了，enmmm......
实验二电子传输系统安全-gmssl证书
任务片段gmssl安装部署gmssl搭建微型CA（单根CA层次模型）对CA基本参数进行配置mkdircertsclrnewcertsprivatetouchindex.txttouchindex.txt.attrecho"01">s......
CISP中关于PING的一个题目
CISP练习题中，关于PING的一个题目：这个题目应该答案是B：TTLBriefTTL是IP协议包中的一个值，它告诉网络路由器包在网络中的时间是否太长而应被丢弃。有很多原因使包在一......
ToDesk企业版使用测试：破解企业远程办公难题，更安全更高效
前言远程控制这个词大家应该都不陌生了，可以说是已经成为了我们日常生活和工作的重要工具。但是目前大多数人接触到的都是针对个人用户的远程控制软件，其实现在对于企业来说，将......
ArgoDB 5.1 正式发布：多模融合、实时分析和数据安全多重升级
TranswarpArgoDB是星环科技自主研发的高性能分布式分析型数据库，在PB级数据量上提供极致的数据分析能力。ArgoDB支持标准SQL语法和分布式事务，提供高并发高速数据......
网络安全中接口测试的解决方案
Eolink新一代API测试神器一、接口测试1、接口2、接口测试二、网络安全中的接口测试，具体场景1、接口安全测试2、传统测试工具......

你问我答2 - 关于CDH上的一些安全

相关文章

赞助商

阅读排行