热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Ranger、LLAP管理SparkSQL权限配置

概述之前一直使用ranger管理hive的用户权限,现在系统要集成SparkSQL(thriftserver),但是在ranger下并没有SparkSQL的相关的插件,通过搜集HO
  1. 概述

之前一直使用ranger管理hive的用户权限,现在系统要集成SparkSQL(thriftserver),但是在ranger下并没有SparkSQL的相关的插件,通过搜集HORTONWORKS相关资料,可以给SparkSQL配置LLAP(关于LLAP的更多细节,查看https://cwiki.apache.org/confluence/display/Hive/LLAP),然后通过ranger的hive policy间接支持SparkSQL的用户权限管理。

2. 原理

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》 图-1

如图-1所示:

1)、SparkSQL接收到sql语句后,将该语句提交给HiveServer2

2)、Ranger 通过hive插件检查access policy,并告诉SparkSQL访问哪些表(列)不能访问哪些表(列)

3)、SparkSQL开始尝试通过LLAP从hdfs读取数据

4)、LLAP收到请求,检测到请求中包含没有权限访问的列,就停止处理该请求,同时返回一个权限异常给Spark

3. 配置

  • 环境

1)、HDP-2.6.3.0-235 with Spark2,non-kerberized 集群

2)、SPARK-LLAP:集群内部集成

  • 配置Hiveserver2 Interactive 服务

在Ambari中,定位到hive服务配置页,并且点击Enable Interactive Query:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

随后会跳出相关配置,这些配置和LLAP服务资源分配有关,可以保持默认,因为目前只是为了满足测试需要。

《Ranger、LLAP管理SparkSQL权限配置》

保存配置,确认,继续。

重启影响的服务。

定位到service summary tab页面,确保Hiveserver2 Interactive服务启动成功:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

  • 配置Spark2

在Ambari中,定位到spark2配置页

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》 spark2配置页

找到 Custom spark2-defaults,

点击 add property 并添加如下属性:

spark.sql.hive.hiveserver2.jdbc.url= jdbc:hive2://{hiveserver-interactive-hostname}:10500/

spark.hadoop.hive.llap.daemon.service.hosts=@llap0

spark.hadoop.hive.zookeeper.quorum={some-or-all-zookeeper-hostnames}:2181

找到 Custom spark2-thrift-sparkconf,

点击 add property 并添加和 Custom spark2-defaults相同的属性

找到 Advanced spark2-env,

给属性spark_thrift_cmd_opts设置值:–jars /usr/hdp/2.6.3.0-235/spark_llap/spark-llap-assembly-1.0.0.2.6.3.0-235.jar –conf spark.sql.hive.llap=true

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

注:在HDP-2.6.3已经内部集成了spark-llap,对于没有集成spark-llap的HDP版本,spark_thrift_cmd_opts值应该这样设置值:–packages com.hortonworks.spark:spark-llap-assembly_2.11:1.1.3-2.1 –repositories http://repo.hortonworks.com/content/groups/public/ –conf spark.sql.hive.llap=true

保存属性修改,然后重启影响的服务,完成。

  • 测试

1)、给默认database设置ranger权限(推荐)

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

之所以推荐这样设置是,因为连接ThriftServer的时候一般是jdbc:hive2://{thriftserver-host}:{thriftserver-port},如果没有登录default的权限,连接时将直接拒绝,更谈不上执行更多的任务。

2)、测试

我的hive中现有3个库:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

而用户**15698只对***_data_service有权限:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

现在用用户**15698连接ThriftServer,只显示***_data_service库:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

执行explain select,已经开始走LLAP权限验证:

《Ranger、LLAP管理SparkSQL权限配置》
《Ranger、LLAP管理SparkSQL权限配置》

测试完成。

4. 参考资料

hortonworks-spark/spark-llapgithub.com《Ranger、LLAP管理SparkSQL权限配置》
Error:”Unable to instantiate SparkSession with LLAP support because LLAP or Hive classes are not found” after upgrading from HDP 2.6.2 to 2.6.3 when starting Spark2 Thirft Server – Hortonworkscommunity.hortonworks.com
SparkSQL, Ranger, and LLAP via Spark Thrift Server for BI scenarios to provide row, column level security, and masking – Hortonworkszh.hortonworks.com《Ranger、LLAP管理SparkSQL权限配置》


推荐阅读
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • Go Cobra命令行工具入门教程
    本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中,如Kubernetes、Hugo和Github CLI等。通过使用Cobra,我们可以快速创建命令行工具,适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]
  • 如何查询zone下的表的信息
    本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求,并提供了请求示例。 ... [详细]
  • 在Docker中,将主机目录挂载到容器中作为volume使用时,常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法,包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法,可以避免在使用Docker时出现无写权限的情况。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • SpringBoot uri统一权限管理的实现方法及步骤详解
    本文详细介绍了SpringBoot中实现uri统一权限管理的方法,包括表结构定义、自动统计URI并自动删除脏数据、程序启动加载等步骤。通过该方法可以提高系统的安全性,实现对系统任意接口的权限拦截验证。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • Centos7.6安装Gitlab教程及注意事项
    本文介绍了在Centos7.6系统下安装Gitlab的详细教程,并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时,还强调了使用阿里云服务器时的特殊配置需求,以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]
  • HDFS2.x新特性
    一、集群间数据拷贝scp实现两个远程主机之间的文件复制scp-rhello.txtroothadoop103:useratguiguhello.txt推pushscp-rr ... [详细]
  • 本文介绍了一些Java开发项目管理工具及其配置教程,包括团队协同工具worktil,版本管理工具GitLab,自动化构建工具Jenkins,项目管理工具Maven和Maven私服Nexus,以及Mybatis的安装和代码自动生成工具。提供了相关链接供读者参考。 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • 本文介绍了如何使用C#制作Java+Mysql+Tomcat环境安装程序,实现一键式安装。通过将JDK、Mysql、Tomcat三者制作成一个安装包,解决了客户在安装软件时的复杂配置和繁琐问题,便于管理软件版本和系统集成。具体步骤包括配置JDK环境变量和安装Mysql服务,其中使用了MySQL Server 5.5社区版和my.ini文件。安装方法为通过命令行将目录转到mysql的bin目录下,执行mysqld --install MySQL5命令。 ... [详细]
  • 欢乐的票圈重构之旅——RecyclerView的头尾布局增加
    项目重构的Git地址:https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集:http:www.jianshu.comno ... [详细]
  • 本文讨论了编写可保护的代码的重要性,包括提高代码的可读性、可调试性和直观性。同时介绍了优化代码的方法,如代码格式化、解释函数和提炼函数等。还提到了一些常见的坏代码味道,如不规范的命名、重复代码、过长的函数和参数列表等。最后,介绍了如何处理数据泥团和进行函数重构,以提高代码质量和可维护性。 ... [详细]
  • 本文主要复习了数据库的一些知识点,包括环境变量设置、表之间的引用关系等。同时介绍了一些常用的数据库命令及其使用方法,如创建数据库、查看已存在的数据库、切换数据库、创建表等操作。通过本文的学习,可以加深对数据库的理解和应用能力。 ... [详细]
author-avatar
Dr_H-鄧
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有