创建并运行hive脱敏任务-凯发k8国际娱乐官网入口
创建hive脱敏任务后,可以对hive类型数据的敏感信息进行脱敏。
本章节将介绍如何创建hive脱敏任务。
前提条件
- 已完成云资源委托授权,具体请参见云资产委托授权/停止授权。
- 已授权hive数据库,具体请参见授权大数据资产。
- 已在“敏感数据识别”中完成了敏感数据识别,具体操作请参见新建敏感数据识别任务。
约束条件
数据源目前仅支持“hive”。
创建并运行hive脱敏任务
- 。
- 单击左上角的,选择区域或项目。
- 在左侧导航树中,单击,选择 。
- 在左侧导航树中选择“hive”页签,进入“hive脱敏”页面。 ,并选择
- 在“hive脱敏”页签中,单击,将“hive脱敏”设置为,开启hive脱敏。
- 单击“新建任务”,进入“数据源配置”页面,如图1所示,具体参数说明如表1所示。
图1 数据源配置-hive脱敏任务
表1 数据源配置参数说明 参数名称
参数说明
任务名称
您可以自定义脱敏任务的名称。
任务名称需要满足以下要求:- 1~255个字符。
- 字符可由中文、英文字母、数字、下划线或中划线组成。
数据源选择
选择数据来源。仅支持“hive”。
数据源
说明:如果没有可使用的hive数据库实例,可单击“授权数据库”,授权数据库,具体的操作可参见授权大数据资产。
数据库实例:选择脱敏数据所在的数据库实例。
数据库名:选择脱敏数据所在的数据库名称。
数据表名:选择脱敏数据所在的数据表名称。
勾选后将该列数据拷贝到目标数据库。
- 单击“下一步”,进入“脱敏算法配置”页面,如图2所示。
图2 脱敏算法配置-hive脱敏任务
- 勾选需要脱敏的数据列。
- 选择脱敏算法。脱敏算法更多详细信息请参见配置脱敏规则。
- 单击“下一步”,进入“脱敏周期”页面,配置脱敏周期。
图3 脱敏周期
选择并设置脱敏任务的执行周期:
- 手动:由用户自行启动的,且基于脱敏规则执行脱敏任务。
- 每小时:每几个小时执行一次脱敏任务。
示例:如果需要每2小时执行一次脱敏任务,则此处设置为:02:00
- 每天:每天几点几分执行一次脱敏任务。
示例:如果需要每天12:00执行一次脱敏任务,则此处设置为:12:00:00
- 每周:每周几的几点执行一次脱敏任务。
示例:如果需要每周一的12:00执行一次脱敏任务,则此处设置为:每周一12:00:00
- 每月:每月几日几时执行一次脱敏任务。
示例:如果需要每月12日的12:00执行一次脱敏任务,则此处设置为:每月12日12:00:00
如果设置每月31日执行一次脱敏任务,在当月日期少于31日的情况下,系统自动在当月最后一日执行任务。
- 单击“下一步”,进入“数据目标配置”页面,如图4所示。
图4 数据目标配置-hive脱敏任务
- 选择数据库实例、数据库名,并输入数据表名。
如果输入的数据表名已存在,系统将刷新目标数据库中该数据表中的数据。
如果输入的数据表名不存在,系统将自动在目标数据库中新建该名称的数据表。
如果需要填写已有的数据表,请勿选择业务数据表,以免影响业务。
- 设置数据目标列名。
系统默认将生产与数据源列相同的名称,您可以保持默认名称,也可以根据需要进行修改。
- 选择数据库实例、数据库名,并输入数据表名。
- 单击“完成”,完成脱敏任务的创建。
- 进入“hive”页签,在目标脱敏任务的“操作”列,单击“立即运行”。
- 运行后,系统开始按照设置的脱敏周期执行脱敏任务。
查看hive脱敏任务运行状态
- 进入“hive”页签,单击目标脱敏任务前面的,查看脱敏任务运行状态,如图6 elasticsearch脱敏任务运行情况所示。
运行“状态”说明如下:
- 已完成:脱敏任务已完成运行,且运行成功。
- 运行中:脱敏任务正在执行中。
- 待运行:脱敏任务未运行。
- 已停止:用户已手动停止脱敏任务的运行。
- 运行失败:脱敏任务运行失败。
图5 hive脱敏任务运行状态
编辑和删除hive脱敏任务
等待运行或运行中的脱敏任务不支持编辑或删除。
- 在hive脱敏任务列表中,在目标脱敏任务的“操作”列,单击 ,可修改脱敏任务配置信息,配置脱敏任务信息请参见创建并运行hive脱敏任务。
图6 编辑hive脱敏任务
- 在hive脱敏任务列表中,在目标脱敏任务的“操作”列,单击 。
图7 删除hive脱敏任务
脱敏任务删除后不支持恢复,建议您谨慎操作。
意见反馈
文档内容是否对您有帮助?
如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨