APACHE-ATLAS-2.1.0简介(二)

news/2025/2/12 8:07:31/

APACHE-ATLAS-2.1.0简介(一)

什么是元数据?

元数据(METADATA),用一句话定义就是:描述数据的数据。元数据打通了数据源、数据仓库、数据应用之间的壁垒,记录了数据从产生到消费的全过程。

ATLAS的问题列表

APACHE-ATLAS-STACKOVERFLOW

APACHE-ATLAS-2.1.0的版本依赖

Use Hadoop 3.1, Hive 3.1, HBase 2.0, Solr 7.5, Kafka 2.0, JanusGraph 0.5.1, Tinkerpop 3.4.6, Spring Framework 4.3.20

ATLAS的特性

(1). 元数据类型 & 实例

  • 内置各种Hadoop和非Hadoop元数据的预定义类型;
  • 能够为要管理的元数据自定义新类型;
  • 类型可以具有原始属性,复杂属性,对象引用,可以继承其他类型;
  • 类型(type)实例(称为实体entities)捕获元数据对象详细信息及其关系;
  • 提供可以更轻松地进行集成用于处理类型和实例的REST API;

(2). 分类

  • 能够动态创建分类 - 如PII,EXPIRES_ON,DATA_QUALITY,SENSITIVE;
  • 分类可以包含属性 - 例如EXPIRES_ON分类中的expiry_date属性;
  • 实体(entities)可以与多个分类(classifications)相关联,从而实现更轻松的发现和安全实施;
  • 通过血缘传播分类 - 自动确保分类在进行各种处理时遵循数据;

(3). 血缘

  • 直观的UI,用于在数据流转时,通过各种流程时查看数据;
  • 提供用于访问和更新血缘的REST API;

(4). 搜索/发现

  • 直观的UI,按类型(type),分类(classification),属性值(attribute)或自由文本搜索实体;
  • 提供丰富的REST API,可按复杂条件进行搜索;
  • SQL搜索实体的查询语言 - 域特定语言(DSL);

(5). 安全和数据屏蔽

  • 用于元数据访问的细粒度安全性,实现对实体实例的访问控制以及添加/更新/删除分类等操作;
  • 与APACHE RANGER集成可根据与APACHE ATLAS中的实体相关的分类对数据访问进行授权/数据屏蔽,如:
    – 谁可以访问分类为PII,SENSITIVE的数据;
    – 客户服务用户只能看到分类为NATIONAL_ID的列的最后4位数字;

ATLAS分类传播

分类传播,使得数据所关联的分类能够沿着血缘关系,从父类传递给子类。

  • 当给实体数据打上分类标签后,该实体数据的子也可以得到该分类标签;
  • 当更新实体数据上的分类标签后,该实体数据的子也会对应的修改这个分类标签;
  • 当删除实体数据上的分类标签后,该实体数据的子也会对应的删除这个分类标签;
  • 当父实体数据删除时,子类所得到的这个父类的所有分类标签也会被删除;
  • 当子类到父类之间的血缘关系被破坏时,子类也会失去父类的分类标签;
  • 虽然子类到父类之间的一条血缘链中断,但是只要还有另一条血缘链存在,且使得子类可以连接到父类,那么子类就能够保存从其父类继承来的分类标签。

ATLAS模块概述

在这里插入图片描述


http://www.ppmy.cn/news/88281.html

相关文章

App 软件开发《单选1》试卷及答案解析

App 软件开发《单选1》试卷及答案解析 注:本文章所有答案及解析均来自 ChatGPT 的回答,正确性请自行甄辨。 文章目录 App 软件开发《单选1》试卷及答案解析单选题(共计0分)1.angular ui-router中的关键词不包括&#x…

Niagara—— System和Emitter节点

目录 一,发射器节点 Properties Emitter Spawn Emitter Update Particle Spawn Particle Update Renderer 二,系统节点 Properties System Spawn System Update Niagara是按照从上到下按顺序,依次执行模块Module(可编程…

【TOOLS: Linux与windows及linux与linux之间文件传输常用方法及命令】

文章目录 1.1.1 Windows和VirtualBox(Ubuntu)之间文件穿传输方法1.1.2 SCP 文件传输方法1.1.3 FTP 文件传输方法 1.1.1 Windows和VirtualBox(Ubuntu)之间文件穿传输方法 1)设置 virtualbox 中的共享文件夹,用户可以在windows某个盘下创建自己的共享文件…

Java程序设计入门教程--变量和常量的声明与使用

目录 变量 常量 变量 声明 对于变量的定义,就是程序中值可以改变的量。 说明: (1)Java要求在使用一个变量之前要对变量的类型加以声明。 (2)Java中一个变量的声明就是一条完整的Java语句,所…

华为OD机试真题 Java 实现【查找充电设备组合】【2023Q1 100分】

一、题目描述 某个充电站,可提供n个充电设备,每个充电设备均有对应的输出功率。任意个充电设备组合的输出功率总和,均构成功率集合P的1个元素。功率集合P的最优元素,表示最接近充电站最大输出功率p_max的元素。 二、输入描述 输…

Tip5:针对Recursive STARK的哈希函数

1. 引言 Neptune和Polygon团队2023年论文《The Tip5 Hash Function for Recursive STARKs》。 当前面向arithmetization的哈希函数,主要有3种设计策略: 1)Marvellous设计策略(见2019年论文Design of symmetric-key primitives …

统计数据自动补全不存在日期 天

// 获取列表数据 sql SELECT FROM_UNIXTIME(add_time, ‘%Y-%m-%d’) add_time, attr_name, product_id, COUNT(*) total FROM cd_order WHERE pay_status 2 AND add_time > 1664616618 AND add_time < 1667295018 GROUP BY FROM_UNIXTIME(add_time, ‘%Y-%m-%d’) // …

ArrayList不同的接口实现类

package com.test.Test02;import java.util.ArrayList; import java.util.Collection; import java.util.LinkedList; import java.util.List;public class Test01 {//这是一个main方法&#xff0c;是程序的入口public static void main(String[] args) {//接口 实现类//Colle…