数据治理003-数据域

ops/2024/10/20 2:46:11/

数据仓库是面向主题(数据综合、归类并进行分析利用的抽象)的应用。

数据仓库模型设计除横向的分层外,通常也需要根据业务情况进行纵向划分数据域数据域是联系较为紧密的数据主题的集合,通常是根据业务类别、数据来源、数据用途等多个维度,对企业的业务数据进行的区域划分,将同类型数据存放在一起,便于快速查找需要的内容。
不同使用目的数据,分类标准不同。例如,电商行业通常分为交易域、会员域、商品域等。

什么是数据域

数据域是对数据的领域划分,这种划分使得数据域在一个大的上下文中形成一个较为明显的边界。这种划分的依据或者角度是不同的,比如可以从业务的角度,也可以从数据治理的角度等。但这些角度本质可能是互通的,因为最终的结果和目的可能是相同的。

另外我们常听到的关于数据域就是领域建模、领域驱动设计。其理论是一样的,只是上下文粒度、边界发生了改变。

下面从企业的业务和数据管理的角度对企业的数据域进行划分:

客户
产品
销售

以上的数据域之间存在关联关系,事实上也反映一定的流程。

下面我们从金融行业的角度对数据域进行划分:

主体
品种
交易

数据域的基础上,我们通常会划分子域。这些子域一般由某一个特定的业务流程或环节所定义,也有可能是两个数据域之间的关系所定义。当然有些子域会上升到域的层级进行管理,如订单、合同。当然不同行业、不同企业对数据域和子域的划分是不同的。

为什么要划分数据域

系统设计:每个行业、企业都会有数据域的划分,有一些行业已经成为规范,用于指导行业的系统建设。
数据管理和治理:帮助企业进行数据管理和治理,形成企业自身的数据资产,如主数据、主题域的划分。
数据架构:有一些规模较大的企业也形成了自己的数据域划分,这有利于企业内部的系统设计和架构(数据中台、数仓等)。
模型设计:领域建模。
数据解耦:系统的设计不仅要从功能上解耦,也要从数据上解耦。
微服务架构:对于微服务得架构,我们更多的是从业务或应用上进行划分,数据上的解耦也为我们对微服务得设计提供了一种思路或验证。

数据域划分原则:全局性、可理解性和数量适中。

作者:PM产品笔记
链接:https://www.jianshu.com/p/6c7e1b2b2714
来源:简书
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

数据域(Domain)、数据类型(Data Type)及数据标准概念

常常听到大家对数据域(Domain)、数据类型(Data Type)及数据标准概念的混淆。
特以此文将这几个概念详细讨论一下。

为了更好的帮助大家理解数据域、数据模型、元数据之间的关系,首先我们以图示来表达它们之间的关系:
在这里插入图片描述
数据域(Domain)也称值域。域是用来描述一个字段的技术属性的集合,包括数据类型,数据长度,小数点位数以及取值范围等。具有以上技术属性相同定义的字段可以包含进一个域,而当域的属性定义发生改变时,所有引用它的字段的属性都会对应进行提示。

数据标准

数据标准通常包括技术属性、业务属性与管理属性。数据域对应的是其中的技术属性部分。

通过落标数据标准到数据模型,之后将数据模型由逻辑模型派生到物理模型,最终落地到数据库schema。

定义数据域,可以实现多个实体的属性共享,这在模型设计中非常重要。

以“国家”数据域的定义为例:“居住地”、“出生地”、“国籍”三个实体中都有“国家”属性,我们就可以定义一个“国家”域,分别附加到三个实体中。这样,修改域的同时,使用域的实体的相关属性也会随之更新。
数据域的操作
定义“国家”数据域的技术属性:数据类型、长度、精度、非空。
在这里插入图片描述
定义“国家”数据域的标准代码值:
在这里插入图片描述

数据域的应用场景

应用数据域到数据模型的实体属性
在设计数据模型添加属性的类型和取值范围、约束条件时,对于相同类型的属性,不需要逐个去设置相同的取值范围、约束条件等。只需把该类型的定义在数据域数据标准)中,添加实体属性时,填写关键词,并选择联想的数据标准,则该字段的类型、约束等将自动应用为该域的设定值。
如下图所示,从关键词联想的下拉列表中选择一个数据标准
在这里插入图片描述
多个字段引用同一个数据域
在这里插入图片描述

建设数据域的经验分享

01数据域的量够不够

完成基本的覆盖度即可启动
建立上下互动,让数据域生长起来
在这里插入图片描述
建立贡献激励制度

02使用数据建模工具提高开发效率

拖拉拽的方式用数据标准组装模型,根据输入智能推荐数据标准,批量智能匹配数据标准
检索模型库快速定位高质量模型及关联库表,可直接应用到自己的模型设计
一致性验证及应用
在这里插入图片描述

03核标验标,形成闭环

在这里插入图片描述

对几千上万张表的划分(一种思路)

有几点需要注意的地方
1.不重不漏,确保每个表都在一个域里,且只在一个域里(精确定位)
2.每个域下都可以根据需要再分子域,不限定层级(最自由方便)
3.如果分子域就不能放表,表只放在最底层的域中(树状目录管理时更方便)
4.最好保证每个域下的子域数量或表数量在20个左右(太多了不方便记忆管理,太少了没必要划分)
5.【其他】很好用,不好划分的都放里面(减少域层级数量有理由理解记忆)
6.数据团队分域可以作为分工的标准(数据不重、分工明确、界限清晰)
7.数据团队分域后,可以决定域内表的中间命名(看到表名时可以理解更多信息)


http://www.ppmy.cn/ops/118067.html

相关文章

some 牛课题

D-Cidoai的字符集合_牛客练习赛128 (nowcoder.com) #include "bits/stdc.h" #define int long long using namespace std; int fa[100000000]; int sz[100000000]; int find(int n) {if(n!fa[n])fa[n]find(fa[n]);return fa[n]; } map<string,int>mp; signed …

ArcGIS Desktop使用入门(三)常用工具条——拓扑(上篇:地图拓扑)

系列文章目录 ArcGIS Desktop使用入门&#xff08;一&#xff09;软件初认识 ArcGIS Desktop使用入门&#xff08;二&#xff09;常用工具条——标准工具 ArcGIS Desktop使用入门&#xff08;二&#xff09;常用工具条——编辑器 ArcGIS Desktop使用入门&#xff08;二&#x…

H.264与H.265

在使用海康平台做涉嫌头配置时&#xff0c;有H.264和H.265。大家可能搞不清楚两者的区别&#xff0c;下边我们来看一下H.264和H.265的区别。 H.264与H.265的区别 压缩效率&#xff1a; H.264&#xff1a;由于算法优化&#xff0c;H.264可以在低于1Mbps的速度下实现标清数字图像…

【递归】8. leetcode 671 二叉树中第二小的节点

题目描述 题目链接&#xff1a;二叉树中第二小的节点 2 解答思路 注意这句话&#xff1a;该节点的值等于两个子节点中较小的一个 二叉树的根节点的值是整棵树中最小的值 本道题所要求的是二叉树中第二小的节点。因为根节点是最小的节点&#xff0c;那么我们只需要找到第一…

Android面试必备知识:Android络访问框架对比(特点、使用高级技巧、使用场景)

目录 1 综合对比 2 Android网络访问框架基础理论 2.1 原生HttpUrlConnection 2.1.1 基本原理 2.1.2 优缺点分析 2.2 Android-async-http框架 2.2.1 特点与优势 2.2.2 使用场景 2.3 Volley框架 2.3.1 架构设计 2.3.2 性能特点 2.3.3 适用场景 2.4 Retrofit框架 2.4…

node.js + vue

安装Node.js和vue-cli 参考https://mp.csdn.net/mp_blog/creation/editor/142427043 生成Vue demo和编译Vue来生成静态文件&#xff08;包括index.html&#xff0c;js文件等等&#xff09; 参考https://mp.csdn.net/mp_blog/creation/editor/142427043 生成一个nodejs serve…

别再使用[]来获取字典的值了,来尝试一下这些方法

字典 在Python中&#xff0c;字典&#xff08;Dictionary&#xff09;是一种非常灵活的数据结构&#xff0c;用于存储键值对&#xff08;key-value pairs&#xff09;。每个键都是唯一的&#xff0c;并且与某个值相关联。字典是Python中处理映射关系&#xff08;即一个键对应一…

OJ在线评测系统 在Linux虚拟机搭建Docker 概念 入门 安装

Docker的基本概念 为什么要用docker容器技术 为了提升系统的安全性 把不同的程序和宿主机进行隔离 使得某个程序 应用的执行不会影响到系统本身 docker技术可以实现程序和宿主机的隔离 容器可以理解成对一系列应用程序、服务和环境的封装 从而把程序运行在一个隔离的 封闭…