热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

adg架构设置及其在企业数据治理中的应用

本文介绍了adg架构设置在企业数据治理中的应用。随着信息技术的发展,企业IT系统的快速发展使得数据成为企业业务增长的新动力,但同时也带来了数据冗余、数据难发现、效率低下、资源消耗等问题。本文讨论了企业面临的几类尖锐问题,并提出了解决方案,包括确保库表结构与系统测试版本一致、避免数据冗余、快速定位问题等。此外,本文还探讨了adg架构在大版本升级、上云服务和微服务治理方面的应用。通过本文的介绍,读者可以了解到adg架构设置的重要性及其在企业数据治理中的应用。

本文主要分享【adg架构设置】,技术文章【adg不同系统_ADG 增强数据治理】为【汪希旧时光】投稿,如果你遇到相关问题,本文相关知识或能到你。

adg架构设置

背景

近年来,随着信息技术的发展,社会的信息化程度越来越高,企业的IT系统高速发展,渗透到企业的各个业务中,业务系统产生的数据也与日俱增。数据已经成为了企业生产的新动力,为企业的业务增长发挥着至关重要的作用。

企业在利用数据带来业务快速增长的好处,但同时也面临着数据冗余、数据难发现、效率低下、耗费资源等问题,越来越多的问题暴露出来,其中最尖锐的问题可以概况为以下几类:

一个业务系统经过反复几次迭代开发,由于开发人员经过了几次轮换,文档的缺失以及更新不及时,导致最终线上运行系统的数据库库表是怎么样的,没有人能说清楚?生产系统出现问题,开发人员如何读懂以前别人写的sql 处理逻辑,快速定位问题?开发人员为了开发新的需求,重复建立了大量的冗余表,导致数据利用的难度越来越大。

业务系统新版本上线,都会经过开发、系统测试。最后投产上线,如何确保最终投产上线的版本的库表结构与系统测试版本保持一致,避免投产问题出现?

业务系统进行大版本升级、上云服务和微服务治理改造,如何评估业务系统的现有情况和复杂程度?

企业的大数据平台虽然建立了,但各个系统仍然还是孤立建设,只做到了数据原封搬家,数据之间没有实现关联、互补,没有合理关联起数据间的关联,发现其隐含的数据价值,导致数据的利用率降低。

产品定位

为了解决企业面临的这些问题,天云数据公司设计研发了一款系统逻辑探查产品—ADG,基于图数据库使用点、边、属性来表示和存储元数据,建立起元数据的关联关系,打破原本孤立的数据孤岛,统一管理企业数据,让原本各自为政的数据关联起来,发挥出数据隐含的价值。

元数据关联关系分析——获取到数据源后,ADG产品通过SQL解析和图模型建立起统一的元数据关联关系;

元数据关系探查——利用图数据库的关联关系查找,逐层下钻,发现数据间的关联关系,不在让数据孤岛式存在,发挥出更多的数据价值;

系统血缘——构建库、表、字段间的血缘关系,并生成相应的系统血缘分析报告,指引系统升级、迁移、改造等。

设计理念及关键技术

在数据治理领域,一直以来,元数据的管理始终占据着重要的地位,传统方法遇到问题,新技术解决以上问题

大数据时代下,数据已被公认为一项重要的资产。而元数据管理作为数据管理框架中一项重要的管理职能,也越来越多的出现在大家的视野中。

商业价值

为集成开发环境简单性、可靠性、一致性和自定义性的提供保障。

将数据治理纳入系统或应用开发过程,进而企业可以实现更全面,可持续的数据治理计划。

向企业中的人员提供均可以使用的数据视图。

支持更广泛的业务需求及应用需求。

数据血缘和影响分析在治理和风险评估中体现了重要价值,为数据治理提供更直观的数据视图。

ADG如何构建完整数据视图

在应用调用时,常常通过三种方式对数据进行加工或使用,其中包括数据字典的引用,通过schema建立主键、外键及关联关系,及函数与存储过程对数据进行的转化更新。在ADG中,将这三种方式经过不同的拆分与处理,最终生成数据间的完整视图。

首先,通过对数据字典的定义及使用,创建适用于目标的数据体系的参考数据,其中涉及了可使用的元数据,数据类型及取值范围。

其次通过对schema、PK、FK等关联性的分析,对于原始数据库、表及字段的定义进行全面分解整合,通过主外键等关系找出表间存在的关联关系。与此同时,ADG根据不同的使用方式将其进行划分,最终生成数据库间、表间及字段间的七种数据关系。

再次,利用函数和存储过程发现数据转化更新的演变过程。根据两者的可重用性、共享性及可移植性,探索及还原了数据产生、演变、使用及消亡的生命周期。

最终通过以上三步的数据间关系分析,ADG从不同视角实现了对现有数据系统较为完整分解与转化,并且通过所捕获的信息构建了数据完整视图。

数据治理发展趋势的三个代际

第三代:数据治理的核心能力

Ⅰ、字符-【词向量】:用于字符型数据相似性分析。通过计算字符串转换次数,来进行相似度比较。其中转换操作包括替换、插入、删除等。通过计算操作次数,进而获得字符型数据间的相似程度。

Ⅱ、数值-数据冗余分析【相关系数】:用于数值型数据相关性,对当前数据表中的数据进行数值比较计算,计算数据表中数据冗余程度及数据分布情况。

Ⅲ、主体构建【机器学习】:利用机器学习的方式优化系统中的主数据。ADG从多个数据源获取数据,对已知数据进行分析与匹配,通过机器学习的方式,在构建数据实体。在此期间,为确保准确性,还通过自动化和协作的方式进行指定的数据校验。

Ⅳ、数据目录【人工智能】:ADG通过自动化和协作的方式对数据系统构建了数据目录,其通过业务元数据将技术元数据进行丰富,通过数据间的关联关系、数据间的相似性进行数据编目。

Ⅴ、图数据库:通过使用图数据库作为后端存储的一部分,更好的将数据实体与关系进行存储及使用,提高了数据服务效率。

ADG所解决的问题

数据可信度:提升数据的质量、准确性和安全性。

数据可访问性:对于不同人员数据人员,即数据管理者、使用者、运维人员,获取正确数据。

体现数据价值:对数据系统进行统一管理,增加数据使用的能力。

ADG产品功能概览

ADG产品优势

本文《adg不同系统_ADG 增强数据治理》版权归汪希旧时光所有,引用adg不同系统_ADG 增强数据治理需遵循CC 4.0 BY-SA版权协议。


推荐阅读
  • mysql 分库分表策略_【数据库】分库分表策略
    关系型数据库本身比较容易成为系统瓶颈,单机存储容量、连接数、处理能力都有限。当单表的数据量达到1000W或100G以后,由于查询维度较多, ... [详细]
  • API网关作为微服务架构中的关键组件,扮演着系统与外部世界交互的唯一接口角色。它不仅封装了系统的内部复杂性,还为不同客户端提供了个性化的API接口。本文将探讨API网关的重要性及其核心功能。 ... [详细]
  • 自SQL Server 2005以来,微软的这款数据库产品逐渐崭露头角,成为企业级应用中的佼佼者。本文将探讨SQL Server 2008的革新之处及其对企业级数据库市场的影响。 ... [详细]
  • 一面问题:MySQLRedisKafka线程算法mysql知道哪些存储引擎,它们的区别mysql索引在什么情况下会失效mysql在项目中的优化场景&# ... [详细]
  • 58同城的Elasticsearch应用与平台构建实践
    本文由58同城高级架构师于伯伟分享,由陈树昌编辑整理,内容源自DataFunTalk。文章探讨了Elasticsearch作为分布式搜索和分析引擎的应用,特别是在58同城的实施案例,包括集群优化、典型应用实例及自动化平台建设等方面。 ... [详细]
  • 获得头条Offer后,我感激的七个技术公众号
    是否感觉订阅的公众号过多,浏览时缺乏目标性,未能获取实质性的知识?本文将介绍如何精简公众号列表,提升信息吸收效率,并推荐几个高质量的技术公众号。 ... [详细]
  • 微服务架构详解及其入门指南
    本文详细介绍了微服务的基本概念、发展历程、与传统架构的区别及优势,并探讨了适合采用微服务架构的场景。此外,文章还深入分析了几个主流的微服务开发框架,特别是Spring Cloud的组成和特点。 ... [详细]
  • 一、Merge语句根据条件在表中执行修改或插入数据的功能,如果插入的数据行在目的表中存在就执行UPDATE,如果是不存在则执行INSERT:-避免了单独 ... [详细]
  • 本文详细介绍了Oracle数据库中审计日志(audit trail)的配置方法及各参数选项的功能,包括如何启用系统范围的审计记录,以及如何将审计数据存储在不同的位置和格式。 ... [详细]
  • 本文深入探讨了Redis中的两种主要持久化方式——RDB(Redis Database)和AOF(Append Only File),并详细解析了两者的实现机制、优缺点以及在实际应用中的选择策略。 ... [详细]
  • 深入解析《数据库重构:进化式数据库设计》
    最近了解到一个新概念——数据库重构,这让我感到非常惊讶。数据库竟然也可以像代码一样进行重构。为了深入了解这一领域,我特意借阅了《数据库重构:进化式数据库设计》这本书,并在此分享我的学习心得。 ... [详细]
  • 本文旨在探讨机器学习与数据分析之间的差异,不仅在于它们处理的数据类型,还包括技术背景、业务应用场景以及参与者的不同。通过深入分析,希望能为读者提供清晰的理解。 ... [详细]
  • 近期,公司在构建新的交易系统时遇到了一个常见的问题——金额存储。由于涉及资金的操作需要高度的准确性,使用float类型进行金额计算可能会导致不可预见的误差。本文将深入探讨这一问题,并提供解决方案。 ... [详细]
  • 学生信息管理系统架构设计与实现
    随着教育机构规模的扩大,学生人数的增多带来了信息管理上的挑战,传统的人工处理方式不仅耗时费力,且效率低下。为此,本文档提出了一种基于现代技术的学生信息管理系统的设计方案,旨在提高信息处理的效率和准确性。 ... [详细]
  • Spring Cloud Config: 高效统一的配置管理解决方案
    Spring Cloud Config 是一个用于集中管理和分发应用程序配置的工具,支持多环境下的配置管理(如开发、测试和生产环境),并且能够根据需求动态调整配置参数(例如,在大型促销活动期间增加数据库的最大连接数)。 ... [详细]
author-avatar
针箍投药_996
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有