转帖 企业数据仓库-东方国信(转帖是什么意思啊)

fangcloud 522 2022-07-31

本文转载自网络公开信息

概述

企业数据平台是商业智能体系的基础,通过建立层次化的数据仓库体系结构、统一的数据模型,整合企业生产系统的数据,从而为数据分析平台和CRM 等上层应用提供数据支撑。企业数据平台沉淀了企业多年来的生产经营数据,数据按照存储粒度分为细节级、轻度综合级、汇总级,其数据量通常非常庞大,少则几TB,多则上百TB,而且每天都有大量的生产数据被抽取、整合进入企业数据平台,并传送到数据分析平台和其他系统,以满足其数据需要。如此庞大的数据量、吞吐量和复杂的业务逻辑,对企业数据平台的存取效率、数据质量、易管理性,易维护性等均提出了很高的要求。公司在多年的数据仓库建设过程中研发出一套适用于电信行业的统一数据模型(该模型中的核心部分已经被中国联通作为数据仓库模型的标准规范)。基于统一数据模型、结合数据仓库技术、元数据技术,并对ETL 过程进行优化处理,公司实现了电信行业海量数据仓库的标准化构建和高效运转。

企业数据仓库(EDW)是企业分析型数据的统一存储,它和运营数据存储一起构成企业的统一数据平台。企业数据仓库在企业内部建立统一的数据架构和数据模型,沉淀来自运营数据存储、生产系统的数据,采用多维分析和数据挖掘手段,细分市场和客户,为企业内各个部门、各个层面的使用者的信息查询获取、经营分析、决策支持等需求提供全方位的数据支撑服务。企业数据仓库从根本上解决了沉淀数据分散重复、共享困难和信息孤岛问题,充分发挥数据资源价值,提高了企业在信息化建设方面的投资回报率。

系统架构

系统功能

1. 数据域划分

EDW的数据存储按域可以分为:客户域、产品域、市场营销域、服务域、业务域、竞争域。

客户域以三户模型为基础,客户域包含客户、客户对产品的订购等相关信息,如客户的基本属性、衍生属性,客户的消费、欠费、缴费、行为、结算、服务、产品订购和业务订购等。数据加工主要是以ODS 中的营业域、计费域、帐务域、结算域数据进行整合,按照分层次、分类别、多维度进行数据汇总。

产品域以产品模型为基础,包括产品的定价、产品基础信息、产品目录、产品生命周期、产品定位、产品营销等信息。数据加工以ODS 的营业域、计费域、帐务域、结算域等数据进行整合,按照分层次、分类别、多维度进行数据汇总。

服务域主要包含对主动服务和被动服务的信息的分析,包括服务能力、服务过程和服务结果等。数据加工在ODS 的客服域基础上进行主动服务和被动服务的数据汇总。

业务域从单一业务和组合业务的角度分析企业的经营信息,包含了各业务的发展、收入、使用等信息。数据加工在ODS 的客户域、营业域、计费域、帐务域、结算域等数据基础上,按照业务为主线进行分层次多维度数据汇总。

竞争域包含竞争对手及其产品、营销、发展、话务等信息。数据加工在ODS的客户域、营业域、计费域基础上,按照对端号码归属电信运营商进行多维度、分层次数据汇总加工。

2. 数据加工(ETL)

ETL 是英文 Extract-Transform-Load 的缩写,提供数据的抽取、转换和加载功能。从源系统中抽取目标数据,按照一定的规则进行清洗、集成、转换、汇总等处理工作,并将处理之后的数据加载到数据仓库的目标层中。为了利用目标数据仓库的并行处理能力,一般先抽取、加载,再做转换处理。

3. 数据模型支撑

企业数据仓库(EDW)是为了便于多维分析和多角度展现而将数据按特定的模式进行存储所建立起来的关系型数据库,它的数据基于OLTP 源系统。数据仓库中的数据是细节的、集成的、面向主题的,以OLAP 系统的分析需求为目的。星型模型聚合快、分析效率高,雪花型模型结构明确,便于与其他数据交互,所以EDW 一般采用星型、雪花型综合架构采用面向主题方式设计模型,采用自顶向下逐层分解方法设计企业数据仓库模型。主题域是模型针对的业务的某一关注领域或关注点,同一个域内的实体具有高内聚性,不同域的实体之间具有低耦合性。主题域的引入有助于建立模型框架的整体视图。

4. 元数据管理

元数据(Metadata)是关于数据、操纵数据的进程,以及应用程序的结构、意义的描述信息,其主要目标是使数据、程序具有自描述性,使数据、程序更易于管理和维护。在企业数据平台中提供统一的元数据管理手段,对数据库仓库中的元数据进行采集、存储、挖掘,支持查询、分析、维护等操作,使技术人员和业务人员可以统一地对数据仓库中的元数据进行管理和分析,从而更有效地理解和控制企业数据平台的运行。在元数据信息的基础上,通过数据稽核及稽核问题管理,实现对数据质量的管控。

1) 元数据采集、同步

指对表、视图、过程、方法等数据库对象进行扫描,获取各数据库对象所包含的元数据,将其存储于系统中。系统自动检查数据仓库中的对象,保持元数据同步,并建立元数据的版本管理。

2) 元数据关系分析

通过分析元数据信息,获取各数据对象之间的关系。元数据关系分析重点关注元数据的血统分析和元数据之间的影响分析。通过元数据的关系分析,提供冗余发现、流程优化、故障诊断等功能。

3) 数据稽核过程

包括稽核规则配置、稽核流程调度、质量报告异常统计等。支持对各种类型、各种粒度的数据对象采用多种稽核规则方法进行质量稽核。

4) 稽核问题管理

包括问题发现管理、问题发布管理、问题处理与跟踪过程管理等,支持对数据质量的流程化管理。

5) 稽核质量查询

系统按数据仓库的层次、主题域等自动生成数据质量报告,并支持以多种方式进行查询分析,为系统管理、优化、故障诊断提供依据。

[@more@]

本站部分文章、图片属于网络上可搜索到的公开信息,均用于学习和交流用途,不能代表亿方云的观点、立场或意见。我们接受网民的监督,如发现任何违法内容或侵犯了您的权益,请第一时间联系小编邮箱daifeng@360.cn 处理。
上一篇:Excel 工作表及单元格的创建与编辑附实例操作
下一篇:WPS里面添加的文本框填内容怎么不能直接在编辑栏里面输入=引用其他表格的内容的
相关文章

 发表评论

暂时没有评论,来抢沙发吧~