根据以上分析,数据治理工作是一项影响广大深远而复杂长期的过程,牵一发而动全身,数据治理每项工作都牵扯到跨部门、跨系统的信息传递和资料共享,做好数据的管控工作首先需要大量的沟通和信息流转,没有技术平台来支撑各项数据治理的管控工作等于人体缺了中枢神经系统,举步维艰是必然的。而结合企业常见的数据治理领域重点工作,可以近期首先引入建设数据标准和元数据管理系统和数据质量管理系统,以下是我对这两个系统的建设内容的初步分析,各企业后续在项目建设要求和需求分析阶段还要逐步做更全面的补充。
一、数据标准和元数据管理系统:通过建立一整套数据规范、管控流程和技术工具来确保企业各种重要信息资产和数据资源,包括产品、客户、机构、账户等信息在企业内外使用和交换的表达上是一致和准确的,数据标准可分为技术标准和业务标准。针对企业现有情况,针对标准不统一的问题,通过在数据治理平台首先把所有数据资源的图纸---元数据资源集中管起来,然后建立各系统元数据资源和数据标准要求清晰的对照关系,依此扎扎实实地实现数据标准管理功能落到各系统的数据模型设计细节。提供管理业务、技术元数据,支持数据溯源,有效支持企业“数据标准管控委员会”开展工作。对于已建和在建的各系统,通过这个平台汇总的数据模型资料对其设计的数据模型做好数据标准检查工作,针对信息要素中的数据字段比对标准的业务定义,补充完善标准的技术定义,让企业《企业数据标准》成为一个活学活用的标准,并且在使用中不断完善。
二、数据质量管理系统,这个系统有四方面的建设内容:一方面要建设企业级数据质量管理,覆盖对企业所有数据的质量管理活动,为所有数据质量治理活动的相关用户提供统一的入口,对数据质量问题做到全程追踪和监控,对数据质量管理流程达成全面支撑;第二方面要建立全企业统一的数据质量检查机制,通过配置和导入数据质量校验规则,执行常态化的数据质量例行检查,生成数据质量报告,辅助数据质量评估和考核,以此从源头推动生产数据的创建者重视采集数据的质量,结合元数据管理中的数据溯源,也有助于分析和反映有关质量问题的影响冲击面,让大家直观看到数据质量问题的危害。第三方面要建立数据质量管理系统与数据标准和元数据管理系统的交互,通过元数据集中管理数据质量规则,并建立数据质量规则与其它元数据的关联关系,使数据质量管理的分析和应用能够得到元数据的支撑。第四方面就是数据源采集要建立数据质量管理系统和数据仓库/ODS系统的交互,为了避免数据治理平台陷入大量的数据采集工作,我们初步设想通过数据仓库/ODS作为统一的数据源归集,由数据仓库/ODS根据各数据源系统一模一样的数据模型和数据内容建立每日业务数据镜像库,通过执行本平台根据管理生成的质量检查规则所提供的质量检查脚本对每日业务数据用批量方式进行全样数据质量检查,并生成质量评估报告。
业界的数据治理平台厂商目前能提供的工具平台已经比较成熟,功能性能各有千秋、各有特色,不过基本都是采用开放的技术架构和接口设计,实施上不会存在技术方面和企业各种现有信息系统资源不能接驳的问题。
想要了解更多政策信息可以咨询中培课程顾问李老师18911709446(同微信)