随着市场竞争的日趋激烈,商业活动也变得越来越复杂,企业对信息的依赖性也变得越来越高,对信息的处理和利用能力的强弱决定了企业的兴衰成败,因此企业对决策的准确性和及时性的要求也越来越高,充分利用、挖掘企业现有的海量数据,能够帮助企业做出更好的商业决策,使得在提供多维数据集中数据的关系系统方面的投资产生更高的回报,从而提高企业的竞争力。
1 数据仓库
数据仓库是一个面向主题的、集成的、与时间相关、稳定的数据集合,用于支持管理决策。数据仓库将来自于一个或多个数据源的数据根据不同的主题进行存储,并对原始数据进行抽取、转换和加载等一系列筛选和清理工作。数据仓库是BI的核心,它的性能高低直接决定了BI的表现。
数据仓库具有以下特征:1)面向主题性:要求数据仓库中存储的不是以应用划分的数据而是以业务内容划分的数据,建立可独立维护的良构的主题数据库;2)数据集成性:要求数据仓库中的数据采用统一的编码方式,对原有的分散的数据库中的数据进行抽取、加工、汇总、消除数据的不一致性后进入数据仓库;3)非易失性:在数据进入数据仓库之后并不进行一般意义上的数据更新操作,被长期保留,以便为决策者提供决策分析数据,所涉及到的操作主要是查询;4)反映历史变化:数据仓库中的数据通常反映的是历史信息,只增不删,使数据仓库中的数据总是拥有时间维度,使决策者通过这些信息,对企业的发展历程和未来的发展趋势做出定量分析和预测。
数据仓库的关键技术可分为数据抽取(将OLTP系统中数据按照数据仓库的格式组织数据)、数据清洗(去除数据的不一致性,并去除与分析无关或不利于分析的数据)、数据转换(将来源不同的分散数据集成并转换以供分析使用)、数据装载和维护(周期性的加载新数据,刷新当前数据,并重新计算以供决策使用)等。
图1 数据仓库的实现过程
2 多维数据集
多维数据集是OLAP中的主要对象,是一项可对数据仓库中的数据进行快速访问的技术,多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。度量值是用户将要分析的数值数据,而维度则是度量值将要被深化的类别,维度是可以分层的。多维数据集是由关系数据库中的一组特殊表创建的,这些表是事实数据表和维度表。
1)事实表,每个数据仓库都包含一个或多个事实表,事实表通常包含大量的行,主要特点是包含数字数据(不包含描述性的信息)。这些数字信息可以汇总,以提供企业作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键;
2)维度表包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息,维度表包含帮助汇总数据的特性的层次结构。
3 构建多维数据集
3.1 构建数据仓库
以商品销售管理数据库为例构建数据仓库,在商品销售管理数据库中包含很多表,通过ETL完成数据抽取、清洗和转换以构建商品销售管理数据仓库,如表1。
表1 商品销售管理数据仓库
在此系统中,如果对数据仓库中所存放的历史数据进行分析和集成,就可以分析出各个国家每个季度的销售情况,甚至可以进一步深化到每个城市每个月的销售情况,根据所获得的结果,做出合理的决策。通过对商品销售管理系统的需求分析,确定以产品销售分析为主题,以产品销售的地理位置和时间等为数据仓库的索引基准点,以上索引基准点都可以作为商品销售管理的数据仓库维度,而产品的销售情况为事实表。
3.2 确定维和度量值
在实际决策过程中,决策者往往希望能从多个角度观察多个指标的值。并且找出这些指标之间的关系,这些观察数据的角度叫做维。根据此系统的需求,关于销售管理数据将从员工、时间、地理位置,供货商,销售额等角度展开,通过对商品名称销售的国家、时间段和销售额跟踪采集的数据可以导出各种商品在不同时间段、不同销售地点的销售额等度量值,根据这些度量值得到事实表。本系统的事实表是商品销售情况表,其中OrderDate属于时间维,ProductID属于产品维,EmployeeID属于员工维,ShipperID属于供货商维等。
3.3 为维度表选择属性
在完成事实表之后,就可以为维度表选择属性了,利用维度设计器可以很容易的从维度属性创建层次结构。在此为地理位置维添加属性,第一级别是国家,然后依次是省/州、城市、邮政编号,然后将其销售额汇总,从而得到决策者需要的信息,对于特定销售情况好的商品的城市,可以增加该商品供货,以满足销售需求,而对于销售情况相对较差的城市,决策者可以考虑减少供货,并采取积极有效的措施,如进行促销活动来刺激消费,从而增加销售量,提升利润。
4 结束语
多维数据集可以针对不同的维度进行多角度的分析,还可以对数据进行钻取、切片等,功能非常强大。对于EXCEL用户来说,可以使用透视表通过拖拽各个维度,从全方面多角度进行分析,多维数据模型为OLAM决策支持和分析系统的设计提供依据,对于决策分析非常实用。
核心关注:拓步ERP系统平台是覆盖了众多的业务领域、行业应用,蕴涵了丰富的ERP管理思想,集成了ERP软件业务管理理念,功能涉及供应链、成本、制造、CRM、HR等众多业务领域的管理,全面涵盖了企业关注ERP管理系统的核心领域,是众多中小企业信息化建设首选的ERP管理软件信赖品牌。
转载请注明出处:拓步ERP资讯网http://www.toberp.com/
本文标题:基于多维数据集的BI技术研究
本文网址:http://www.toberp.com/html/consultation/1081947002.html