数据仓库的类型
知识

数据仓库的类型

近年来,企业的电子商务已经不局限于流程是否顺畅、交易记录是否完整等单一系统的问题。它往往更加关注异构信息系统的集成,如何有效地收集和呈现数据,对企业的运营效率产生越来越具体的影响。数据仓库的概念是指仓库存储的概念。
出版日期:2022年12月22日
数据仓库的类型

什么是数据仓库?

数据仓库通常用于数据挖掘、商业智能,可以覆盖千山万水,也可以处理单一主题。近年来,企业的电子商务已经不局限于流程是否顺畅、交易记录是否完整等单一系统的问题。它往往更加关注异构信息系统的集成,如何有效地收集和呈现数据,对企业的运营效率产生越来越具体的影响。数据仓库的概念是指仓库存储的概念。它不仅存储物理的原材料和成品,还将抽象的文件数据集成到信息系统中,并将其转换为物理的数据仓库。

数据库、数据仓库和数据仓库系统的区别

数据仓库是存储大量数据的数据库,但它与数据库不同。存储在数据库中的数据是与操作相关的,数据仓库在数据积累一段时间后,将这些数据组织起来,传递给另一个数据系统进行数据分析。数据仓库通常是指存储集成数据的数据库,数据仓库系统一般是指整个决策支持系统,包括系统软硬件、数据和报表。

“数据仓库”一词是由Bill Inmon在1990年创造的,因此他被称为数据仓库之父。在《什么是数据仓库》一书中,他认为数据仓库的数据收集有4个特点。:面向主题、集成、时变和非易变。根据这些特点,数据仓库可以为决策管理系统提供数据进行处理。数据仓库的另一位代表人物Ralph Kimball在《数据仓库工具包》一书中认为,数据仓库是可以查询和分析的事务数据的结构化副本。

“面向主题”意味着数据仓库可以集中与特定主题相关的信息,而不仅仅是公司当前的运营信息;“集成”意味着存储在数据仓库中的数据是由不同来源的数据合并而成,并保持一致的组织;“随时间变化”表示数据仓库在特定时间点识别所存储的数据;“无损失”意味着数据仓库中的数据只会继续增加而不会被删除,这使得管理层能够获得业务连续性观察。

数据仓库的类型

数据仓库可分为企业数据仓库(EDW)、运营数据存储和数据集市。有人认为,除了企业数据仓库和数据集市之外,数据仓库还可以添加虚拟数据仓库和混合数据仓库。

  1. 企业数据仓库
  2. 企业数据仓库包含整个企业的信息,由客户、产品、业务等多个主题组成,可用于决策支持,包括实时信息和聚合信息。

  3. 操作数据提供者
  4. “操作”与数据仓库的信息量有关。ODS提供了详细的数据,特别是最近的合并数据,可以满足实时报告的需求。操作数据存储只能分析最近的数据,不能分析较长期的历史数据。Bill Inmon在1995年出版了《操作性数据存储》一书。他认为,ODS的数据收集是面向主题的、综合性的。但与数据存储不同的是,ODS的数据会丢失,以当前值为主。它不包含历史和累积数据,ODS数据可以实时收集和集成。根据数据同步更新的频率,ODS也有数据传输和存储调度的等级。

  5. 市场数据
  6. 与数据仓库的定义大致相同,数据仓库涵盖了整个公司的数据和人员,而数据集市只包含特定范围的数据,用户会锁定某个工作组的人员。一组数据集市可以形成一个企业数据仓库,反之亦然。假设公司采用多个数据超市同时存在的模式,同一维度数据定义的差异会使数据市场变成数据孤岛。数据孤岛对于整个企业来说是一个大问题。集成功能仅限于部门组,不能扩展到整体信息的集成。无法进行跨部门数据分析,无法将不同的工作属性进行关联。跨部门数据分析,以往的数据市场结构只能以堆叠的方式继续积累,无法整合。

    如今,数据仓库的建设仍然大多从数据集市开始,因为数据集市采用的维度模型比个体关系模型更容易理解,分析速度也更快,但仍然取决于企业和用户的需求。

  7. 虚拟数据仓库
  8. 企业直接使用现有的运营数据库,并辅助一些中介工具进行有效的数据处理。施工速度快,成功率高,可实现实时数据分析。

  9. 混合数据仓库
  10. 如果数据集市被表示为虚拟数据仓库,那么它就变成了混合数据仓库。需要的存储空间小于企业数据存储。由于数据已经存储在标准化的数据环境中,因此数据重组的过程将比通过应用程序读取运行数据更简单,并且不会影响运行数据。混合数据仓库还可以应对数据市场中遇到的数据孤岛现象,通过虚拟的方式灵活应对不同的需求。

  11. 数据仓库的好处
  12. 数据仓库可以实现跨数据源的集成,使不同数据库中的数据可以相互链接。信息系统的建立无疑解决了数据的定期输出和即时存储的需要。企业一旦要从信息系统中检索各种综合统计信息,就会马上面临数据源不同的问题,而且不可能同时跨系统。访问和进一步的自动化处理和分析是不可能的。数据仓库可以看作是提取数据的单一窗口。通过信息系统的自动转换,可以减少人工交换文件时出错的可能性。

总结

数据仓库的开发最初只需要对汇总数据进行审查,然后开始将每笔交易数据保存在数据仓库中,以分析客户群与产品之间的关系。目前,除了存储汇总数据和交易数据外,还保留了详细的数据来分析客户的购物行为。

这一历史过程表明,企业过去只想知道总营业额,现在更关心的是客户在交易过程中如何做出选择。

数据仓库经常与数据挖掘和商业智能相比较。当用于营销业务时,它可以用来了解顾客的习惯,让企业预测顾客的行为,以便进行适当的促销;在内部,数据仓库可用于内部操作。通过评估,高管可以从具体的数据和证据中找出经营状况不佳的症结所在。

2022年12月22日出版 来源:iThome

进一步的阅读

你也可能对……感兴趣。

标题
知识
焊接的基本原理及其各种类型
焊接是利用“热”和“电”将两块金属连接起来的过程,焊接金属的种类也会影响焊接效果和技术要求;和许多专业技能一样,焊接技术也有不同程度的难度。首先了解最常见的焊接类型介绍、原理教学、技能分析。
标题
知识
铣床中有哪些不同类型的切屑?
铣床是一种非常多样化的加工机器,由车床演变而来。车床是一种通常用于生产圆柱形或旋转零件的机器,铣床通常用于生产菱形或非旋转零件。
标题
知识
了解数控运动控制及其三种常见类型
所有形式的数控机床提供的第一个好处是提高了自动化程度,因为与生产工件有关的操作员干预可以减少或消除。
标题
知识
数控车床的用途和功能概述
车床是用车削工具车削旋转工件的机床。在车床上,钻头、铰刀、铰刀、丝锥、模具和滚花工具也可进行相应的加工。车床主要用于加工轴、盘、套等具有旋转表面的工件。它们是机械制造和修理厂中使用最广泛的机床。
标题
知识
金属需要表面处理的原因是什么?
金属相关的机械设备或零件在再加工过程中不可避免地会出现一些缺陷。因此,最后一项的表面处理程序非常重要,并进行表面美化和保护的功能,从而提高金属零件的性能,避免生锈。
标题
知识
什么是电火花加工和线切割电火花加工?以及它们的区别
一般电火花加工与线切割电火花加工有一定的区别。不同的加工技术适用于不同的工业制造需求。
标题
知识
什么是液体和粉末涂料?
希望进行表面处理的金属制造商应该了解两种最常见的表面处理替代方法——液体和粉末涂层,以及希望应用其中一种或两种方法的公司所涉及的要求。
标题
知识
全球激光产业趋势
为了响应国际产业需求的发展,激光产业和技术已经开始向5G半导体和智能汽车工艺要求发展。台湾的激光产业发展多年,有坚实的基础,但要继续跟上国际步伐,需要自主激光技术的加强。
标题
知识
如何选择手动和数控车床,以及它们之间的区别?
如果您拥有手动或CNC车床,或者如果您正在考虑购买第一台车床,您可能会考虑哪种类型的车床更适合您。
标题
知识
半导体供应链
半导体供应链包括各种半导体制造和设计行业,如集成电路制造、集成电路封装和测试、集成电路设计和分立元件制造。
标题
知识
什么是集成机器人和高级运动控制?
信息就是力量。信息不仅可以调整决策,还可以帮助发现市场机会。采用先进的运动控制技术,优化自动化机器的性能。
标题
知识
深孔穿线入门
螺纹通常是添加到零件上的最后一个特征。除了所需的确切参数和标准线程问题之外,还有其他挑战。
同意