搜索
查看: 1616|回复: 0

数据库&数据仓库你分的清吗?

[复制链接]

5

主题

0

回帖

244

积分

中级会员

积分
244
发表于 2018-8-21 10:42:02 | 显示全部楼层 |阅读模式
       今天我们要说的是主题是——数据仓库,注意是仓库,不是数据库哦。
       首先我们要知道,数据仓库的建立为行业高层主管门系统的地组织、理解和使用他们的数据进行了战略决策提供了体系结构和工具。在当今充满竞争和快速发展的世界,数据仓库系统是一种有价值的工具。在过去的几年中,许多公司花费数百万美元建立企业范围的数据仓库。许多人都感到随着工业竞争的加剧,数据仓库成了必备的最新营销武器——一种通过更多的了解客户需求而留住客户的途径。
         “那么,到底是什么是数据仓库?”数据仓库已被多种方式定义,很难给出一种严格的定义。不严格的讲,数据仓库是一种数据库,它与组织机构的操作数据库分别维护。数据仓库系统允许将各种应用系统集成在一起,为统一的历史数据分析提供坚实的平台,对信息处理提供支持。按照一位数据仓库系统构造方面的领头设计师William H.Inmon的说法,“数据库是一个面向主题的、集成的、时变的和非易失的数据集合,支持管理部门的决策过程”[Inm96]。
       这个简短而又全面的定义指出了数据仓库的主要特征。
四个关键词,面向主题的、集成的、时变的、非易失的,将数据仓库与其他数据存储系统相区别。让我们进一步看看这些关键特征。
       面向主题的:数据仓库围绕一些主题,如顾客、供应商、产品和销售来组织。数据仓库关注决策者的数据建模与分析,而不是组织机构的日常操作和事务处理。因此,数据仓库排除对于决策支持过程无用的数据,提供特定主题的简明视图。
        集成的:通常,构造数据仓库是将多个异构数据源,如关系数据库、一般文件和联机事务记录集成在一起。使用数据清理和数据集成技术确保命名约定、编码结构、属性度量等的一致性。
       时变的:数据存储从历史的角度提供信息,数据仓库中的关键结构都隐式或显式地包含时间元素。
非易失的:数据仓库总是物理地分别存放数据,这些数据源于操作环境下的应用数据。由于这种分离,数据仓库不需要事务处理,恢复和并发控制机制。通常,它只需要两种数据访问操作:数据的初始化装入和数据访问。
       概言之,数据仓库式语义上一致的数据存储,它充当决策支持数据模型的物理实现,并存放企业战略决策所需要的信息。数据仓库也常常看作一种体系结构,通过将异构数据源中的数据集成在一起而构造,支持结构化和/或专门的查询、分析报告和决策制定。
       根据上面的讨论,我们把建立数据仓库看作构造和使用数据仓库的过程。数据仓库的构造需要数据集成、数据清理和数据统一。利用数据仓库常常需要一些决策支持技术。这使得“知识工人”能够使用数据仓库快捷、方便的得到数据的总体视图,根据数据仓库中的数据信息做出准确的决策。
        由于大多数人都熟悉商用关系数据库系统,将数据仓库与之比较,就容易理解什么式数据仓库。
联机操作数据库系统的主要任务是执行联机事务和查询处理。这种系统称作联机事务处理(OLTP)系统。它们涵盖了组织机构的大部分日常操作,如购物、库存、制造、银行、工资、注册、记账等。另一方面,数据仓库系统在数据分析和决策方面为用户或知识工人提供服务。这种系统可以用不同的格式组织和提供数据,以满足不同用户的各种需求。这种系统称作连接分析处理(OLAP)系统。
       OLTP和OLAP的主要区别概述如下。
       用户和系统的面向性:OLTP系统是面向客户的,用于办事员、客户和信息技术专业人员的事务和查询处理。OLAP系统是面向市场的,用于知识工人的数据分析。
       数据内容:OLTP系统管理当前数据。通常,这种数据太琐碎,难以用于决策。OLAP系统管理大量历史数据,提供汇总和聚集机制。并在不同的粒度级别上存储和管理信息。这些特点使得数据更容易用于见多识广的决策。
数据库设计:通常,OLTP系统采用实体-联系(ER)数据模型和面向应用数据库设计。而OLAP系统通常采用星形或雪花模型和面向主题的数据库设计。
       视图:OLTP系统主要关注企业或部门内部的当前数据,而不涉及历史数据或不同的组织的数据。相比之下,由于组织的变化,OLAP系统常常跨越数据库模式的多个版本。OLAP系统还处理来自不同组织的信息,有多个数据存储集成的信息。由于数据量巨大,OLAP数据存放在多个存储介质上。
      访问模式:OLTP系统的访问模式主要由短的原子事务组成。这种系统需要并发控制和恢复机制。然而,对OLAP系统的访问大部分是只读操作,尽管许多可能是复杂的查询。
       OLTP和OLAP的其它区别包括数据大小、操作的频繁程度、性能度量等。
       好了,今天的科普就说到这里了,你懂了吗?


您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-4-26 06:19 , Processed in 0.055131 second(s), 24 queries .

快速回复 返回顶部 返回列表