联系我们 联系我们 电话 021-63528192

浅谈数据仓库、数据湖的区别

数据仓库Vs数据湖

Related Posts/Categories
2022-02-11 3年前

数字化转型的浪潮下,各种新的技术、概念席卷而来。相信大家在恕康前几篇发表的文章当中也能看出,不管是美国还是中国、日本都在积极应对变革挑战,花重金培养数据方面的人才。近年来,“数据仓库”,“数据湖”词汇频繁出现在不同场合,那么今天我们就来细说一下数据仓库和数据湖到底是什么。
 
#数据仓库是什么?

数据仓库(Data Warehouse,简称DW),顾名思义就是存储数据的仓库
数据仓库参考图

以下内容出自百度百科:

数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。

拿普通的仓库来说,仓库里面会有不同的分类,并且在不同的分类中会细分出来货架来放置相对应的商品。同理,数据仓库可以把不同数据源按照分析需求、维度、指标进行整理,最终用于企业的决策当中。

通常数据仓库会有4大特点:

主   题--数据仓库会根据企业的实际需求作为一个主题进行分析。 
集   成--数据仓库里面的数据来源多个数据源融合后加工出来的。在这里就需要  把多个数据源进行清洗、整理,统一元数据中所有的矛盾不一致的地方。
时变性--如同货物仓库一样,数字仓库会定期接收新的集成。
稳   定--数据仓库中存储了包含各种历史,一般情况下不会进行修改。其目的是通过历史数据来分析某段时间的业务状况来反应某段时间的情况。 

#那么数据湖又是什么呢? 

同样作为数据存储,乍一看数据湖跟数据仓库好像没有什么本质上的区别。但是数据湖可以存储任何形式、格式的原始数据进行存取、处理、分析、传输、预测等。与数据仓库相比,数据湖在灵活性,敏捷性上占据很大的优势。并且从成本上来看,数据湖与数据仓库相比较低,并且在使用人员上也会有一定的区别。 


恕康拿数据湖作为关键词进行了一下搜索,发现AWS对于数据湖做出了以下解释并简单对比了数据仓库以及数据湖的区别,我们可以看一下AWS是如何分析他们的区别的。 

首先,数据湖是一个集中式存储库,允许企业以任意规模存储所有结构化和非结构化数据。企业可以按原样存储数据(无需先对数据进行结构化处理),并运行不同类型的分析 – 从控制面板和可视化到大数据处理、实时分析和机器学习,以指导做出更好的决策。
数据仓库与数据湖对比图


image

专注数据

MAIL

用数据改变
与您共创大数据时代

咨询

CALL

如果您对我们的服务有什么疑问
欢迎来电咨询

电话
021-63528192 工作时间:9:00 ~ 18:00
top