首页新闻动态正文

什么是数据仓库?【黑马大数据培训】

更新时间:2022年12月21日 18时25分14秒 来源:黑马程序员论坛

黑马中级程序员课程

按照官方解释:数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。它是单个数据存储,出于分析性报告和决策支持目的而创建。 为需要业务智能的企业,提供指导业务流程改进、监视时间、成本、质量以及控制。(写得挺牛逼以至于我根本理解不了)
一、提出问题
  为了更好地理解,在这里先提几个问题。
  1、如果你要的数据分别存放在很多个不同的数据库,甚至存在文本文件,excel 中,你要如何获取这些数据?
  2、如果你从这些数据源中取出了你要的数据,但是发现格式不一样,或者数据类型不一样,你要怎么规范?
  3、如果有一天你需要查历史数据,但你发现这些数据被修改过的,你要怎么办?
  4、如果你是一个只会简单查询的人,你想从复杂的数据库中获取数据,应该怎么办?
  5、如果你有一个关于城市人口的数据库,你想知道“某个镇学历分布情况”,要怎么快速高效地得知呢?
二、解决问题
  为了解决上面几个问题,数据仓库就诞生了,从逻辑上理解,数据库和数据仓库没有区别,都是通过数据库软件实现存放数据的地方,只不过从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。
  构建数据仓库的过程是将不同数据源的数据整合起来,通过对数据进行清洗,规范化数据;根据需求围绕一个主题进行构建;并且构建好的数据仓库不用于UPDATE,仅用于查询;构建好的数据仓库也方便获取数据,节省了一定的资源。
                  
三、特点
  那么接下来数据仓库的特点就比较容易理解了。
 1、集成性
  数据仓库中存储的数据是来源于多个数据源,原始数据在不同数据源中的存储方式各不相同。要整合成为最终的数据集合,需要从数据源经过一系列抽取、清洗、转换的过程。
 2、稳定性
  数据仓库中保存的数据是历史记录,不允许被修改。用户只能通过分析工具进行查询和分析。
 3、动态性
  数据仓库数据会随时间变化而定期更新,不可更新是针对应用而言,即用户分析处理时不更新数据。
 4、主题性
  传统数据库对应项目不同,数据仓库根据需求,将不同数据源的数据整合,所有数据都围绕某一主题。比如“分析某个地区人口的学历”、“企业的注册资本”这样类似地主题。

推荐了解热门学科

java培训 Python人工智能 Web前端培训 PHP培训
区块链培训 影视制作培训 C++培训 产品经理培训
UI设计培训 新媒体培训 软件测试培训 Linux运维
大数据培训 智能机器人软件开发




传智播客是一家致力于培养高素质软件开发人才的科技公司“黑马程序员”是传智播客旗下高端IT教育品牌。自“黑马程序员”成立以来,教学研发团队一直致力于打造精品课程资源,不断在产、学、研3个层面创新自己的执教理念与教学方针,并集中“黑马程序员”的优势力量,针对性地出版了计算机系列教材50多册,制作教学视频数+套,发表各类技术文章数百篇。

传智播客从未停止思考

传智播客副总裁毕向东在2019IT培训行业变革大会提到,“传智播客意识到企业的用人需求已经从初级程序员升级到中高级程序员,具备多领域、多行业项目经验的人才成为企业用人的首选。”

中级程序员和初级程序员的差别在哪里?
项目经验。毕向东表示,“中级程序员和初级程序员最大的差别在于中级程序员比初级程序员多了三四年的工作经验,从而多出了更多的项目经验。“为此,传智播客研究院引进曾在知名IT企业如阿里、IBM就职的高级技术专家,集中研发面向中高级程序员的课程,用以满足企业用人需求,尽快补全IT行业所需的人才缺口。

何为中高级程序员课程?

传智播客进行了定义。中高级程序员课程,是在当前主流的初级程序员课程的基础上,增加多领域多行业的含金量项目,从技术的广度和深度上进行拓展“我们希望用5年的时间,打造上百个高含金量的项目,覆盖主流的32个行业。”传智播客课程研发总监于洋表示。




黑马程序员热门视频教程

Python入门教程完整版(懂中文就能学会) 零起点打开Java世界的大门
C++| 匠心之作 从0到1入门学编程 PHP|零基础入门开发者编程核心技术
Web前端入门教程_Web前端html+css+JavaScript 软件测试入门到精通


分享到:
在线咨询 我要报名
和我们在线交谈!