您好,欢迎来到三六零分类信息网!老站,搜索引擎当天收录,欢迎发信息
免费发信息
三六零分类信息网 > 和田分类信息网,免费分类信息发布

8年数据仓库经验老鸟分享零基础转行大数据的最佳自学之路

2022/10/20 17:10:44发布56次查看
本人从08年从事数据仓库工程师转到目前大数据管理工作的,对数据仓库感情颇深,也曾一直苦于没有太好的学习资料,自行摸索。我认为数据仓库更像一门管理学艺术,大多用的也是关系型数据库,但是却完全忽略三范式,通过维度模型来组织数据,最后为各种数据的应用提供支持,例如bi、数据集市、数据挖掘等等。而在模型之间穿插着无数的etl应用来组成系统的血脉!所以我个人觉得数据仓库除了技术,更有其艺术的一面。在大数据时代,很多时候我们面对的是hbase,hadoop,spark等流式的数据,虽然数据仓库的技术有所更新,但其模型原理缺始终没变。我认为这是一门非常有价值的技术!希望大家看完本文能有所收获。
本文推荐的学习路线适合具有一定的数据库基础,对数据有很强的敏感度。对于元数据管理、etl、bi有兴趣的童鞋学习。
零基础学习数据仓库首先要从dw理论与建模开始学习,建议学习时间为2周左右。
重点: 数据仓库的核心知识,维度建模。olap与oltp数据库系统的区别是最关键的。同时掌握powerdesiner数据库设计工具也是非常重要的。同时对于oracle的应用水平的提升也是至关重要的。因为要写很多存储过程来弥补etl工具的不足!
数据仓库入门 10课
数据仓库讲解 5课
powerdesigner数据仓库设计 27课
powerdesigner精讲 11课
详解sql与plsql 18课
oracle快速入门与提高 18课
其次要了解etl原理与应用,建议学习时间为2周左右。
重点:etl是数据仓库的血脉,负责数据的抽取、转换与加载,有人会提etcl,无非增加了一项数据清洗。其实了解执行原理就会明白并没有多么高深,学习的精髓就是让抽象变简单的方法。这里提供了一些常用etl工具的使用,其实只要理解其原理都是相通的,工具主要是简化操作,便于维护与管理。主流的工具无非开源的kettle,企业级的informatica、ssis、datastage这几款,会两个就足以,很多时候,存储过程加job调度完全能应付。
etl理论基础 6课
深入bi之kettle篇etl技术 15课
kettle4.3入门与实战 15课
bi ssis etl 56课
data stage 6课
datastage 工具实战讲解 2课
informaticaetl工具视频教程 30课
infa_pc基础 3课
最后重点讲讲bi商业智能与应用,建议学习时间为30天左右。
重点:bi应用包括决策支持、领导驾驶舱等,其实从技术角度来讲就是一个数据可视化的过程,很容易理解,无非就是图表的组合,或者olab的自助查询,对于olab的支持可能会用到cube技术,一些企业级bi工具都支持。但其核心还是sql。从产品角度来讲可能有些难度,需要的对业务的理解,图表的设计要与业务紧密结合,如何提高易用性,更直观的发现问题,提供诊断结果这是需要经验打磨的。互联网公司一般自己开发bi应用,很多大型企业会用到企业级的bi工具,主流的就是ibm的cognos、oracle的obiee、ssrs或者sap的bo,大同小异。我都为大家准备齐全了。当然国内近几年也涌现出一些不错的bi工具。
和田分类信息网,免费分类信息发布

VIP推荐

免费发布信息,免费发布B2B信息网站平台 - 三六零分类信息网 沪ICP备09012988号-2
企业名录