+
当前您的位置: 首页 > 项目介绍 > 大数据技术专题 > 正文

华为大数据企业数据仓库与 ETL 开发专题

时间:2026-04-04 浏览量: 作者:

一、项目背景

企业数字化转型进入数据驱动阶段,华为大数据平台(FusionInsight、MRS)成为企业数据存储与计算的核心底座。企业大数据开发工程师虽具备基础 SQL 与数据处理能力,但在华为大数据组件部署、数据仓库建模、ETL 流程开发、分布式计算优化等环节存在明显短板,难以支撑企业海量数据的高效处理与价值挖掘。本培训聚焦大数据开发工程师岗位,通过实战化教学,帮助学员掌握华为大数据全流程开发技能,为企业数据价值释放提供人才支撑。

二、项目设计

【培训时长】不限│2天起,可根据培训需求和工学矛盾定制培训时长

【培训人数】不限│除委托单位安排集中培训外,可根据培训需求、区域发展需要开展多家单位联合组班,组班可由校方推荐,也可自行联系

【培训形式】不限│现场教学、送教上门、线上教学、面授学习、分段式专题培训等多种方式相结合,确保培训实效

【培训师资】遴选华为大数据运维专家、集群架构师、运维自动化工程师等组成一流师资队伍

【培训费用】根据培训人数及具体培训方案而定

【培训证书】沈阳工学院颁发的 “沈阳工学院继续教育结业证书”

【课程设置】以下课程仅供参考,可根据委托单位量身定制培训课程

三、培训内容

课程模块 课程内容
华为大数据平台基础 华为 FusionInsight/MRS 大数据平台架构解析,Hadoop 生态核心组件(HDFS/YARN/Hive/Spark)原理,华为大数据集群部署、扩容与高可用配置,企业数据仓库分层架构设计(ODS/DWD/DWS/ADS),数据仓库建模方法论(维度建模 / 范式建模)
Hive 数据仓库开发 Hive 数据库、表、分区与分桶设计,Hive SQL 高级查询与性能优化,数据清洗、格式转换与数据质量校验,缓慢变化维(SCD)、拉链表等复杂场景实现,Hive 与其他组件的集成与数据互通
Spark 分布式计算开发 Spark Core 核心原理与 RDD 编程,Spark SQL 数据处理与分析实战,Spark Streaming 实时数据采集与处理,数据倾斜问题定位与调优方案,Spark 作业提交、监控与故障排查
ETL 流程开发与调度 数据采集(Flume/Kafka)与接入实现,ETL 工具(DataStage/DLF)可视化流程开发,Shell/Python 脚本实现数据清洗与转换,任务调度工具(Azkaban/Oozie)配置与管理,ETL 全流程监控与异常告警机制
数据质量与治理 数据质量规则定义与校验实现,数据血缘分析与影响评估,数据生命周期管理与冷热数据分层,数据安全权限管控与脱敏处理,企业数据治理体系落地实践
行业实战案例 零售行业用户行为数据仓库构建,金融行业风控数据 ETL 流程开发,制造行业设备数据采集与分析,政务行业民生数据仓库建模与报表开发,实战故障场景模拟与调优

四、联系方式

沈阳工学院继续教育学院办公室电话:024-56618988     联系邮箱:2279497336@qq.com

审核校对/于璐  杨玥  李康举


地址:辽宁省沈抚示范区滨河路东段1号 电话:024-56091502