一、项目背景
随着业务规模膨胀,传统人工运维模式响应慢、定位难、效率低,难以支撑 7x24 小时高可用业务运行。华为全栈 AIOps 平台(如 iMaster NCE)融合 AI 算法,实现预测性维护、根因智能分析与自动化修复。本培训面向企业运维负责人、SRE 及监控运维人员,聚焦从 “被动救火” 到 “主动预防” 的转型,通过实战训练掌握智能告警、故障自愈与趋势分析能力,确保持续稳定输出高质量运维服务。
二、项目设计
【培训时长】不限│2天起,可根据培训需求和工学矛盾定制培训时长
【培训人数】不限│除委托单位安排集中培训外,可根据培训需求、区域发展需要开展多家单位联合组班,组班可由校方推荐,也可自行联系
【培训形式】不限│现场教学、送教上门、线上教学、面授学习、分段式专题培训等多种方式相结合,确保培训实效
【培训师资】遴选华为鲲鹏认证专家、企业资深架构师、国产化迁移与性能调优顾问、高校计算机专业教授等组成一流师资队伍
【培训费用】根据培训人数及具体培训方案而定
【培训证书】沈阳工学院颁发的 “沈阳工学院继续教育结业证书”
【课程设置】以下课程仅供参考,可根据委托单位量身定制培训课程
三、培训内容
| 课程模块 |
课程内容 |
| 智能监控与告警 |
全链路监控指标体系搭建(指标/日志/链路),智能告警规则配置与降噪策略(抑制/聚合),异常流量智能识别与趋势预测,多维度告警可视化与告警升级机制,告警误报率优化与根因关联分析 |
| 故障自愈与自动化 |
华为AIOps故障自愈流程设计与编排,自动化运维脚本(Ansible/Python)开发,业务级演练与混沌工程实施,故障自愈场景库构建与规则迭代,自动化运维平台集成与权限管控 |
| 根因分析(RCA) |
分布式系统调用链追踪与问题定位,智能算法识别故障根因与关联分析,典型性能瓶颈(抖动/延迟)深度拆解,故障根因知识库构建与沉淀,根因分析报告生成与复盘 |
| 运维效能度量 |
关键运维指标(MTTR/MTBF/变更成功率)盘点,运维流程自动化覆盖率评估,运维成本与人力效能优化报告,运维效能看板与可视化展示,运维团队KPI设计与考核 |
| 智能容量规划 |
基于AI的资源容量预测与扩容建议,业务波峰波谷负载分析与调度策略,混部部署与资源超卖实践,容量规划与业务增长匹配评估,资源弹性扩容与缩容自动化配置 |
四、联系方式
沈阳工学院继续教育学院办公室电话:024-56618988 联系邮箱:2279497336@qq.com
审核校对/赵明雨 杨玥 李康举