导图社区 运维体系模板by鏚铘
这是一篇关于维体系模板by鏚铘的思维导图,主要内容有人员组织管理、物理层运维、IT系统运维等。
编辑于2022-08-29 11:46:52 江苏省"数字化管理时代,八大系统协同构建企业智慧中枢!SKU作为库存管理的基本单元,精准区分商品属性。ERP系统作为核心枢纽,与CRM、OMS等无缝交互:从CRM获取客户资料,通过OMS处理订单并评估信用联动PLM获取产品BOM数据,协同MES制定生产计划与WMS、SCM实时传递库存及订单信息,实现供应链高效协同。WMS专注仓储优化,SCM强化供应链联动,SRM深化供应商管理。各系统通过标准化接口实现数据互通,覆盖订单处理、生产调度、物流跟踪全流程,助力企业降本增效。"
这是一篇关于项目:新公司网站开发 WBS的思维导图,主要内容包括:1.1 项目计划和设计,1.2 网站开发,1.3 网站维护和更新。
高效项目管理的三大核心工具:WBS、甘特图和项目计划! 【项目计划】是项目运作的总蓝图,明确目标、时间表、预算和风险管理,指导团队实施 【WBS】通过任务分解确保可衡量性,遵循层级化原则将复杂工作拆解为可执行单元; 【甘特图】直观展示进度与依赖关系,需优化时间轴和资源分配以应对挑战。 三者结合形成完整管控体系,适用于研发及各类项目场景。
社区模板帮助中心,点此进入>>
"数字化管理时代,八大系统协同构建企业智慧中枢!SKU作为库存管理的基本单元,精准区分商品属性。ERP系统作为核心枢纽,与CRM、OMS等无缝交互:从CRM获取客户资料,通过OMS处理订单并评估信用联动PLM获取产品BOM数据,协同MES制定生产计划与WMS、SCM实时传递库存及订单信息,实现供应链高效协同。WMS专注仓储优化,SCM强化供应链联动,SRM深化供应商管理。各系统通过标准化接口实现数据互通,覆盖订单处理、生产调度、物流跟踪全流程,助力企业降本增效。"
这是一篇关于项目:新公司网站开发 WBS的思维导图,主要内容包括:1.1 项目计划和设计,1.2 网站开发,1.3 网站维护和更新。
高效项目管理的三大核心工具:WBS、甘特图和项目计划! 【项目计划】是项目运作的总蓝图,明确目标、时间表、预算和风险管理,指导团队实施 【WBS】通过任务分解确保可衡量性,遵循层级化原则将复杂工作拆解为可执行单元; 【甘特图】直观展示进度与依赖关系,需优化时间轴和资源分配以应对挑战。 三者结合形成完整管控体系,适用于研发及各类项目场景。
运维体系模板
人员组织管理
组织架构
机房维护
主管
张三
空调维护
王五
李四
电力维护
徐七
唐二
。。。
服务维护
主管
赵大
白班组
钱十八
孙二二
夜班组
李七
。。。
DBA
张六
。。。
...
岗位职说明
管理岗位
岗位职责一
岗位职责二
岗位职责三
专业岗位
岗位职责一
岗位职责二
岗位职责三
值班岗位
。。。
供应商
电力供应商
联系方式
服务范围
服务时间
服务器供应商
联系方式
服务范围
服务时间
xx软件供应商
联系方式
服务范围
服务时间
UPS供应商
联系方式
服务范围
服务时间
。。。
培训
培训计划
培训资料
组织学习
内部培训
外部培训
分析及总结
认证考试
内部认证
考题设计
考试组织
考试证书
上岗证书
技能证书
外部行规认证
物理层运维
IDC机房
设备管理
预防性维护操作MOP
强电
供电
UPS
空调
弱电
网络
消防
门禁
视频监控
。。。
标准操作程序SOP
强电
供电
UPS
空调
弱电
网络
消防
门禁
视频监控
。。。
工具管理
常用工具
应急物资
备件管理
关键设备备件
日常消耗
生命周期管理
强电
供电
UPS
空调
弱电
网络
消防
门禁
视频监控
。。。
供应商管理
供应商责任规则
响应时间要求
服务满意度
监控系统
动环系统
楼宇设备自控系统
消防系统
门禁系统
视频监控系统
大屏系统
资产管理
办公资产
自由资产
。。。
日常运行维护
设施管理制度
规定要求
行政管理
资产管理
日常监控
强电
供电
UPS
空调
弱电
消防
门禁
视频监控
。。。
巡检管理
巡检要求
巡检频次
巡检区域
线下巡检区域
线上巡检对象
巡检路线
线下巡检路线
线上巡检顺序
巡检设备
强电
供电
UPS
空调
弱电
消防
门禁
视频监控
。。。
交接班管理
交接班制度
排班制度
请假替班制度
工具及用品
标签标识管理
设备标识
线材标识
警示标识
环境标识
系统展板
故障问题管理
故障问题处理流程制定
问题发现与处理
问题升级
问题闭环
事件管理
事件定义
事件升级
通知汇报
容量管理
电力可用
冷量可用
阈值设定
机柜空间可用
管线空间可用
能效管理
能效检测
能源利用率PUE
报表
机房节能
安装机柜盲板
服务器降耗
动力节能
电力效率提升
制冷效率提升
应急响应管理EOP
应急预案
强电
供电
UPS
空调
弱电
消防
门禁
视频监控
。。。
应急演练
计划性
强电
供电
UPS
空调
弱电
消防
门禁
视频监控
。。。
非计划性
演练方式
沙盘演练
跑位演练
分析总结
安全
安全规范
安规制定
法规要求
人员安全
人员操作安全
安全防护用品
物理环境安全
设备安全
静电
。。。
机房安全
园区安全
外部环境
质量
质量保障
质量标准
质量培训
质量控制
质量检查
质量审核
质量改进
分析总结
优化创新
工程变更
工程变更制度
制度制定
人员责任
费用管理
转维流程
施工管理
施工申请
现场随工
计划性变更
资产变更
环境变更
人员权限变更
。。。
非计划变更
。。。
人员
人员权限变更
长期授权
临时授权
授权取消
权限调整
人员进出
内部人员
授权人员
非授权人员
外部人员
供应商人员
客户参观接待
小型整改
客户需求
运维需求
合规要求
机房改造
机房新建
机房改建
机房扩容
机房优化
设备变动
服务器上下机柜
服务器位置调整
设备上下电
设备配件变更
验收转维
测试/QA跟进
风险评估
问题闭环
工程与运维交接
IT系统运维
日常运行维护
IT管理制度
规定要求
行政管理
资产管理
日常监控
设备状态
网络设备
交换机
路由器
防火墙
服务器
服务器资源
CPU
内存
硬盘IO
网络IO
句柄消耗
硬盘卷状态
网络资源
防火墙网络流量
交换机网络流量
多子网间网络流量
网络带宽可用量
网络延迟量
网络抖动率
网络误码率
网络丢包率
IP资源使用量
网段
IP段
VIP
网络设备计算资源
CPU
内存
光口网口流量
。。。
。。。
VM平台
资源池消耗量
CPU
内存
硬盘IO
VM状态统计
VM计算资源
CPU
内存
硬盘IO
网络IO
句柄消耗
。。。
基础服务
DNS
DHCP
NTP
VPN
。。。
Mysql数据库服务
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
binglog/redolog/硬盘空间大小
binglog/redolog硬盘IOPS
网络
网络输入吞吐量
网络输出吞吐量
Mysql进程状态
Mysql项目
mysql.questions.rate
Availability: Get status variables: Throughput: Questions per second
mysql.com_update.rate
Availability: Get status variables: Throughput: Command Update per second
mysql.com_select.rate
Availability: Get status variables: Throughput: Command Select per second
mysql.com_insert.rate
Availability: Get status variables: Throughput: Command Insert per second
mysql.com_delete.rate
Availability: Get status variables: Throughput: Command Delete per second
mysql.bytes_sent.rate
Availability: Get status variables: Throughput: Bytes sent
mysql.bytes_received.rate
Availability: Get status variables: Throughput: Bytes received
mysql.rollback
Availability: Get status variables: Throughput: Command rollback per second
mysql.replace
Availability: Get status variables: Throughput: Command replace per second
mysql.commil
Availability: Get status variables: Throughput: Command commit per second
用于査看数据库实例增删改査等操作的分布情 况,做一个组图可以很直观的看出各个指标的比例
mysql.slow_queries.rate
Availability: Get status variables: Performance: Slow queries per second
慢SQL
mysql.uptime
Availability: Get status variables: Info: Uptime
监控mysql启动时间
mysql.version
Info: MySQL version
Mysql版本号
mysql.threadsrunning
Availability: Get status variables: Connections: Threads running
mysql.threadscreated
Availability: Get status variables: Connections: Threads created
mysql.threadsconnected
Availability: Get status variables: Connections: Threads connected
mysql.connections.rate
Availability: Get status variables: Connections: Connections per second
用于査看活动连接数、连接数、最大连接数、创建连接数
mysql. insert, test
Avaihbility: MySQL status
用于探活,但是建议创建一个独立的表,用inster 一个简单字段做这个操作,这样能监控硬盘只读 、空间满、进程假死等情况.
mysql表空间大小
mysql死锁监控
主从同步状态
mysql主从延迟
主从同步状态
RDS监控参考
TPS
是Transactions Per Second的缩写,也就是事务数/秒。它是软件测试结果的测量单位。一个事务是指一个客户机向服务器发送请求然后服务器做出反应的过程。客户机在发送请求时开始计时,收到服务器响应后结束计时,以此来计算使用的时间和完成的事务个数。
QPS
是Queries Per Second的缩写,意思是每秒查询率,是一台服务器每秒能够相应的查询次数,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。
连接数
当前总连接数The number of connection attempts (successful or not) to the MySQL server. Connections
每秒SQL执行次数
insert delete update select语句 ROWDML:InnoDB每秒钟操作数据行数的统计,根据操作的不同,分为平均每秒向日志文件的物理写次数、平均每秒从InnoDB表“删除/更新/读取/插入”的行数。
全表扫描数
平均每秒全表扫描次数 show global status like “handler_read%”
InnoDB缓冲池命中率
InnoDB buffer pool hit 不低于95%
InnoDB缓冲池使用率/脏块率
InnoDB缓冲池的读命中率、利用率以及缓冲池脏块的百分率(InnoDB缓冲池)
InnoDB物理读
innodb_buffer_pool_reads: 平均每秒从物理磁盘读取页的次数
InnoDB逻辑读
innodb_buffer_pool_read_requests: 平均每秒从innodb缓冲池的读次数
排序记录数
Sort_rows
InnoDB锁等待次数
Innodb_row_lock_current_waits
InnoDB脏页数量
innodb_buffer_pool_pages_dirty
InnoDB读写量
InnoDB每秒钟的读取和写入次数。/innodb_data_read innodb_data_written
InnoDB buffer pool读写次数
innodb_buffer_pool_read_requests/ innodb_buffer_pool_write_requests
InnoDB日志文件写次数
InnoDB日志:InnoDB的日志写入情况/ Innodb_log_writes
打开文件/表数量
Innodb_num_open_files/Com_show_open_tables
慢SQL
Slow_queries
MyISAM读写次数
MyISAM平均每秒的读写次数。 key_read_requests/ key_write_requests
MyISAM key Buffer 读/写/利用率(%)
MyISAM平均每秒的Key Buffer使用状况。Key_usage_ratio =Key_blocks_used/(Key_blocks_used+Key_blocks_unused)*100 —- Key_read_hit_ratio=(1-Key_reads/Key_read_requests)*100 — Key_write_hit_ratio =(1-Key_writes/Key_write_requests)*100
MySQL执行语句时在硬盘上自动创建的临时表的数量
执行语句时在硬盘上自动创建的临时表的数量(临时表)Created_tmp_disk_tables
IOPS
RDS实例的IOPS(每秒IO请求次数)
ES
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
实际部署中,会区分摄取(ingest)、主(master)、数据(data)等节点,这里重点监控数据节点IO。
ES属性
容量
已⽤存储空间
总存储空间是不能全部使用完,需要预留一部分空间。
最⼤分区使⽤
在ES中,如果某数据节点单块数据⽬录使⽤率超过90%(默认值,可以通过cluster.routing.allocation.disk.watermark相关配置来调整),则会进⾏分⽚数据迁移。因此,在数据盘存在异构的集群中,为避免分⽚迁移,监控此值,⾄关重要。
分⽚数量
线程池队列长度
流量
索引、搜索速率
延迟
索引、搜索延迟
慢查询
错误
集群异常节点数
索引、搜索拒绝数量
主节点错误日志
kafka
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
磁盘log.dirs目录下数据文件大小,要有定时清除策略
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
主要监控JAVA的 GC time(垃圾回收时间),JAVA的垃圾回收机制对性能的影响比较明显
kafak属性
Kafka总体监控
节点数量
zookeeper上/XXX/broker/ids目录下节点数量
leader 选举频率
Kafka Broker监控
kafka集群中Broker列表,broker运行状况,包括node下线,活跃数量
Broker是否提供服务
数据流量 流入速度,流出速度 (message / byte)
ISR 收缩频率
Kafka Controller监控
controller存活数目
Kafka Producer监控
producer数量,排队情况
请求响应时间
QPS/分钟
Kafka Consumer监控
consumer队列中排队请求数
请求响应时间
最近一分钟平均每秒请求数
Topic监控
数据量大小;
offset
数据流量 流入速度,流出速度 (message / byte)
zookeeper
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
K8S
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
docker
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
MinIO
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
Spring Gateway
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
Nginx
基础资源
CPU
内存
硬盘
数据存储硬盘空间大小
数据存储硬盘IOPS
网络
集群网络IO
集群数据节点IO
JVM
Full GC
OldSpace
GC time
巡检管理
巡检要求
巡检频次
巡检区域
线下巡检区域
线上巡检对象
巡检路线
线下巡检路线
线上巡检顺序
巡检检查内容
设备检查
服务器
网络设备
物联设备
。。。
软件检查
告警检测
故障问题管理
故障问题处理流程制定
问题发现与处理
问题升级
问题闭环
事件管理
事件定义
事件升级
通知汇报
容量管理
服务器磁盘容量
网络设备吞吐容量
防火墙流量
备份管理
备份规则制定
备份操作
手工
增量
全量
自动化
增量
全量
应急响应管理EOP
应急预案
服务器
网络
软件
数据
恢复
手工
增量
全量
自动化
增量
全量
。。。
应急演练
计划性
服务器
网络
软件
。。。
非计划性
演练方式
沙盘演练
跑位演练
分析总结
安全
信息安全规范
信息安规制定
法规要求
网络安全
信息安全
系统安全
软件证书管理
网络管理
外网
运营商网络
办公网
访客网
雇员网
内网
运维网
生产网
监控网
软件变更
软件变更制度
变更制度制定
各软件基础参数配置标准制定
人员责任
费用管理
转维流程
。。。
配置管理
运维需求
合规要求
版本升级
升级影响分析
升级计划
升级操作手册
升级后验证
测试转维
测试跟进
风险评估
问题闭环
研发与运维交接
质量
质量保障
质量标准
质量培训
质量控制
质量检查
质量审核
质量改进
分析总结
优化创新
财务采购审计管理
预算管理
年度预算
月度预算
采购管理
日常采购
紧急采购
审计
外部审计
供应商审计
客户审计
内部审计
公司/集团审计
运维部门自审
运维目标
安全
信息安全/隐私保护(Security)
组织信息安全/隐私保护培训,提高信息安全/隐私保护意识
制定安全规范/处罚制定
制定安全接入结构/设备软件部署
服务登录/线上变更的权限控制、安全审计
长期病毒防护
周期性漏洞扫描并修复
对外部攻击进行预防/防御/处理
安全防护(Safety)
制定机房运行规范和标准
机房进出/变更权限控制,安全审计
制定设备环境预防维护巡检规范并执行
质量
服务可用性改进
数据可靠性改进
性能优化
监控完备
定期巡检
应急预案制定
故障演练
告警/故障响应、处理、总结
成本
机房/机柜/机器/网络资源梳理
资源生命周期、流程管理
容量规划、成本优化
服务部署、统一资源调度
效率
制定标准、规范化
通用操作工具化、重复工作一键化
平台建设
资产管理、服务目录、服务名称
变更管理、配置管理、初始化平台
监控系统、故障分析自愈、资源利用率平台
权限系统、堡垒机、跳板机