导图社区 运维知识体系
运维,这里指互联网运维,通常属于技术部门,与研发、测试、系统管理同为互联网产品技术支撑的4大部门,这个划分在国内和国外以及大小公司间都会多少有一些不同。 一个互联网产品的生成一般经历的过程是:项目立项、需求分析、研发部门开发、测试部门测试、运维部门部署发布以及长期的运行维护。 运维,本质上是对网络、服务器、服务的生命周期各个阶段的运营与维护,在成本、稳定性、效率上达成一致可接受的状态。
《疯狂的尿酸》读书笔记,这本书详细介绍了尿酸的产生、代谢和排泄过程,以及高尿酸血症和痛风的发生机制和防治方法。
结合SRE理念的运维实践总结,给团队培训要点。导图从背景、运维职责、文化特质、可靠性、故障处理、轮值、上线/变更、支撑组织、文档几个方面作了介绍。
社区模板帮助中心,点此进入>>
项目时间管理6大步骤
互联网9大思维
项目管理的五个步骤
电商部人员工作结构
组织架构-单商户商城webAPP 思维导图。
暮尚正常运转导图
域控上线
产品经理如何做好项目管理
车队管理
python思维导图
运维知识体系
网络
DNS
CDN
防火墙、路由器、Ipsec VPN、链路负载均衡和高可用 (CCNP级别)
三层交换 动态路由(OSPF)、静态路由、EC(端口汇聚)、MSTP+VRRP等 (CCNP级别)
TCPIP
三次握手、四次挥手、状态转换、TCP队列
高可用
架构
服务降级、异地灾备、智能监控
高可用集群
RAID
raid0
N块硬盘分担读写,没有校验和冗余,可靠性差
raid1
1+1,50%利用率,浪费
raid5
N块(≥3)磁盘,数据和校验同时写入N块磁盘,可利用校验位恢复数据
评价
通常用平均无故障时间(MTTF)来度量系统的可靠性,用平均维修时间(MTTR)来度量系统的可维护性。于是可用性被定义为:HA=MTTF/(MTTF+MTTR)*100%
99% 一年宕机时间不超过4天 99.9% 一年宕机时间不超过10小时 99.99% 一年宕机时间不超过1小时 99.999% 一年宕机时间不超过6分钟
数据库高可用
应用层分片、淘宝TDDL、开源:360(Atlas)、阿里(Cobar)、MyCat、MySQL-Proxy、根据业务开发
消除单点
监控
智能监控
zabbix
granfana
prometheus
知识库
上线
灰度
金丝雀
AB
蓝绿
规范
流程
交叉检查/checklist
备用方案
回滚方案
存储
块存储
机械硬盘、SSD、文件系统(ext4、xfs)、LVM、tmpfs
文件分发(多级分发)、文件同步(rsync、inotify)、DRBD、DAS(块存储)
文件存储
NFS(Unix/Linux)、FTP、SAN、iSCSI
分布式存储
对象存储
GlusterFS、MooseFS、Ceph、FastDFS(非对象存储)
三副本/EC4+2 利用率
负载均衡
四层
开源:LVS(IP负载均衡)+Keepalived、Haproxy 商业:F5、Netscaler
七层/SLB
反向代理:Haproxy、Nginx、Apache(根据HTTP协议支持的属性进行L7分发)、A/B Test Gateway、WAF
数据库
分布式缓存
Memcached、Redis(客户端分片、Redis Cluster、Twemproxy、Codis)
NoSQL
Redis、LevelDB(SSDB)、CouchDB、Mongodb、Couchbase 、Cassandra、TiDB(支持MySQL协议)
时间序列DB
RRDTool、Graphite Whisper、OpenTSDB、InfluxDB、KairosDB、ElasticSearch、Hbase
RDBMS
MySQL(PXC集群、MHA)、Oracle(DG、OGG、RAC)、PostgreSQL、SqlServer、SQLite、DB2
大数据
Hadoop生态圈(HDFS、Hive、Hbase、Zookeeper、Pig、Spark、Impala、Kudu)、Mahout智能推荐
web服务
HTTP协议、Web服务器(Apache、Nginx/OpenResty、Tomcat、Resin、Jboss)安全设置、性能优化
配置管理
SaltStack
服务框架
SOA框架(Dubbo)、微服务框架(istio、Spring Cloud)、协议(RPC、RESTful)、框架安全、应用性能监控
反向代理
ATS、Squid、Varnish、Nginx(缓存分级、预缓存、缓存刷新)
掌握NGinx
SDN技术栈
容器技术
docker
kubernates
开源工具
Mininet
Cbench
Iperf
sFlow
Wireshark
编程基础
语言
Java
C
Python
Json/xml
版本管理
git
SVN
模型
YANG
TOSCA
编排技术
Tacker
Heat
ONAP
OSM
MEF LSO
数据面
协议栈
OVS
FD.io/VPP
OpenSwitch
驱动接口
DPDK
P4
IO Visor
网络芯片
CPU
NP
FPGA
ASIC
算法
Hyperscan
云原生网络
XDP
Cilium
Cilium 是近两年最火的云原生网络方案之一。 Cilium 的核心基于 eBPF https://zhuanlan.zhihu.com/p/302637719
eBPF
控制面
北向
RESTCONF
NETCONF
南向
openflow
OVSDB
PCEP
OF-CONFIG
BGP
控制器
OpenDaylight
ONOS
RYU
open contrail
Neutron
OVN
云原生
公有云、私有云(OpenStack/cloudstack+KVM/XEN、oVirt)、混合云
容器化技术
限流
serverless
工具集
编排管理
注册中心/服务治理
基础理论:不可变基础设施/编排技术
devops
价值观
CI/CD
运维管理
变更管理
故障管理
工单管理
作业巡检
应急处理
运维开发
脚本语言
AWK、Sed、Shell、Python、PHP、Perl、Ruby、Lua
消息队列
kafka
rabbitMQ
rocketMQ
日志分析
flume,Flume的日志源可以是mysql数据库
较成熟的日志系统方案ELK:Filebeat(采集) → Logstash(日志解析) → ElasticSearch(日志分析) → Kibana(可视化) filebeat采集后可放入kafka(ELKK)
统一认证
LDAP
LDAP是一个轻量级的产品(LightWeight),是一个Directory(D),存取的协议(Access Protocol)。本质上是数据库。
CAS
SSO 仅仅是一种架构,一种设计,而 CAS 则是实现 SSO 的一种手段。
方案:CAS+LDAP做SSO
分布式架构