随着业务规模的不断扩展,服务器的使用数量也与日俱增,如何应对海量运维面临的挑战?
方法/步骤
1
运维面临的挑战包括:海量域名如何保证就近接入,如何应对出口网络故障;海量的https证书如何高效统一维护。
2
服务器宕机如何保证业务无损和故障自愈,如何维持现网服务的整齐划一,如何应对大型活动事件海量设备的快速缩扩容。
3
海量服务的基础架构需要做到:名字服务实现没有调不走的流量,容错做到没有不能宕机的设备,统一框架提升研发运维效率。
4
名字服务带来的流量快速切换和自动容错对于运维意义重大,是自动化运维的基础,研发侧的应用架构必须支持且纳入考核。
5
保证CMDB数据和现网机器情况的数据一致,同模块下各个IP资源的一致性,配置文件和权限的一致性,都是重要的原则。
6
接入层和逻辑层设备不保存数据,对于通过重启恢复故障,快速进行故障的自动化处理,都具有相当积极的意义。
7
统一原则可以带来维护对象的减少和对上层系统呈现出来的简单,可以大大提升上层自动化系统的可靠性,降低其复杂度。