在原来只做培训业务的时候,确实对现有DBA人员的发展之路很是担心,但我当时主要考虑的是从广度上怎么解决,我想在条件允许的情况下DBA应该快速成长为符合型人才,以应对当下国产化发展,复杂环境的人才需求阶段,不至于被快速淘汰。
但自从3月接手公司数据库产品业务后,我有了更深一层次的认知,我认为无论是在当前还是未来,专家永远是稀缺的资源。我更明白了恩墨从14年开始做DB行业运维数据化、智能化软件研发,本质就是在解决运维人员和专家不够用的问题,而不是通过DB运维数据库,智能化,让运维人员和专家下岗。
一、市场动能
1、随着人类对互联网应用的依赖度越来越高,产生的数据也会越来越多;
2、用户的需求变的更加多样化,业务系统数量和规模也在快速增加,传统人工运维根本没法应对,那专家更是不够用了;
二、行业要求
1、数据库等IT基础设施类型多元化,异构化,复杂化,运维人员无法快速掌握不同数据库的运维技能;
2、行业安全监管考核越来越严格,需要高度合规。
所以很多行业采用数字智能化、生态化的手段来支撑IT系统运维,绝对不是为了消灭人工,而是尽可能的让人的效率获得数十倍的提高,从而能够应对今后更加多样复杂的IT场景。
2020国泰君安 线上业务办理比例从65% 增长到 90%以上。
新时代证券 线上交易 占比超95%
同时线上交易客户也在持续增长,兴业证券 约20% 的增长, 国信证券 同比 约50%增长。
在传统运维模式下:靠人工完成日常的监控、故障处置、系统安装与变更,而且更多情况下均为后置式解决慢、卡等运维问题。
PK: 客户转型后,布署智能化运维工具:解放专家,让专家从简单的重复性劳动中解放出来。因为对专家来说,如果让他把有限的精力都浪费在上线护航、重复性的巡检工作等方面,实际上对专家来说也是一种浪费。而且如果巡检工作让一个经验不太丰富的工程师来做,那可能系统中存在的一些较为深度的隐患会无法及时发现,以至于后期出现更多致命的问题。
而且如上面举例指出:客户线上用户和办理业务是在不断线性增长的,系统、数据库数量也在日益增加,就单独核心系统数量也从原来的几套增加到几十套甚至几百套,单独靠人工完成月巡检就已经很困难了,如果靠外包驻场增加工程师我想这个资金支出也超出想像。
要解决这个矛盾,让专家即不陷入重复的低级劳动中,又能够实现对关键点的把关,那么我想借助数字化和智能化工具是最佳实践了。
场景展示1:
我们的专家每次只需要登陆到白求恩/zcloud云管平台,查看针对纳管的几十套核心数据库生成的巡检报告以及告警数据,进行下钻诊断分析,或开启智能运维功能,及时解决发生或者潜在的问题,最后直接通过系统生成的报告随时汇报给领导。这整个工作花费的时间正常情况下不会超过一天。
PK:如果按照以前的人工方式去做,认真完成可能要耗费工程师一个多月的时间才能完成。而到那时候,下个月的巡检又要开始了,此处我想很多DBA有所感触!!!
场景展示2:
以往要分析一个问题,DBA大量的时间是在看各种数据上,通过对AWR报告,OSW数据,ASH明细数据等性能报告分析,一点点去发现问题。但往往看到的90%以上的数据实际上对分析本次问题没有直接关联,但必须还要花时间去看,否则可能会忽略掉重要的线索,往往实际上人是比机器更容易犯错的,漏掉重要线索的事情时有发生,这也会严重影响工作效率。
总结:数字化之后重点监控巡检工作可以不需要人工进行,各种异常检测算法、故障模型、健康风险指数等会给我们提供大量的分析结果和建议,这大大减轻了专家的工作量,一个原本需要花半天才能搞清楚的问题,在智能化工具的帮助下,可能十几分钟就可以搞定了。所以我认为利用好工具,在数字化,智能化运维时代专家的意义感会变得越来越大,也有更大的空间快速自我提升,深度钻研,让工作更加有意义!!