热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【案例集】金融行业IT运维精选案例集

IT运维指,根据业务需要规划信息、网络、服务,通过网络监控、事件预警、业务调度、排障升级等手段,使服务处于长期稳定可用状态。IT运维范围涵盖网络、服务器、系统、环境、应用、监控、虚

IT运维指,根据业务需要规划信息、网络、服务,通过网络监控、事件预警、业务调度、排障升级等手段,使服务处于长期稳定可用状态。IT运维范围涵盖网络、服务器、系统、环境、应用、监控、虚拟化、容器化、自动化、智能化等众多领域。运维体系经历了从人工运维到自动化运维的转变,正迈向智能化运维的新阶段。

对于金融行业来说,运维是科技管理的核心和重点工作,是金融企业数字化转型的助推器,关键信息基础设施的稳定运行需要更规范、标准化的运维能力,核心业务需求的快速响应需要更高效、自动化的运维能力,产业跨界融合发展需要更立体、平台化的运维能力。央行《金融科技发展规划(2022-2025年)》提出,建立健全金融数据中心智能化运维机制,加强多场景协同联动、多节点一体管控,提升节点感知、异常发现和故障预测能力,降低人工操作风险,推动运维管理模式转型升级。是保障金融业务稳定运行的关键环节。银保监会下发的《关于银行业保险业数字化转型的指导意见》中,提到要建立“前端敏态、后端稳态”的运行模式,同时还需建立能够快速响应需求的敏捷研发运维体系,积极引入研发运维一体化工具等科技能力建设。

金科创新社收集、归纳、整理了近年来金融行业 50个IT运维案例,按照云运维、应用运维、系统运维、运维开发、运维安全等内容进行分类,以期推动金融IT运维从传统运维向智能运维转型,探索运维新模式,实现运维更高效、更安全并可持续的业务目标,助力金融数字化转型构筑坚实数字底座。

云运维

金融行业云计算、虚拟化技术的发展,给运维带来新的挑战:一是资源池基础架构多样,异构资源池难以有效的统一管理与调度;二是业务系统上云后,管理理念、技术工具、业务流程未充分融合,导致在提升效率,释放IT人力资源的效果并不明显;三是数据中心云化后,资源快速部署,自助交付效率逐渐成为瓶颈。光大证券、北京农商银行、贵州农信等金融机构在多云异构管理、灾备云建设等方面进行了有益探索。

光大证券:数智化数据中心多云管理平台

光大证券数智化数据中心多云管理平台(MCMP)实现多云(私有基础设施云、桌面云、容器云和公有云)服务和资源的统筹管理。MCMP在多云异构资源池管理、跨云资源调度和编排、智能管控、统一自助交付及运营管理五个功能领域提供了“自助、敏捷、开放”运营一体的服务能力。

北京农商银行:云平台建设项目

云平台创新项目通过构建标准化、完整的IaaS、云平台、规范、流程, 建立起标准化、自动化,支持快速开发测试与管理的一体化云平台, 屏蔽异构的底层硬件复杂环境,实现了在混合IT环境下统一部署交付混合IT资源和环境, 统一部署交付各类应用业务系统。

云平台项目采用成熟度较高的商业云计算平台产品,形成具有本行特色的商业云计算落地最佳实践,制定了一体化管理框架;采用多台服务器实现分布式存储以及计算与内存池化,提高了系统的可靠性、可用性、可扩展性和存取效率;建立了IAAS+的私有云平台,形成资源层、平台层灵活调度的敏捷环境,为开发测试提供了快速可靠的IT资源交付服务。

贵州农信:观山湖数据中心工程建设云管理平台

云管理平台通过负载均衡和资源均衡的策略,从共享资源池中为上层的应用系统创建和提供运行环境。其总体架构设计可分为:硬件基础设施层、云资源调度层、云资源服务层以及云资源应用层。通过采用实时高效能耗监控和管理技术、资源智能运维技术,实现了云计算环境资源能效管理和智能运维。

应用运维

金融企业业务、科技的快速发展,应用系统、数据量、IT基础设施数量和规模越来越大,系统间关联关系越来越复杂,操作风险、运维成本、应急能力等诸多问题日益显现,应用运维以保障生产系统安全稳定运行为目标,通过优化线上服务的发布变更、服务健康状况监控、服务的容灾高可用和数据安全备份等工作,不断提升运维精细化水平。珠江人寿、农信银资金清算中心、福建农信等金融企业在业务运维平台、日志分析平台、自动化运维方面的创新经验值得借鉴。

珠江人寿:智能业务运维平台

智能业务运维平台包含应用性能分析、用户体验分析、可视化分析数据展示、统一运维门户等功能,支持监控系统底层代码、系统内部及系统间接口的调用链,实现端对端的数据链路分析,从而形成完整系统拓扑图,实现系统性能分析及系统定位故障。

平台主要实现以下关键目标:一是应用性能分析,通过分析实现对移动互联网服务系统、业务支撑系统的运行性能与故障状况进行实时的监控与定位,对问题进行提前预警与实时告警;二是用户体验分析,通过采集、统计与分析每位用户使用系统的性能状态,主动掌握用户在使用系统过程中出现的异常问题,先于用户发现并解决问题,提高服务质量与提升用户体验;三是业务健康度分析,通过对关键业务的业务量、业务健康情况进行分析,为业务部门进行业务流程优化、制定营销策略等提供决策依据;四是可视化数据展示,通过可视化技术展示监控对象的关键运行数据,如系统拓扑图、业务健康度数据、系统故障数据、基础资源使用情况数据等。

农信银资金清算中心:智能日志分析平台

农信银支付清算系统覆盖全国8万家农村中小金融机构的业务网点,其所提供的金融服务惠及近10亿农村地区用户。覆盖全机构业务系统的实时日志分析平台,通过日志分析加强业务运维支撑能力。

福建农信:自动化运维系统项目

自动化运维系统是以流程管理为核心,以保障安全和提升效率为理念,系统包括作业调度、应急操作、健康巡检、灾备切换、脚本服务、文件同步等功能模块。项目立足于解决IT运维中的痛点,着力实现运维操作标准化、管理精细化,提升运维服务水平,主要在以下方面进行了创新:一是实现作业可视化、集中管理,通过对各类定时作业、批量作业进行梳理,经过流程化改造接入自动化运维系统,将分散在各个应用系统的服务器的批量作业集中管控;实现作业开发配置可视化,运行结果监控可视化,异常处理处置流程规范化,关联作业可设置依赖关系;作业支持集群调用,规避作业单点风险。二是实现自动化灾备切换,通过自动化运维系统实现灾备切换的自动化,解决手工操作,切换时间长,切换效率低的问题,有效降低RTO;实现灾备切换过程可视化,切换风险可控;实现灾备切换流程可固化,切换执行步骤、脚本可集中管控,使得切换的知识、经验可传承。三是实现环境一致性,通过文件同步模块实现可视化界面,进行环境同步配置和同步状态实时展示与监控,有效确保灾备环境的可用性。

系统运维

数字化转型已经成为金融企业保持竞争力、拓展业务边界的必经之路。这让数字底座的金融IT基础设施运维面临海量数据、架构转型等挑战。系统运维聚焦基础服务和底层网络,关注性能、可用性、稳定性及负载调度能力等,前海人寿、兴业银行等金融机构自动化、智能化运维实践带来有益的思考和启发。

前海人寿:162自动化运维平台

162自动化运维平台综合利用了风险管理、质量管理、大数据分析及多种新技术,以活动事务过程管控为基础,发挥IT系统运行数据积累优势,对运行风险诱因进行管理,化被动为主动,构建了一个过程治理数据、数据驱动流程、流程驱动管理、管理促进规范的服务管理闭环。

平台承载超过200多个应用系统的管理支持工作。其中,ARMS应用资源管理系统,管理涉及基础设施类、应用系统类、信息安全类等应用基础资源数千项;ODAP运营数据分析平台,日分析上亿数据量,产生近200张各类型清单报表,涉及指标分析、IT服务、监管审计、监控分析、安全与桌面、版本分析、定采需求等;ASM应用监控平台,实施监控目标作业数千个,预警消息推送及监控告警超过1000笔/天,主动及时发现大量的生产问题隐患并推动问题解决;IT服务管理系统通过ITSM处理IT服务事件、权限作业、生产异常、变更请求、数据处理等超过1000笔/月。

兴业银行:商业银行一体化智能运维平台

一体化智能运维平台是将兴业银行福州中山机房、马江机房、上海张江机房及各分行的主机、服务器和网络等各种生产设备以及各地运维人力资源纳入到统一的运维平台来管理,以提高全行运行维护的的可靠性和安全性的实践。

该平台的建设完善了兴业银行完整的运维授权访问控制体系,实现运维人员身份认证、运维操作和访问控制、设备密码的统一管理,实现了集中的用户访问痕迹跟踪和审计,实现跨区域、跨机房维护,提高了运维工作效率,保障了全行各信息系统安全、稳定、高效运行。 

运维开发

随着金融业务的高速发展,以及大量新技术的引入,对传统的运维管理方法提出挑战。在高速变化的环境下,系统如何保持可用性要求,需要有更先进的IT管理思路和更高效的运维管理平台。运维开发指运维平台设计、开发和实施部署,郑州银行、哈密商业银行、江西农信等金融企业在DevOps、统一运维管理平台、智能运维平台方面进行了创新实践。

郑州银行:DevOps工具链容器化项目

项目主要内容包括规划和搭建应用容器云平台(DevOps环境)及其管理端。容器云平台采用云原生开源的K8S+Docker技术,根据应用需求,搭建开发测试集群、DMZ集群、互联网应用集群3套业务集群,并通过管理平台实现统一管理。在开发测试中心的开发测试区、DMZ区、互联网应用区各搭建1套高可用集群,实现互联网应用区的应用通过DMZ区暴露到外部访问,并在开发测试区和互联网应用区均提供共享存储,满足集群应用的数据持久化需求。所有集群共同使用同一镜像仓库。管理平台可以对多集群进行统一的可视化管理,提供多集群的注册、修改、运维、监控等核心功能支持,实现多集群的一站式管理。

哈密市商业银行:IT运维数字化转型的场景实践

IT运维管理平台实现一套管控体系、一套低代码与运维开发方法;通过建立统一运维管理平台,整合贯通CMDB、流程平台、监控平台、运维数据分析、知识库、门户及可视化等,实现企业IT运维工具化、可视化、标准化、数字化、一体化的体系化演进。

哈密银行采用数字化驱动运维战略,底层依托大数据平台的算力,实现运维数据的采、存、管、析、用,从监、管、控三方面整体提升运维能力。建立监控体系使监控平台覆盖运维全领域,实现运维数据数字化,并围绕CMDB配置管理作为主数据,建立指标、日志、告警、工单等统一运维大数据模型。基于可视化、低代码的编排设计引擎界面,实现对数据接入、数据标准、数据治理、数据消费、算法服务的闭环,进而提供可视化、白盒化的数据算法和训练能力。构建面向业务视角的数据地图和服务目录,促进数据的分析消费和深度挖掘,大幅提升运维数据资产的价值,提高问题处理的效率。

江西农信:基于大数据与人工智能的农信行业智能运维体系建设

智能运维平台的整体系统架构采用Hadoop和Elasticsearch作为存储和计算的支撑平台,开放式的智能模型架构提供智能能力输出,通过基于微服务与分布式消息的运维管理总线为主线,搭建而成。

功能上,实现应用系统交易智能分析、企业级系统智能感知、企业级数据库智能洞察、企业级运维智能提升、企业级存储智能评估。

技术创新上,一是为满足业务日志采集实时性、高吞吐量以及系统资源低消耗的要求,对Flume在源码层面进行大量改造和验证,保障数据采集层长期稳定运行;二是应用微服务设计理念,数据解析实现完全的配置化定义,并对外以RESTful接口提供调用,快速响应用户需求的变化;三是结合缓存集群以及Structured Streaming的使用,完成如交易日志合并、异步消息处理等复杂业务逻辑的实现;四是整个运维大数据平台基于虚拟化平台构建,具备完全的资源动态扩容与调整能力。

运维安全

近几年来由于运维管理不当造成金融机构信息科技风险事件时有发生。运维安全负责各方面的安全加固工作,如安全扫描、渗透测试等,进行安全工具和系统研发以及安全事件应急处理,对于信息科技风险的有效控制和管理至关重要。

恒丰银行:安全开发运营管理解决方案

平台将安全业务自动化处理与数据深度挖掘相结合,优化企业安全处理过程,结合人、资产、威胁、法规政策等相关因素,做到真正的移动业务风险管理。大数据技术使原有被动式的事前策略预防,事中处理和事后审计流程,转为更加主动的自动评估预测与智能检测加固防护,帮助企业安全管理部门实现从追求功能价值到追求数据价值的核心诉求。

平台主要包含数据感知中心、数据流程中心与数据展现中心三个主要功能模块,数据感知中心集成行业最先进的源代码安全测试、应用安全检测、基础环境漏洞扫描、基础环境安全配置核查、Web安全检测工具等,对于具体的移动业务自动进行安全感知数据搜集。数据流程中心与前后端主流管理软件jenkins、DevOps、OpenStack、项目管理系统等平台数据交互,形成以安全漏洞视角为核心的问题处理流程管理机制,对于问题进行过程管控与预警通告,同时建立以零日威胁防护为目标的应急响应机制。数据展现中心则将安全过程数据、安全生产数据与安全结果数据进行业务建模与数据挖掘,提供业务安全评估、已知风险统计、业务安全溯源与安全态势预测的深度数据服务。展现中心特有的数据量化展现工具,可与现行政策法规与企业安全基线相结合,形成问题源、风险关联、事件过程与态势影响的企业实时全景安全监控。

吉林农信:基于模拟仿真技术的自动化业务拨测系统

为加强科技风险防范能力,提升运维管理水平,吉林农信结合自身运维体系的建设情况,以客户体验为中心,利用模拟仿真、自动化技术,建立业务拨测系统,对业务进行监控,避免业务故障发现、处理不及时,影响客户满意度进而造成客户流失;实现及时、有效获取系统可靠性指标(可用率、MTBF、MTTR、MTTF等重要指标);增加主动监控维度,驱动现有监控体系形成良性、自优化闭环体系;形成应用系统级别的故障定位,及构建业务故障影响范围快速判定方法;弥补现有运维体系存在短板,解决交易监控系统夜间无交易情况下的盲区。


注:金融行业IT运维精选案例集来源于金科创新社近年来主办、协办的评选活动及网络。


图片

扫码查看IT运维51个精选案例


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文探讨了容器技术在安全方面面临的挑战,并提出了相应的解决方案。多租户保护、用户访问控制、中毒的镜像、验证和加密、容器守护以及容器监控都是容器技术中需要关注的安全问题。通过在虚拟机中运行容器、限制特权升级、使用受信任的镜像库、进行验证和加密、限制容器守护进程的访问以及监控容器栈,可以提高容器技术的安全性。未来,随着容器技术的发展,还需解决诸如硬件支持、软件定义基础设施集成等挑战。 ... [详细]
  • 朱晔的互联网架构实践心得S1E7:三十种架构设计模式(上)【下载本文PDF进行阅读】设计模式是前人通过大量的实践总结出来的一些经验总结和最佳实践。在经过多年的软件开发实践之后,回过头 ... [详细]
  • 本文介绍了Hyperledger Fabric外部链码构建与运行的相关知识,包括在Hyperledger Fabric 2.0版本之前链码构建和运行的困难性,外部构建模式的实现原理以及外部构建和运行API的使用方法。通过本文的介绍,读者可以了解到如何利用外部构建和运行的方式来实现链码的构建和运行,并且不再受限于特定的语言和部署环境。 ... [详细]
  • 在重复造轮子的情况下用ProxyServlet反向代理来减少工作量
    像不少公司内部不同团队都会自己研发自己工具产品,当各个产品逐渐成熟,到达了一定的发展瓶颈,同时每个产品都有着自己的入口,用户 ... [详细]
  • Linux如何安装Mongodb的详细步骤和注意事项
    本文介绍了Linux如何安装Mongodb的详细步骤和注意事项,同时介绍了Mongodb的特点和优势。Mongodb是一个开源的数据库,适用于各种规模的企业和各类应用程序。它具有灵活的数据模式和高性能的数据读写操作,能够提高企业的敏捷性和可扩展性。文章还提供了Mongodb的下载安装包地址。 ... [详细]
  • Oracle优化新常态的五大禁止及其性能隐患
    本文介绍了Oracle优化新常态中的五大禁止措施,包括禁止外键、禁止视图、禁止触发器、禁止存储过程和禁止JOB,并分析了这些禁止措施可能带来的性能隐患。文章还讨论了这些禁止措施在C/S架构和B/S架构中的不同应用情况,并提出了解决方案。 ... [详细]
  • 如何使用代理服务器进行网页抓取?
    本文介绍了如何使用代理服务器进行网页抓取,并探讨了数据驱动对竞争优势的重要性。通过网页抓取,企业可以快速获取并分析大量与需求相关的数据,从而制定营销战略。同时,网页抓取还可以帮助电子商务公司在竞争对手的网站上下载数百页的有用数据,提高销售增长和毛利率。 ... [详细]
  • ElasticSerach初探第一篇认识ES+环境搭建+简单MySQL数据同步+SpringBoot整合ES
    一、认识ElasticSearch是一个基于Lucene的开源搜索引擎,通过简单的RESTfulAPI来隐藏Lucene的复杂性。全文搜索,分析系统&# ... [详细]
  • {moduleinfo:{card_count:[{count_phone:1,count:1}],search_count:[{count_phone:4 ... [详细]
  • 14亿人的大项目,腾讯云数据库拿下!
    全国人 ... [详细]
  • 什么是大数据lambda架构
    一、什么是Lambda架构Lambda架构由Storm的作者[NathanMarz]提出,根据维基百科的定义,Lambda架构的设计是为了在处理大规模数 ... [详细]
  • FIN7后门工具伪装成白帽工具进行传播
    fin7,后门,工具,伪装,成,白, ... [详细]
  • Zookeeper 总结与面试题汇总
    Zookeeper总结与面试题汇总,Go语言社区,Golang程序员人脉社 ... [详细]
  • 解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法
    本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法,包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时,还介绍了修改nginx的error.log日志级别为debug,以便查看详细日志信息。 ... [详细]
author-avatar
佳蓁政睿9
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有