找回密码
 注册
搜索
热搜: 回贴
微赢网络技术论坛 门户 安全攻防 查看内容

信息化时代的保险公司也要买保险

2009-12-14 02:25| 发布者: admin| 查看: 11| 评论: 0|原作者: 小可爱

 一天,某公司突遭大火,一切工作顿时陷入瘫痪。更为要命的是,在消防车呼啸着奔向火灾现场的同时,大量客户数据正在付之一炬。最终的结局是,这家公司因丢失大部客
  户数据而无法正常营业,只能申请破产保护……
  9·11事件已经远去,但在全世界相继目睹美国东部大停电、SARS、东南亚海啸,以及不断发生的恐怖袭击等突发性灾难事件后,谁也不知晓麻烦何时再度登门。特别是随着各行业对数据信息的依赖越来越强烈,灾难完全可能给企业造成毁灭性打击。而前述一幕就在9·11后的华尔街活生生地上演过。
  “防患于未然”。随着信息化建设的深入,在灾难发生之前就考虑到如何使业务影响尽可能降到最低,是每一个企业管理者必须重视的问题,尤其对于保险公司等完全依赖海量客户数据生存的企业而言,提前做好数据的“保险”工作至关重要。
  有灾难一定有损失
  “你对我们使用灾备系统有点奇怪,是吗?”中国平安保险(集团)股份有限公司(以下简称平安保险)IT总监罗世礼反问《IT时代周刊》,“因为这是全国保险企业的第一次尝试。”
  罗世礼所提及的灾备系统,指的是平安保险在中国惠普公司帮助下,于近期正式启用的“IT系统灾难恢复计划”(以下简称“灾难恢复计划”)。简单地说,平安保险所有的关键数据都存储在深圳和上海两地的数据中心,深圳方面有新数据产生,就可以在千里之外的上海灾备恢复中心做好备份。这样,一旦平安保险总部遭遇故障或者灾难,深圳的数据中心无法正常运行时,“灾难恢复计划”会启动上海灾备恢复中心,以保证该公司遍布全国的保险业务不受太大影响。据了解,在紧急情况发生后,平安保险可恢复80%的IT处理能力,保证关键业务持续运行。
  鉴于灾难的全球性和毁灭性,国务院信息化工作办公室决定,在国内8大行业全面建立容灾系统。2005年1月13日,国务院信息化工作办公室还将银行、电力、铁路、民航、证券、保险、海关、税务等8大重点行业相关主管部门的信息安全专家召集一堂,就灾难恢复预案的制订、落实和管理等一系列问题进行了讨论,并确定了相关《指南》的框架及内容,其中明确要求8大行业企业建立容灾系统,做好容灾工作。
  中国保险监督管理委员会统计信息部的工作人员告诉《IT时代周刊》:“保监会对全国的保险企业做出了数据容灾的规范化要求,但国内企业对此并不重视。和国外同类企业相比,中国保险业不仅在容灾、备灾的意识方面较为落后,投入方面更是远远不够。”
  “当前,有些保险公司抱有侥幸心理,认为灾难离自己很远,为此大量投资有些得不偿失。”保监会工作人员剖析国内保险公司的信息安全观时谈了自己的看法。而对于保险企业是否需要容灾系统这个问题,具有丰富灾备实施经验的中国惠普公司运维服务事业部高级顾问柳勤指出,按照计算,各大保险公司每天通过网络、电话和营业厅处理上万笔业务,尤其是全国各地24小时都可能出现的车险。他说:“如果数据系统停顿24小时,会给保险公司造成几十万笔数据量的损失。”
  见证了平安保险实现“灾难恢复”的罗世礼明确指出,业界要明确一个很重要的概念,即灾难一定会造成损失,而保险公司惟一能做的工作是如何把灾难损失降低到可承受的限度内。
  给保险公司买“保险”
  保险公司越来越依赖于计算机,无论硬件还是软件故障都会带来不便,等待系统恢复浪费的时间也就罢了,保户数据丢失则是任何保险企业的噩梦。但是对于平安保险来说,上马“IT系统灾难恢复计划”的直接动因却有可能是年初出现的东南亚海啸等自然灾难,因为一旦深圳出现类似事件,深圳数据中心必将瘫痪,整体业务肯定随之停顿。
  在此前的一系列信息化建设中,平安保险开通了电话、在线申请保险等方便保户的手段,这显然需要一个24小时运行正常的后台信息系统支撑。据了解,平安保险的信息化平台涵盖整个公司运作的各方面,包括投保、理赔、客服、销售支持和管理、经营决策支持、财务和人事等。
  “业务部门应该从能忍受多少损失的角度来考虑灾备,就必须首先要明确自己可以忍受的故障时间,和能忍受的数据丢失时间。”罗世礼说,“比如有些业务可以忍受没有IT系统的天数为3天或1天,而有些业务只能忍受更短时间,甚至到数个小时。对于丢失的数据,有些业务数据可以由分支机构重新录入,恢复丢失的数据。”
  据介绍,根据业务性质的差异,平安保险对不同部门的数据恢复做了不同的处理。
  积极参与平安保险项目实施的柳勤告诉本刊记者,平安保险有100个系统,而需要提供保护的关键系统为58个。“这需要落实58个系统中每个业务系统的‘灾难恢复时间’和‘灾难恢复数据指标’,通过制定这两个指标,最后确定率先恢复哪些系统,哪些设备需要临时重新采购设备和重新搭建。”柳勤说,“最后所有的系统都会回来,只是时间早晚的问题。”
  根据平安保险的规划,该公司的人事薪酬系统也在灾难恢复计划之列,但并不需要最优先恢复。该系统的应急处理措施就是发和上个月一样的薪酬,不一定很快恢复系统。在罗世礼看来,遇到灾难后第一时间需要恢复的是网络通信、邮件系统和关键业务系统,这能够使保险公司的寿险和产险业务持续开展。
  然而,除了考虑业务的轻重缓急,灾备中心的距离也值得重点研究。据了解,由于一些位于纽约世贸大厦内的公司将灾备中心仅放在同一大厦的不同楼层,结果9·11事件发生后,不仅主中心没有了,灾备中心也跟着消失了。因此,现在一些美国公司将两个数据中心分别放到了美国的东、西海岸。
  “所以,我们平安保险将主中心和备份中心分别放置在相隔千里的深圳和上海。”罗世礼说。
  灾难恢复是系统工程
  据专家分析,IT公司上马灾难恢复计划仅是做了保险工作的第一步,而能否在灾后正确、顺利地实施才最为关键。罗世礼就认为,容灾技术只是一小部分,更重要是整个灾难出现以后怎样把灾备系统运转起来。
  从系统中断到使用灾备恢复中心的系统,从技术上来看需要的时间很短,但由于灾难恢复是重大的决定,这意味着主中心和备份中心的机器不可能自动切换,需要由相关领导来做决定是否启动数据恢复计划。
  “首先要判断发生的是否是灾难。如果是灾难,要明白哪些业务彻底受损,哪些数据被破坏了但还能恢复;如果只是停电、火灾等突发事件,要知晓多久才能恢复正常,在此期间哪些业务可能受损等。或者已决定按照灾难恢复计划启动上海备份中心,就还需了解上海方面需要支持几天,甚至是很长一段时间。”据此,罗世礼认为启动灾难恢复计划实际上是一个庞大的系统工程。
  为此,在中国惠普的帮助下,平安保险建立了完善的灾难恢复工作流程和灾难恢复组织结构,并定期举行灾难恢复演习,一方面为了及时发现操作流程中可能出现的问题,二是每次演习后员工对灾难恢复工作的了解逐渐加深,并有助于培养员工的应急处理能力。据柳勤介绍,在他们前3次灾难切换测试和演习中,第一次发现了200多个问题,在纠正后的第二次演习中,出现的问题就不到100个,而最后一次问题更不到10个。
  “在整个计划当中,包括交接班都要做详细规定,哪些事项要做交代,哪些数据需要确认等,这些都是通过测试来一次次解决的。” 柳勤说,“整个流程和管理上的优化尤其重要。在多次演习中把问题尽可能消灭,当真正遇到灾难发生时,才能迅速按照灾难恢复计划组织人员,按照事先的计划应对,不至于手忙脚乱,灾难恢复计划得以顺利实施,这对数据迅速、安全地恢复很有意义。”
  “关于这些灾难的程度判别和启动程序,事先我们做了详细的定义,因此在灾难恢复计划中所谓的人为判断,也并非主观随意。”罗世礼说。

最新评论

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-10-1 07:39 , Processed in 0.238721 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部