网络安全

    网络安全都搞不定 还怎么玩“互联网+”

         [ 趣味科技 转载 ] 暂无评论

      接二连三的瘫痪事故

      最近这几天,互联网圈子显得格外热闹。其中携程旅行网的数据瘫痪无疑是其中最有代表性的事件之一。为了帮助大家温故知新,我们不妨对这起事件做一个简单回顾:

      5月28日上午11时左右,携程旅行网官方网站和携程App均陷入瘫痪,时隔两小时之后,相关服务依旧未能恢复,网站首页挂出“正在紧急修复中……您可以访问:艺龙旅行网”字样。有意思的是下午17点左右,艺龙旅行网首页也出现了无法访问现象,幸好不久后又恢复正常。

      5月28日晚约22点45分,携程旅行网及携程App开始恢复正常服务。5月29日凌晨1点30分,携程官方称经技术排查,确认此次事件是员工错误操作导致。数据没有丢失,预订数据也保存完整。

      以为这就是笔者要说的全部?那您可就大错特错了。如果把最近这一个月国内互联网企业爆出的网络安全事件全部列出来,估计绝对能吓您一跳:

      1、5月10日,陌陌App出现网络故障,暂时无法正常使用;

      2、5月11日,网易遭受攻击,所有服务突然大面积瘫痪,移动应用、游戏均无法访问;

      3、5月27日,支付宝遭遇短暂的瘫痪事故,数小时后恢复正常;

      4、5月28日,携程旅行网的官方网站和App长时间陷入瘫痪无法使用;

      5、5月29日,招商证券、同花顺齐鲁证券均显示系统错误或无法登录。

      在互联网已经高度普及的今天,越来越多企业的业务开展、运营方式甚至商业模式都开始与互联网紧密相连,互联网应用及服务也由此像水、电、天然气一样,成为了广大人民日常工作和生活中不可或缺的部分。

      然而当上述事件爆发时,许多用户才突然发现,原来自己早就习以为常的这些互联网服务,竟然是如此脆弱。

      事故频发暴露的问题

      为什么在意外事故发生时,这些知名的互联网企业会显得如此脆弱?说好的业务连续性呢?说好的容灾备份呢?说好的异地多活呢?

      按常理来说,根据国际通行的技术安全标准,像携程旅行网这样大规模并且已经成功上市的互联网企业,不但其所有数据必须实时备份,并且在容灾备份方面,也应当提供多套数据备份方案和存储方式。要依照国外安全机构的惯例,还应该定期对企业数据备份和恢复进行演练。但是从频繁发生的瘫痪事故来看,所谓的数据备份和恢复演练,在国内不少互联网企业中只不过是一项摆设而已。

      由此我们可以看出,近期频频爆发的互联网企业宕机事件,暴露出的并不仅仅是数据中心恢复和技术方面的问题,还有企业自身在网络安全运营、管理等方面的严重缺失。

      既然如此,那么问题就来了:置身于“互联网+”时代,企业应该如何应对数据管理、业务连续性等问题?在综合比较了一下目前国际上成熟的公有云服务体系和架构之后,笔者斗胆为国内企业提几个建议。

      从运营管理上未雨绸缪

      首先,要想避免瘫痪事故的再度发生,企业不仅需要来自IT基础架构的技术支撑,更需要从运营、管理上来保障自身的网络安全。换句话来说,要想敏捷、妥善地解决类似问题,企业不仅需要配备强大的技术能力,而且还需要在问题出现之前,就从技术、运营及管理等层面来尽量避免问题的发生,这样才能将事故发生的概率和破坏性降到最低。

      以微软和世纪互联合作的Windows Azure公有云服务为例,其为企业提供的不只是技术支持,还有一套整合了运维的解决方案。其中负责运营的世纪互联提供了SLA(Service Level Agreement,服务水平协议)高达99.95%的有财务保障的云服务,相当于每年停机时间不超过53分钟。这样在保证云服务可靠性及客户业务连续性的同时,还帮助客户减少了硬件和维护成本。此外世纪互联还与中国互联网络信息中心(CNNIC)合作,在所有服务器上均部署了CNNIC服务器证书(SSL证书),以确保平台数据在传输和保存过程中的安全性、保密性、可确认性。

      建立完善灾难恢复计划

      其次,为了确保企业基于云的服务的业务连续性,同时减轻任何潜在数据损失的影响,企业在容灾备份方面,也应当选用具有完善灾难恢复计划的公有云服务。这是因为企业如果要自建一套灾难恢复的完整系统,那么就得负担数据中心基础设施、容灾备份架构、应急恢复预案等一系列开销,代价过于高昂。而租用公有云不仅可以节省开支,而且在事故发生时也可利用公有云提供的灾备服务,快速恢复业务的正常运转。

      以大家熟知的亚马逊AWS为例,其在为用户提供公有云服务的同时,也能够提供可根据负载量快速扩展的数据备份和快速灾难恢复。来自第三方机构CloudHarmony的调研数据显示,亚马逊的EC2(Elastic Compute Cloud,弹性计算云)在2014年的正常运行时间比率达到了99.9974%。

      除了亚马逊之外,微软在公有云服务商的做法也可以作为参考。微软在全球分布的失效备援能力操作中心,一年365天、一周7天、一天24小时均配有人员值班。这就保证了一旦发现问题,微软工程师都能够抢在第一时间迅速对其进行分类、缓解以及升级。

      使用地理冗余虚拟主机

      为了打造更加全面的灾备和恢复策略,针对带有企业要害应用和数据可用性需求的服务,国际公有云通常都会使用地理冗余虚拟主机,也就是通过在不同地理位置建立数据中心,为企业提供更多的选择冗余数据存储和地理隔离的虚拟主机服务。

      以微软云Azure为例,其运行的每个国家都会由相应地区的一级和二级数据中心来提供服务。譬如在中国,就分别在北京和上海设立了两个可以互为灾备的大型数据中心,其中企业在每个数据中心可存储3个备份,也就是一共有6个数据备份,最大限度地保障了客户的数据安全。

      最近,另一家国际公有云提供商——IBM旗下的SoftLayer也在荷兰阿姆斯特丹的阿尔梅勒开设了第二个云服务器数据中心。这样通过地理上的多样性,在遇到突发事件时,用户可以迅速恢复其数据或平衡改道地点之间的工作负载。(本文转载自“趣味科技”)

    标签:防火墙

    关注排行榜

    防火墙UTM上网行为防毒墙

    文章推荐

    互动沙龙

    相关内容 网友评论 返回首页
    专家咨询