澳年夜利亚收集平安评价始创公司UpGuard梳理了曩昔几年的信息平安变乱,列出了7年夜本为主动化公司IT体系却招致严重信息泄漏的平安实例。
1. Healthcare.gov:一个忽视断送美国当局的医疗安康网站
2013年10月,美国当局履行《平价医疗法案》的网上挂号对象时,Healthcare.gov被寄与厚望;而数百万国民安康保证的交付压力,让风险愈来愈高。因而,当该网站上线仅2小时就因严重软件毛病而瓦解时,当局遭到了相当年夜的抵抗。因为缺少集成、可见性和测试,该项目从一开端就埋下了严重隐患——Healthcare.gov的账户创立功效“ Account Lite ”中存在跨越100个缺点。
因为其功效,Account Lite 是 Healthcare.gov 网站的主要构成部门,供人们创立账户并拜访本身的医疗安康选项。该模块成绩太多,注定要激发灾害。虽然如斯,承包商照样照原样推动了。
软件宣布掉败了,让数百万国民没法取得医疗保证。更遭的是,网站瓦解还激发了政治衍生影响,让《平价医疗法案》的否决者开端征引该事宜作为当局没法成长胜利医疗保证项目标铁证。网站终究稳固了上去,但并应在宣布前就集成的任务,倒是在瓦解产生后才做完。
2. Dropbox:让Dropbox失落线的小缺点
没有哪一个IT团队会爱好失落线阅历,特别是失落线形成团队必需马不停蹄完成应急规程的时刻。2014年1月,Dropbox就对一次筹划产物进级形成的3小时失落线抓狂不已。
Dropbox剧本中的一个“小缺点”,主动将其更新运用到了几台运动主机上,因而,上千台产物办事器遭到影响,激发该公司在线办事瓦解。荣幸的是,Dropbox的应急规程设计优越且有用。IT团队在备份和恢复战略的赞助下,在3小时内胜利恢复了年夜部门办事。但是,某些年夜型数据库的恢复就慢很多了——全体焦点办事完整恢复花去了Dropbox数天的时光。
3. 亚马逊/DynamoDB:DynamoDB数据库搅乱亚马逊基本举措措施
正如物流之类物理办事须要途径交通如许的物理基本举措措施,公司企业的数字办事也依附于底层数字基本举措措施。2015年9月,亚马逊主动化基本举措措施进程中止,形成AWS平台宕机。从简略收集中止级联反响成年夜面积办事失落线,亚马逊阅历了传统外部数据中间才会阅历的那种断网——虽然它有异常先辈和集成的云平台。
亚马逊的收集中止影响到其一部门DynamoDB云数据库的存储办事器。此事产生时,一些存储办事器还在要求其成员资历数据。因而,断线形成了检索和传输超时,这些办事器没法取得本身的成员资历数据,主动加入了办事。
当那些没法取得要求的办事器开端从新测验考试要求的时刻,DynamoDB超时成绩便激发了更年夜面积的断网。如斯,恶性轮回发生,亚马逊客户有5个小时没法应用AWS。
4. Opsmatic:后患无限
托管在传统办事器治理之下时,主动化常常也面对异样的古早IT成绩。个中一个经典假定是:“没坏就别修复”——假定一切体系都按预设方法运转。所以,Opsmatic的惯例办事器保护弄摊了其全部运营时,本源就出在工作并没有像他们原认为的那样停止。
该案例中,名为“消除默许用户”的计划在该公司AWS试验晚期阶段被创立。现在,测试曩昔良久以后,该流程仍在临盆办事器上静静运转,保护人员基本不得而知。
就像许多严重毛病一样,该事宜也是历久的无意之掉形成的,这些小过掉逐步积聚,终酿年夜祸。
5. Knight Capital:拼写毛病致10亿美元丧失
不只仅是治理性IT进程,其算法生意业务也被 Knight Capital 主动化了。但是,不幸的是,在真金白银处置事务中,这些转变和筹划外的毛病是有能够很快产生的。2012年,由于一个渺小的毛病,Knight Capital 在45分钟里以 $172,222/秒 的速度年夜量丧失资金。
年夜范围数据中间运营中,办事器集群平日都邑履行单个功效。如许可以将负载分派到更多的运算资本上,为高流量运用供给更好的机能表示。该形式请求集群中一切办事器都采取雷同的设置装备摆设,不管功效用到的是集群中哪一个详细的办事器,如许一切的运用就会有雷同的表示。但是,设置装备摆设这类器械,即使准备的时刻是雷同的,也老是会逐步涌现误差的。
虽然做了主动化,Knight Capital 在办事器阵列上的代码安排却照样手动的,而一个弗成防止的工资毛病,招致了其8台办事器的设置装备摆设与其他办事器分歧。Knight Capital 的技巧人员在安排新办事器代码时出了这个小毛病,但却没人发明。IT员工便一向在这些办事器都是雷同设置装备摆设的毛病认知下操作。
同时,一段曾经服役的代码在毛病设置装备摆设的办事器上依然可用。是以,该办事器开端向特定生意业务中间发送指令,环绕股票生意业务的多米诺骨牌效应发生,4.65亿美元生意业务丧失弗成防止。
6. 达美航空:主动化致航班停飞
年夜型物流运营依附主动化体系杀青范围化所需的速度请求。有些航空公司在保持这些体系运转上寸步难行。就像传统的人工体系治理方法,主动化体系也遭到毛病设置装备摆设的损害。比来几年的最糟情况,就是这些体系宕机形成航空公司上亿美元的丧失,及其客户信用的损失。
毛病设置装备摆设产生时,经由过程主动化机制,毛病会被很快推送,形成全部体系宕机。对航空公司而言,这意味着航班运营中止,飞机耽搁,资金析出。2017年1月就产生过相似事宜,达美航空主动化体系中的一个小毛病激发断电,给航空公司形成1.5亿美元经济丧失。
7. 谷歌Gmail:您有新邮件?Gmail瓦解事宜
当技巧巨子阅历偶发主动化相干中止,一个小时的宕机所激发的效果会比外面上的丧失更加深远。这些行业巨子想做随意率性转变,都必需笼罩不计其数台办事器。身处技巧前沿的谷歌主动化其设置装备摆设治理绝不不测。固然是为了让操作更简略而设,当毛病修正在主动化体系里产生,便意味着该毛病会在数秒内普遍流传。
2014年,谷歌外部主动化设置装备摆设体系里的一个小毛病,让Gmail瓦解了年夜约半小时。该毛病设置装备摆设被发送到了在线办事上,招致用户日期要求被疏忽,相干办事接连失足。
经历经验在于,设置装备摆设主动化其实不同等于设置装备摆设治理。主动化仅确保所做修正会被推送到一切体系上。