盛大云云主机发生故障 多用户数据丢失

2012-08-09 10:08:46 发表 | 来源:新浪游戏

8月6日晚上8:10,盛大云在其官方微博上发布一则因云主机故障致用户数据丢失事件的公开声明。声明说到:8月6日,盛大云在无锡的数据中心因为一台物理服务器磁盘发生损坏,导致“个别用户”数据的丢失。盛大云已经在尽全力协助用户恢复数据。

盛大云公开申明一石激起千层浪

一石激起千层浪。“一台物理服务器磁盘发生损坏”就导致用户数据丢失。这个解释似乎并没有让网友和用户们信服。很多网友直接在微博上回复自己的质疑。

有网友直接质问:你们难道连RAID都没有么?另外,也有人提出:盛大云怎么存储还用宿主机物理硬盘?这也叫云?就算用宿主机物理硬盘,也该有个备份吧。

并且有网友对盛大云数据中心的规划提出了质疑:盛大云是需要建立规模化的数据中心,四处搞一些小机房太分散了。灾备有没有做到位?最基本的,RAID做了没?这些是盛大需要思索的问题。

有网友一针见血地指出盛大云的本质:所谓盛大的云主机其实就是虚拟机而已。可悲的是即便是物理机虚了几台,也应该挂RAID啊。服务器挂硬盘做数据存储还是比较罕见的吧。

还有网友提出了对丢失数据的用户赔偿问题:客户不是专家,如果造成了经济损失,就要赔。服务既然是服务,就应该有SLA。SLA应该对云存储服 务水平,业务连续性程度,数据安全级别,数据恢复时间,罚责等做出明确定义。服务等级和SLA不同,成本上的投入自然不同,价格也相应不同。

很多网友提出让盛大云提出对个别数据丢失的用户赔偿计划:如果根据国内云厂商的SLA,用户数据丢失,云厂商相应的得要负数据丢失的损失责任,而且要赔偿百倍宕机时间。

盛大云公开声明

对于因为一台“物理服务器磁盘发生损坏”,导致“个别用户”数据的丢失的情况,盛大云技术人员给出自己的解释:虚拟机的磁盘有两种生产方式,一 种是直接使用宿主机的物理磁盘。这种情况下,如果宿主机的物理磁盘发生故障,云主机不可避免会造成数据丢失,这也是本次事件产生的原因;另外一种是使用远 程存储,也就是盛大硬盘产品,这种方式实际上是把用户的数据存到了远程的一个集群里,并同时做了多份备份,即使宿主机出故障也不会影响到云主机的数据。

因为物理机的损坏很难避免,为了避免您遇到意外损失,我们建议您在云主机之外,也做好数据备份。

在盛大云官方微博的回复中,并不是一边倒的骂声。有的网友也提出了不同意见:公平说句,这个真不怪盛大。需要数据保护就不应该用宿主主机物理硬盘,而采用外部存储,例如盛大其他的云存储存储服务。

网友吐槽盛大云

这种声音很快就被一片骂声掩盖,有网友直接次责盛大云以上的解释:负责故障的盛大同学当其他人不懂存储了?!难道宿主机的磁盘没有做RAID,也没备份?丢数据实在是大事故,难不成别人每天把几十G数据往其他网络备份。

但是,有网友认为:如果用raid,骂得人会更多。raid修复的时候磁盘重载,整个系统可用性急剧下降,一次影响几十台虚拟机。

盛大云感觉自己的做着主动地坦白,同时还推销了一下自己的云存储,没有曾想到,却掀起网友大范围的痛批。到记者发稿之时,这篇道歉信已经被转发1800次,评论700多次。也就是查不到三个转发者,就有差不多一个人忍不住想骂上两句。

盛大云转发和评论数

真不知道,盛大云这次事件算得上失败的危机公关,还是真正意义上的技术故障。

其实,我们看到国际上一些IT巨头提供的公有云都曾经出现过安全事件,亚马逊最多,谷歌、微软等一些云服务提供商都出现过安全事件。既然事情已经出现,仍然希望盛大云也能够学习一下IT巨头们处理此类事件的态度,开诚布公,直面问题。

盛大云首先需要以端正的态度安抚和赔偿丢失数据的用户损失,同时还要在数据安全上考虑的更加周到,杜绝类似事件再次发生,并最终公开一个解决方 案。不是危言耸听!如果这类事件处理不好,影响的不仅仅是盛大云一家企业的未来,一定还会影响到其它云服务提供商的信任危机,加深企业用户对云计算的不信 任感。

7K新浪官方微博 立即收听

7K腾讯官方微博 立即收听

已有10000

已有10000