关于昨晚扇贝服务器挂了导致许多人无法完成打卡,给我的启示

事件经过,2月23日晚10点左右,扇贝服务器开始访问不了,持续到24日早上10点才彻底解决,导致许多用户没有完成前一天的打卡,和阅读/听力/炼句计划,包括我。

最后扇贝的解决方案是:临时上线补打卡功能,帮前一天没能打卡的用户打卡成功和完成计划,并赠送1000扇贝和一个“大难不死”徽章

给我的启示:

1、后台服务器很重要,大型系统更要注重后台备份,和发生故障时的补救方案;

2、实际上试过多次晚上10点后都觉得访问很慢,应该早就有隐患存在,只是扇贝工程师没想到会爆发这么一出,引用墨菲效应的话:“情况如果有变坏的可能,不管这种可能性有多小,它总会发生。”  这次估计要有人背锅;

3、事情发生了,公关处理和补偿方案很重要,扇贝补偿方案一出,本想着卸载软件的我又回归了;

4、后台和运维是个体力活,你永远不知道服务器和后台会在几点出故障;

5、计划赶不上变化,能提前完成的事尽量别拖着(如扇贝打卡),你无法知道未来和意外哪个先来。

 

发表评论