千度问答所出现问题很快就被客服紧急反馈到维护部和技术部,经过两个部门在后台系统中的筛查最终确认千度问答的后台系统是遭到了网络病毒的攻击,这才导致网站平台无法登陆的发生。
既然确认了是网络病毒,首先要做的自然就是杀毒!
本以为这次突发事件到此就结束的千度问答工程师们却惊讶的发现市面上的杀毒软件对肆虐在千度问答服务器中的病毒竟然毫无办法!
这下麻烦了!
千度问答的工程师们意识到问题的严重性,每次新一代的网络病毒出现时第一批受害者的损失都是最大的。
等到病毒在被大家知道进行第二轮传播的时候,联盟内那些专攻网络病毒防御专家们就已经开发出针对这个病毒的杀毒程序,这个时候企业和个人只需要购买杀毒程序就能解决服务器和个人终端中的病毒,损失将被将到一个可接受的程度。
接下来星网上那些做免费杀毒软件的企业就会在自家病毒库里更新新出现的这种病毒,这款病毒在星网上的危害至此被降到最低,只会对那些连基本杀毒程序都不安装的开放终端形成威胁。
现在千度问答就很苦逼地成为某款新型网络病毒的第一批受害者,在这个阶段根本就不可能有针对这款病毒的杀毒程序,关键是千度问答所聘请的这些经常使用ctrl+c、ctrl+v的工程师里也没人有能耐在短时间内写出一款杀毒程序来。
以前倒是有一个另类可能会有这样的本事,只不过因为不喜欢使用ctrl+c、ctrl+v进行工作而被所有的同事排挤最终选择辞职离开……
病毒现在就在平台服务器中肆虐,超过三分之一的服务器已经挂了,就是现在管理层同意重金聘请网络病毒专家来开发杀毒程序估计剩下的那三分之二的服务器也等不了这么长时间吧。
“现在最好的办法就是放弃已经被感染的服务器,将它们全部格式化,只有这样才能快速消灭病毒将损失降到最低。”
在维护部和技术部联合会议上,一票平日里趾高气扬的工程师们神色凝重地围坐成一圈,隶属于技术部的工程师A看大家都不吭气只能无奈地起了个头。
唉!三分之一服务器格式化呀!这次事件解决之后自己少不得要挨一顿批了。
工程师A此话一出,整个会议室里的气氛都为之一松。
只要这个建议有人提出来就好办了啊!
这是什么情况?
在千度问答的内部,一旦出了什么紧急事件后,在这个紧急事情处理完成后部门领导都会进行复盘寻找这次事件应对中出现的不足和错误之处。
这本来是一件好事,可以让事件的参与者和决策者深刻认识到在紧急事件处理的不足,今后再遇到类似的情况可以处理的更好。
结果因为公司内部某些管理层领导的好大喜功和基层领导的媚上压下,让原本很好的一件事情变得人人讨厌、人人畏惧!
这到底是怎么一回事呢?这里稍微展开说一下。
就拿这次的事件来说,现场维护部和技术部确实已经没有什么好的办法来应对如今的局面,格式化三分之一的服务器似乎已经成为唯一的选择。
假设,格式化三分之一的服务器最后完美解决了千度问答所面临的状况。
那么,在千度问答恢复正常运行后,公司管理层的领导肯定是要来维护部和技术部详细了解这次事件的发现和处置过程,并且会对整个事件进行复盘。
在没有服务器全线崩溃和用户无法登陆在不间断投诉的影响下,或许这些领导可以找到更好的替代方案。
比如他们通过对病毒的模拟运行会发现常规的杀毒软件虽然无法有效清理被病毒感染的文件,但是却可以清除病毒文件崩解扩散时产生的一部分具有明显网络病毒特征的碎片文件。
这种清理可以极大得延缓病毒扩散的速度,让可以应对事件的时间变得更加充裕。
时间充裕了或许就可以让病毒专家研发出来针对这款病毒的专用杀毒程序,那最后被感染的那批服务器是不是就有了抢救的余地,那些珍贵的服务器数据是不是就有了被抢救出来的可能?
复盘发展到这里都是正常的,可接下来的操作就会变得不正常了。
本来到了这一步后接下来就是总结经验教训和表彰了,毕竟在维护部和技术部两个部门的通力合作之下这次事件得到了解决并且还挽救了剩下的三分之二服务器免于遭受病毒感染。
可偏偏公司领导并不是这么认为的,在管理层看来公司每个月支付工资就是让你们这些人在关键时刻发挥作用的,现在出了一个紧急事件公司三分之一的服务器都被格式化重启了,许多珍贵的数据丢失公司蒙受了重大损失。
这还不算,明明还有更好的方案可以减少公司的损失,可是这些人的榆木脑袋根本就想不到,如此怎么还有脸让公司给予表彰呢?
于是管理层的领导挥挥洒洒一大篇报告就出炉提交董事会了。
在领导的报告中,维护部和技术部在面对紧急事情的处理上有重大的瑕疵,他本人通过对这次事件的仔细分析研判发现还有更好的方案建议董事会审议方案的可行性并写入标准操作手册。
吧啦吧啦云云……
复盘的数据分析工作都是基层领导在事件结束后要求部门工程师做的,到了管理层领导这里就非常不要脸地变成自己研判的东西。
既然在处置上有瑕疵,那肯定要有改善啊!
管理层领导只会看ppt,怎么可能懂这些涉及到现场操作的实际问题呢?
这些问题最终还得交给基层员工来解决,于是乎在接下来的一段时间内各级别领导都会很忙,整天大会小会不断将在事件复盘中所发现的问题在会议上反复研究,大而空的讲话一场接着一场。
从董事会开始自上而下每一次会议都会进行加码,如果董事会最初做出的决议是要求员工重新培训相关紧急事件处理流程,到了基层领导面对员工所开的会议上可能就变成了把涉事员工将为试用期的处罚!
这也是在维护部和技术部的会议上所有的工程师都知道最有效的解决方案却每一个人主动提出来的原因。
作为第一个提出建议的工程师在事后必然会遭到领导复盘时反复的追问。
“你如何判断当时就没有其他处理方案了呢?”
“你觉得以你的能力能够做出最优的判断吗?”
诸如此类的问题反复考验员工的心里承受能力。
心理承受能力差点了员工为此患上某些心理疾病的并不在少数,性格极端点的员工更是在现场就和啥呀不懂的领导大吵起来。
一吵架,好了,有理也变成没理了。
接下来必然是对于员工现场和领导吵架问题的处理……