IT运维事故发生时,方觉日志管理功能好

发布于 2017-03-20

讲真,运维事故的黑锅没人愿意背。尤其是像“误操作”这种看似非常低级的错误,很常见,却又很难避免,每每说起,就会引起很多IT运维小伙伴的共鸣。
时间:2013年7月
地点:某银行 
事件回顾:IT运维人员接到员工反馈:银行内网服务中断……
经过紧张的事故排查,IT运维人员发现,好几十台服务器的DNS的主机记录被删除……
在尝试进行恢复的时候,发现整个DNS区域都不见了。
如果不能及时恢复,那么该银行8000多名员工的内网办公系统全部瘫痪。

显然,这是一次人为事故,需要尽快找出事故责任人,不然,这个黑锅谁来背?
事故既然发生了,如何尽快解决,将损失降低到最小?

为了最大程度的降低用户的运营损失,我们的技术专家到达现场之后,在短短的2个小时之内帮助用户进行了数据恢复。由于该用户之前部署了ADM统一账号管理工具,因此,技术专家很快通过调取AD服务器的日志,找出了误删除的工作人员ID。经核实,该工作人员由于对系统环境不熟悉,在对服务器进行远程操作时不小心误删除了DNS。
常规的AD日志存储空间是有限的,新的日志产生时会覆盖上一条日志。如下图所示:

 
因此,如果没有ADM,用户就很难找出事故责任人。
ADM提供完整的用户操作日志,保证了为后续分析或调查提供了详细的审计线索,并且还可以归档AD服务器日志,以满足SOX,HIPAA的合规要求。
 

作为对IT运维要求更高的金融行业,IT事故会直接影响业务,责任重大。ADM统一账号管理工具可以帮助这样的用户,最大程度的降低操作风险,减少误操作。
ADM还有更多强大功能,且听下回分解。