背景:
运行ESXi 8的N5105软路由最近出现了几次死机,导致上面运行的VM全部都没有了响应。
经过排查,确实是由其中一个VM引起了主机(Host)的崩溃,进入了紫屏模式,又称为purple screen of death (PSOD) 。这个紫屏PSOD很像Windows的蓝屏机制,主要是记录最后崩溃的信息,并保留在屏幕上,以供管理员诊断。
但这明显和软路由的定位有冲突,我们期望它可以稳定的运行,哪怕出现了崩溃也需要第一时间恢复。那么有什么办法能在主机崩溃后,自动重启呢?
解决方法:
方法1:
通过SSH登录ESXi,并执行esxcfg-advcfg -s 10 /Misc/BlueScreenTimeout
,其中“10”为进入紫屏(PSOD)模式后停留的时长,单位为秒。这里建议设置5或10。
方法2:
通过ESXi Host Client控制面板,对主机进行设置。路径为:管理→系统→高级设置,搜索“Misc.BlueScreenTimeout”。编辑选项,将0改为任意整数,同样这里建议设置5或10。