开始新对话

未解决

T

2 消息

7096

2020年4月1日 23:00

DELL R720服务器热启动(重启,关机后不断开电源启动)均会出现CPU0704反复重启

​服务器是一台PowerEdge R720服务器,最初使用的是双路E5 2670,偶尔会出现CPU0000的错误,之后搭配一路的E5 2667V2处理器和8*8GB DDR3 GERECC 1333MHZ内存条,目前服务器断开电源一分钟左右之后再次插上电源启动便可引导进入系统,且系统中运作一切正常,压力测试也可以正常通过。但是如果在系统中选择重新启动或者关闭计算机之后,在尝试通过前面板电源键开机,每次都会在Windows10引导界面,下方动画播放一段时间后卡住然后重新进入服务器自检,再次引导。此时LCD前面板显示CPU0704 CPU1 machine check error detected. Power cycle system.同时无限循环引导失败-再引导的过程。在LifeCycle系统日志中出现 System CPU resetting ,之后就是CPU0704错误。进入到ePSA Pre-boot SystemAssessment中进行了错误检查,全程正常通过,没有检测到错误。(操作系统为MicroSoft Windwos10 Pro workstation)已经尝试了在Bios中将SystemProfileSetting中禁用C1和C State ,操作之后系统风扇会一直满载,同时问题无法解决。​

​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​
​SYS1003​​ ​
​ System CPU Resetting. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:48:32+0800​​SYS1001​​ ​
​ System is turning off. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:15+0800​​SEL9900​​ ​
​ An unsupported event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:12+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:10+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:08+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:05+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:47:01+0800​​CPU0000​​ ​
​ Internal error has occurred check for additional logs. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:59+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:57+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:54+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:51+0800​​CPU9000​​ ​
​ An OEM diagnostic event occurred. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:48+0800​​CPU0704​​ ​
​ CPU 1 machine check error detected. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:05+0800​​RAC0703​​ ​
​ Requested system hardreset. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:04+0800​​SYS1003​​ ​
​ System CPU Resetting. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:46:04+0800​​CPU0000​​ ​
​ Internal error has occurred check for additional logs. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:45:11+0800​​NIC101​​ ​
​ The NIC Integrated 1 Port 1 network link is started. ​
​ ​
​ ​
​ ​​ ​​2020-03-31T13:45:06+0800​​SEL9901​​ ​
​ OEM software event. ​

​请求帮助​

2 Intern

 • 

751 消息

2020年4月2日 17:00

您好。

1,服务器官方不支持WIN10系统

2,如目前您机器两颗CPU不一致的话(需要一致的CPU),建议您单颗 CPU测试,如报错为CPU1,那可以将CPU1去掉后,将CPU2的安装到CPU1的位置上测试(内存也只插CPU1对应的)

为了更好的为您提供支持,请您将设备的服务编号私信我。服务编号查找方法请参看: https://dell.to/3c80XAE

2 消息

2020年4月3日 04:00

谢谢您的回答!!我在尝试重置BIOS,IDRAC之后,再重新部署了全新的操作系统.问题得到了解决,具体详细原因未知,目前已经无障碍运行一天,并经过了多次反复冷热启动测试,均未发现异常.(回复您的回答:由于看到服务器支持WindowServer2016,因此尝试使用同架构同内核的Window10进行使用,用途是进行深度学习计算,没有发现其他异常.关于CPU的配置问题,最初这台服务器采用的是双路E5 2670 处理器,之后更换为了单路的E5 2667 V2 处理器.GPU运算卡参考用户手册由原来的Riser2 Slot4更替为了Riser3 Slot6,内存问题,在正交测试排除问题的过程中尝试只是用一根内存条,安装在A1位置,问题无法修正.更换CPU问题无法修正.但是昨日在重新部署了操作系统后问题得到了解决,怀疑是之前操作系统中残留一些对应原来CPU(E5 2670*2)和芯片组的驱动文件冲突导致了本次故障.)服务器已经过保,正准备申请付费维修服务时解决了问题:),最后感谢您的回答.

找不到事件!

Top