当 CPU 工作负载突然提高到或接近 CPU 功率最大值时,具有 iDRAC9 的 Dell EMC PowerEdge 服务器可能会报告 CPU x 温度高于临界阈值上限事件。当瞬时功率突然提高以满足额外的 CPU 需求时,处理器温度可能会短暂地超过临界阈值上限。例如,如果服务器在 50-60% 的利用率下运行,然后突然提高到 100% 的利用率并持续 5-20 秒,其 CPU 温度可能会短暂地超过临界阈值上限。超过此阈值时,系统事件日志和生命周期日志中将记录这些事件。当瞬时峰值结束并且 CPU 温度恢复正常时,日志中将记录一个事件,表明 CPU x 温度在范围内。
当类似这样的瞬时峰值出现时,这两个事件通常间隔 5-20 秒。以下是这些类型的瞬时事件的示例,以供参考。
系统事件日志: 2020-04-09 11:14:11 |
85 |
CPU 2 温度在范围内。 |
2020-04-09 11:14:06 |
84 |
CPU 2 温度高于临界阈值上限。 |
2020-04-09 09:16:31 |
83 |
CPU 2 温度在范围内。 |
2020-04-09 09:16:16 |
82 |
CPU 2 温度高于临界阈值上限。 |
2020-04-09 08:58:33 |
81 |
CPU 2 温度在范围内。 |
2020-04-09 08:58:17 |
80 |
CPU 2 温度高于临界阈值上限。 |
2020-04-09 08:25:47 |
79 |
CPU 2 温度在范围内。 |
2020-04-09 08:25:27 |
78 |
CPU 2 温度高于临界阈值上限。 |
2020-04-09 06:57:02 |
77 |
CPU 2 温度在范围内。 |
2020-04-09 06:56:57 |
76 |
CPU 2 温度高于临界阈值上限。 |
生命周期日志:
2020-04-09 00:44:15 |
7851 |
TMP0205 |
CPU 2 温度在范围内。 |
2020-04-09 00:44:07 |
7850 |
TMP0203 |
CPU 2 温度高于临界阈值上限。 |
2020-04-08 22:46:31 |
7773 |
TMP0205 |
CPU 2 温度在范围内。 |
2020-04-08 22:46:18 |
7772 |
TMP0203 |
CPU 2 温度高于临界阈值上限。 |
2020-04-08 22:28:34 |
7769 |
TMP0205 |
CPU 2 温度在范围内。 |
2020-04-08 22:28:18 |
7768 |
TMP0203 |
CPU 2 温度高于临界阈值上限。 |
2020-04-08 21:55:49 |
7736 |
TMP0205 |
CPU 2 温度在范围内。 |
2020-04-08 21:55:29 |
7735 |
TMP0203 |
CPU 2 温度高于临界阈值上限。 |
2020-04-08 20:27:03 |
7697 |
TMP0205 |
CPU 2 温度在范围内。 |
2020-04-08 20:26:58 |
7696 |
TMP0203 |
CPU 2 温度高于临界阈值上限。 |
当达到这些温度阈值时,英特尔处理器可能会进行限制以降低功耗和 CPU 温度。
虽然这些类型的瞬时 CPU 性能峰值并不是异常现象,但 iDRAC9 工程部门一直在微调散热算法以防止这些事件。例如,iDRAC9 4.22.00.00 和 iDRAC9 4.40.00.00 将包含特定于此序列的散热改进。要确保在 Dell EMC PowerEdge 服务器上安装最新的动态散热算法,请更新到最新的可用 iDRAC9 固件。
终端用户可以手动修改系统散热,以防止这些瞬时事件引发 CPU 升温。使用以下任一解决方法来提高风扇速度基线并保持较低的 CPU 温度。
系统散热配置文件优化可修改为“最大性能”(性能优化)。此散热配置具有以下优势:
可以通过以下方法修改散热配置优化:
iDRAC9 GUI >> Configuration >> System Settings >> Hardware Settings >> Cooling Configuration
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
成功修改对象值
支持的值:
0 — 默认散热配置设置
1 — 最大性能
2 — 最小功率
3 — 声音上限
风扇速度偏移允许您通过四个渐进步骤提高系统风扇速度。这些步骤在服务器系统风扇的典型基线速度和最大速度之间均匀分布。风扇速度偏移会导致风扇速度在基线风扇速度(由散热控制算法计算)的基础上提高(偏移百分比值)。可能的值包括:
可以通过以下方法修改风扇速度偏移:
iDRAC9 GUI >> Configuration >> System Settings >> Hardware Settings >> Cooling Configuration
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
成功修改对象值
支持的值:
0 — 低
1 — 高
2 — 中等
3 — 最大
255 — 关闭