跳至主要內容
  • 簡單快速地下訂單
  • 檢視訂單及追蹤商品運送狀態
  • 建立並存取您的產品清單

TMP0203:CPU 温度高于临界阈值上限

摘要: 当 CPU 工作负载突然提高到或接近 CPU 功率最大值时,具有 iDRAC9 的 Dell EMC PowerEdge 服务器可能会报告 CPU 温度高于临界阈值上限事件。

本文章適用於   本文章不適用於 

症狀

当 CPU 工作负载突然提高到或接近 CPU 功率最大值时,具有 iDRAC9 的 Dell EMC PowerEdge 服务器可能会报告 CPU x 温度高于临界阈值上限事件。当瞬时功率突然提高以满足额外的 CPU 需求时,处理器温度可能会短暂地超过临界阈值上限。例如,如果服务器在 50-60% 的利用率下运行,然后突然提高到 100% 的利用率并持续 5-20 秒,其 CPU 温度可能会短暂地超过临界阈值上限。超过此阈值时,系统事件日志和生命周期日志中将记录这些事件。当瞬时峰值结束并且 CPU 温度恢复正常时,日志中将记录一个事件,表明 CPU x 温度在范围内

当类似这样的瞬时峰值出现时,这两个事件通常间隔 5-20 秒。以下是这些类型的瞬时事件的示例,以供参考。

系统事件日志:

2020-04-09 11:14:11

85

CPU 2 温度在范围内。

2020-04-09 11:14:06

84

CPU 2 温度高于临界阈值上限。

2020-04-09 09:16:31

83

CPU 2 温度在范围内。

2020-04-09 09:16:16

82

CPU 2 温度高于临界阈值上限。

2020-04-09 08:58:33

81

CPU 2 温度在范围内。

2020-04-09 08:58:17

80

CPU 2 温度高于临界阈值上限。

2020-04-09 08:25:47

79

CPU 2 温度在范围内。

2020-04-09 08:25:27

78

CPU 2 温度高于临界阈值上限。

2020-04-09 06:57:02

77

CPU 2 温度在范围内。

2020-04-09 06:56:57

76

CPU 2 温度高于临界阈值上限。

 

 

生命周期日志:

2020-04-09 00:44:15

7851

TMP0205

CPU 2 温度在范围内。

2020-04-09 00:44:07

7850

TMP0203

CPU 2 温度高于临界阈值上限。

2020-04-08 22:46:31

7773

TMP0205

CPU 2 温度在范围内。

2020-04-08 22:46:18

7772

TMP0203

CPU 2 温度高于临界阈值上限。

2020-04-08 22:28:34

7769

TMP0205

CPU 2 温度在范围内。

2020-04-08 22:28:18

7768

TMP0203

CPU 2 温度高于临界阈值上限。

2020-04-08 21:55:49

7736

TMP0205

CPU 2 温度在范围内。

2020-04-08 21:55:29

7735

TMP0203

CPU 2 温度高于临界阈值上限。

2020-04-08 20:27:03

7697

TMP0205

CPU 2 温度在范围内。

2020-04-08 20:26:58

7696

TMP0203

CPU 2 温度高于临界阈值上限。

当达到这些温度阈值时,英特尔处理器可能会进行限制以降低功耗和 CPU 温度。

原因

当 CPU 以接近目标值的温度运行以获得最佳性能并且 CPU 转换为更高的工作负载时,会出现问题。当处理器内核 C-state 被唤醒或调用处理器按需 Turbo 模式时,通常会发生这种温度瞬时升高的情况。

解析度

虽然这些类型的瞬时 CPU 性能峰值并不是异常现象,但 iDRAC9 工程部门一直在微调散热算法以防止这些事件。例如,iDRAC9 4.22.00.00 和 iDRAC9 4.40.00.00 将包含特定于此序列的散热改进。要确保在 Dell EMC PowerEdge 服务器上安装最新的动态散热算法,请更新到最新的可用 iDRAC9 固件。

临时解决方法:

终端用户可以手动修改系统散热,以防止这些瞬时事件引发 CPU 升温。使用以下任一解决方法来提高风扇速度基线并保持较低的 CPU 温度。

最大性能配置

系统散热配置文件优化可修改为“最大性能”(性能优化)。此散热配置具有以下优势:

  • 降低了内存或 CPU 限制的概率。
  • 提高了 Turbo 模式激活的概率。
  • 通常情况下,在空闲和压力负载下风扇速度较高。

可以通过以下方法修改散热配置优化:

iDRAC9 GUI >> Configuration >> System Settings >> Hardware Settings >> Cooling Configuration
SLN321536_en_US__1iDRAC9-GUI-ThermalProfile-Max

racadm set System.ThermalSettings.ThermalProfile

racadm>>racadm set System.ThermalSettings.ThermalProfile 1

[Key=System.Embedded.1#ThermalSettings.1]

成功修改对象值

 

支持的值:

0 — 默认散热配置设置

1 — 最大性能

2 — 最小功率

3 — 声音上限

 

 

风扇速度偏移

风扇速度偏移允许您通过四个渐进步骤提高系统风扇速度。这些步骤在服务器系统风扇的典型基线速度和最大速度之间均匀分布。风扇速度偏移会导致风扇速度在基线风扇速度(由散热控制算法计算)的基础上提高(偏移百分比值)。可能的值包括:

  • Low Fan Speed — 将风扇速度提高到普通风扇速率。
  • Medium Fan Speed — 将风扇速度提高到接近中等。
  • High Fan Speed — 将风扇速度提高到接近全速。
  • Max Fan Speed — 将风扇速度提高到全速。
  • Off — 风扇速度偏移设置为关闭。这是默认值。当设置为 off 时,不会显示百分比。没有偏移时,应用默认风扇速度。相反,最大设置将导致所有风扇以最大速度运行。

可以通过以下方法修改风扇速度偏移:

iDRAC9 GUI >> Configuration >> System Settings >> Hardware Settings >> Cooling Configuration
SLN321536_en_US__2iDRAC9-GUI-FanSpeedOffset-Med

racadm set System.ThermalSettings.FanSpeedOffset

 

racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2

[Key=System.Embedded.1#ThermalSettings.1]

成功修改对象值

 

支持的值:

0 — 低

1 — 高

2 — 中等

3 — 最大

255 — 关闭

 

提醒:提高风扇速度基线将提高风扇功耗和风扇声音。

受影響的產品

iDRAC9