iDRAC9搭載のDell EMC PowerEdgeサーバーの場合、CPUワークロードがCPUの最大能力に達した場合、または近づいている場合に、CPU xの温度が重大な上限しきい値イベントよりも高くなっていると報告されることがあります。実際に、CPU能力の追加的な需要を満たすために一時的な電力バーストが発生した場合、プロセッサーの温度が重大な上限しきい値を短時間超える可能性があります。たとえば、サーバーが50~60%の使用率で動作しており、5~20秒間、使用率が100%に急上昇した場合、CPU温度の重大な上限しきい値を一時的に超える可能性があります。このしきい値を超えると、システム イベント ログとライフサイクル ログにイベントが記録されます。ピーク時の一時的な急上昇が終了して、CPU温度が正常に戻ると、CPU xの温度が範囲内に戻ったことを示すイベントが記録されます。
このような一時的な急上昇があった場合、通常、この2つのイベントは双方とも5~20秒以内に発生します。このようなタイプの一時的なイベントのガイドラインについては、以下の例を参照してください。
システム イベント ログ: 2020-04-09 11:14:11 |
85 |
CPU 2 temperature is within range. |
2020-04-09 11:14:06 |
84 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-09 09:16:31 |
83 |
CPU 2 temperature is within range. |
2020-04-09 09:16:16 |
82 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-09 08:58:33 |
81 |
CPU 2 temperature is within range. |
2020-04-09 08:58:17 |
80 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-09 08:25:47 |
79 |
CPU 2 temperature is within range. |
2020-04-09 08:25:27 |
78 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-09 06:57:02 |
77 |
CPU 2 temperature is within range. |
2020-04-09 06:56:57 |
76 |
CPU 2 temperature is greater than the upper critical threshold. |
ライフサイクル ログ:
2020-04-09 00:44:15 |
7851 |
TMP0205 |
CPU 2 temperature is within range. |
2020-04-09 00:44:07 |
7850 |
TMP0203 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-08 22:46:31 |
7773 |
TMP0205 |
CPU 2 temperature is within range. |
2020-04-08 22:46:18 |
7772 |
TMP0203 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-08 22:28:34 |
7769 |
TMP0205 |
CPU 2 temperature is within range. |
2020-04-08 22:28:18 |
7768 |
TMP0203 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-08 21:55:49 |
7736 |
TMP0205 |
CPU 2 temperature is within range. |
2020-04-08 21:55:29 |
7735 |
TMP0203 |
CPU 2 temperature is greater than the upper critical threshold. |
2020-04-08 20:27:03 |
7697 |
TMP0205 |
CPU 2 temperature is within range. |
2020-04-08 20:26:58 |
7696 |
TMP0203 |
CPU 2 temperature is greater than the upper critical threshold. |
これらの温度しきい値に達すると、インテル プロセッサーは、スロットルを実行して電力消費を削減し、CPU温度を引き下げます。
このようなタイプのCPUパフォーマンスの一時的な急上昇は異常ではありませんが、iDRAC9のエンジニアリング担当者は、これらのイベントを防止するために、温度アルゴリズムの微調整を続けています。たとえば、iDRAC9 4.22.00.00およびiDRAC9 4.40.00.00には、このシーケンスに固有の熱改善が含まれます。Dell EMC PowerEdgeサーバーに最新の動的熱アルゴリズムがインストールされるようにするには、使用可能な最新のiDRAC9ファームウェアにアップデートします。
これらの一時的なイベントでCPU温度が急上昇しないように、エンドユーザーは、システムの温度を手動で変更できます。次のいずれかの回避策で、ファン速度のベースラインを引き上げ、CPU温度を低く維持します。
システム温度プロファイルの最適化は、最大限のパフォーマンス(最適化パフォーマンス)に変更できます。この温度プロファイルには、次の利点があります。
温度プロファイルの最適化は、次の方法で変更できます。
[iDRAC9 GUI]>[Configuration]>[System Settings]>[Hardware Settings]>[Cooling Configuration]
racadm set System.ThermalSettings.ThermalProfile
racadm>>racadm set System.ThermalSettings.ThermalProfile 1
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
サポートされる値:
0 - デフォルトの温度プロファイル設定
1 - 最大限のパフォーマンス
2 - 最小電力
3 - サウンド キャップ
ファン速度オフセットを使用すると、システム ファン速度を4段階で引き上げることができます。これらの段階は、サーバー システム ファンの標準的なベースライン速度と最大速度の間で均等に割り振られています。ファン速度オフセットを使用すると、熱制御アルゴリズムによって計算されたベースライン ファン速度よりもファン速度が(オフセット%値によって)高くなります。次の状態があります。
ファン速度オフセットは、次の方法で変更できます。
[iDRAC9 GUI]>[Configuration]>[System Settings]>[Hardware Settings]>[Cooling Configuration]
racadm set System.ThermalSettings.FanSpeedOffset
racadm>>racadm set System.ThermalSettings.FanSpeedOffset 2
[Key=System.Embedded.1#ThermalSettings.1]
Object value modified successfully
サポートされる値:
0 - 低
1 - 高
2 - 中
3 - 最大
255 - オフ