MDM 事件記錄顯示 MDM 元件經常中斷連線並重新連線:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, (ID ), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, (ID ), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, (ID ), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, (ID ), connected after 110ms
正在中斷連線的 MDM 伺服器上的 Sar 輸出顯示高 TCP 重新傳輸:
sar -n ETCP 1 -t -f sar.0 atmptf/s estres/s retrans/s isegerr/s orsts/s 00:00:27 AM 0.00 0.00 62.00 0.00 0.00 00:00:28 AM 0.00 0.00 88.12 0.00 0.00 00:00:29 AM 0.00 3.00 100.00 0.00 0.00 00:00:30 AM 0.00 0.00 71.29 0.00 0.00 00:00:31 AM 0.00 0.00 71.00 0.00 0.00 ... 00:01:02 AM 0.00 0.00 48.51 0.00 0.00 00:01:03 AM 0.00 0.00 15.00 0.00 0.00 00:01:04 AM 0.00 0.00 207.00 0.00 0.00 00:01:05 AM 0.00 0.00 36.00 0.00 0.00 00:01:06 AM 0.00 0.99 105.94 0.00 0.00
簡短的 MDM 叢集降級事件
效能下降
MDM 伺服器已修補,Linux 核心從 3.x 升級至 5.x。此核心升級會將許多預設作業系統參數變更為不同的值。在這種情況下,TCP 參數「net.ipv4.tcp_fack」已停用,但此參數似乎造成高 TCP 重新傳輸。
SDS RPM 在 /opt/emc/scaleio/sds/cfg/目錄中提供名為 emc.conf 的組態檔案。此檔案包含許多來自 Dell EMC 的建議作業系統參數。
如果這是 PowerFlex Rack/Appliance 環境,PowerFlex Manager 會自動將 emc.conf 檔案從 「/opt/emc/scaleio/sds/cfg」 複製到每個伺服器的 systcl.conf 並套用。這只會在初始節點部署時發生。sysctl.conf 有可能未正確更新。如果 sysctl.conf 檔案不存在正確的值,則在核心升級至 5.x 後,可能會變更某些重要參數。
在PowerFlex 機架/裝置環境中,如果 sysctl.conf 未包含 emc.conf 擁有的所有參數,建議您透過 emc.conf 複製到每個伺服器 /etc/sysctl.conf 檔案。若要在伺服器上套用變更。 伺服器可以重新開機,或可執行命令「sysctl -p」,以套用來自 /etc/sysctl.conf 的變更。進行這些變更時,請務必採取適當的維護最佳實務。
在僅限軟體的環境中,Dell EMC 建議將這些 Linux 參數套用至每一部伺服器,但最終要由企業決定。如有任何問題,請洽詢 OS 廠商以取得最佳實務。
所有 PowerFlex 版本