显示 MDM 组件频繁断开连接和重新连接的 MDM 事件日志:
2023-xx-xx 00:00:21.316 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, (ID ), has lost connection to the cluster. 2023-xx-xx 00:00:21.419 MDM_CLUSTER_CONNECTED INFO The MDM, (ID ), connected after 100ms 2023-xx-xx 00:00:23.480 MDM_CLUSTER_LOST_CONNECTION WARNING The MDM, (ID ), has lost connection to the cluster. 2023-xx-xx 00:00:23.584 MDM_CLUSTER_CONNECTED INFO The MDM, (ID ), connected after 110ms
来自断开连接的 MDM 服务器的 Sar 输出显示 TCP 重新传输率高:
sar -n ETCP 1 -t -f sar.0 atmptf/s estres/s retrans/s isegerr/s orsts/s 00:00:27 AM 0.00 0.00 62.00 0.00 0.00 00:00:28 AM 0.00 0.00 88.12 0.00 0.00 00:00:29 AM 0.00 3.00 100.00 0.00 0.00 00:00:30 AM 0.00 0.00 71.29 0.00 0.00 00:00:31 AM 0.00 0.00 71.00 0.00 0.00 ... 00:01:02 AM 0.00 0.00 48.51 0.00 0.00 00:01:03 AM 0.00 0.00 15.00 0.00 0.00 00:01:04 AM 0.00 0.00 207.00 0.00 0.00 00:01:05 AM 0.00 0.00 36.00 0.00 0.00 00:01:06 AM 0.00 0.99 105.94 0.00 0.00
简要 MDM 群集降级事件
性能下降
MDM 服务器已修补,Linux 内核从 3.x 升级到 5.x。此内核升级将许多默认操作系统参数更改为不同的值。在本例中,TCP 参数“net.ipv4.tcp_fack”被禁用,但此参数似乎导致了 TCP 高重新传输。
SDS RPM 在 /opt/emc/scaleio/sds/cfg/ 目录中提供名为 emc.conf 的配置文件。此文件包括来自 Dell EMC 的许多建议操作系统参数。
如果这是 PowerFlex 机架/设备环境,PowerFlex Manager 将自动将 emc.conf 文件从 “/opt/emc/scaleio/sds/cfg” 拷贝到每个服务器的 systcl.conf 并应用它。这仅在初始节点部署上发生。sysctl.conf 可能未正确更新。如果 sysctl.conf 文件不存在正确的值,则在内核升级到 5.x 后,某些重要参数可能会更改。
在 PowerFlex 机架/设备环境中,如果 sysctl.conf 不包括 emc.conf 拥有的所有参数,建议通过 emc.conf 复制到每个服务器 /etc/sysctl.conf 文件中。在服务器上应用更改。 服务器可以重新启动,也可以运行命令“sysctl -p”以应用来自 /etc/sysctl.conf 的更改。在进行这些更改时,请确保采取正确的维护最佳做法。
在纯软件环境中,Dell EMC 建议将这些 Linux 参数应用于每台服务器,但最终由业务部门决定。如有任何问题,请咨询操作系统供应商以了解最佳做法。
所有 PowerFlex 版本