Symptoms
Unisphere GUI en CLI zijn niet langer toegankelijk na een poging om DNS-instellingen te wijzigen. Het probleem wordt niet opgelost door de beheerservices opnieuw op te starten. Er is ook vastgesteld dat ECOM niet wordt uitgevoerd op een SP of meer dan 10 minuten actief blijft.
Als u het volgende KB-artikel probeert te gebruiken om MGMT opnieuw op te starten, wordt het probleem niet opgelost:
Dell Unity: Kan geen toegang krijgen tot Unisphere Het systeem is bezet. Probeer het later opnieuw (op te lossen door gebruiker)
https://www.dell.com/support/kbdoc/000056109
Command: svc_restart_service restart MGMT
Uit het verzamelen van dataverzamelingen bleek dat er ECOM-dumpbestanden waren.
Door elke SP per KB-000021439 opnieuw op te starten, kon ECOM wel 10 minuten per keer werken.
Dell Unity: Herstellen of problemen oplossen wanneer de beheerservice (ECOM) niet wordt uitgevoerd op een sp (op te lossen door gebruiker)
https://www.dell.com/support/kbdoc/000021439
Cause
Het probleem doet zich voor wanneer een DNS-opdracht "papi_clust_set.sh dns xxx" een time-out heeft veroorzaakt en een ECOM-probleem veroorzaakte. Het kan ook gebeuren wanneer u Unisphere gebruikt om DNS-instellingen te wijzigen of een nieuwe DNS-server te verwijderen.
Opmerking: IPMI Tool moet worden gebruikt om verbinding te maken met een van beide SP's om problemen op te lossen, omdat ECOM niet werkt.
Triage en controle van logboeken toonden vastgelopen batchtaken bij een mislukte poging om DNS-wijzigingen aan te brengen in het Unity systeem.
Opdracht die wordt gebruikt om te controleren: uemcli /sys/task/job show -detail Interne logboeken toonden het volgende:
cemtracer_sysapi logs 18 Jul 2023 21:51:36 - [SYSAPI] ERROR - {0:777251:881779993}[1053|3741|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort Aborting the system.
De ECOM-dumps kunnen tekenen weergeven die vergelijkbaar zijn met het volgende:
Zoek naar 'error' in cemtracer_sysapi.log:
xx Nov xxxx 13:27:52 - [SYSAPI] ERROR - {0:24803979:204377483}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1511] Watch dog poll request timeout occured. Now:24803979204 TimeGap:900621 Is in Poll:0
xx Nov xxxx 13:27:52 - [SYSAPI] ERROR - {0:24803979:205104121}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1512] PerfStatReport:
xx Nov xxxx 13:27:52 - [SYSAPI] ERROR - {0:24803979:206876577}[18921|28516|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1516] dependencyMap:
xx Nov xxxx 13:27:52 - [SYSAPI] ERROR - {0:24803979:206905718}[18921|28516|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort
xx Nov xxxx 23:16:07 - [SYSAPI] ERROR - {0:1379:344272630}[2919|6108|f17ffb40][Poll @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/TLDPollManager.cpp:383] Admin PEER poll request failed.Error Code = 7e110000.
xx Nov xxxx 23:16:58 - [SYSAPI] ERROR - {0:1429:454592292}[2919|20591|d79ffb40][performRequestBase @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/util/TLDUtils.cpp:346] Admin failed to process request (err = 2115043355):
TAG_K10_ERROR_PACKET (0x10004)
TAG_K10_ERROR_CODE (0x10005) num: 2115043355 (0x7e11001b) str: "...~" hex: 1b:0:11:7e
xx Nov xxxx 23:31:15 - [SYSAPI] ERROR - {0:2286:652151017}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1511] Watch dog poll request timeout occured. Now:2286652 TimeGap:900650 Is in Poll:0
xx Nov xxxx 23:31:15 - [SYSAPI] ERROR - {0:2286:652504752}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1512] PerfStatReport:
xx Nov xxxx 23:31:15 - [SYSAPI] ERROR - {0:2286:653466119}[2919|6535|f70d6b40][_watchDogRoutine @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/UpdateManagerImpl.cpp:1516] dependencyMap:
xx Nov xxxx 23:31:15 - [SYSAPI] ERROR - {0:2286:653504952}[2919|6535|f70d6b40][doTimeoutAction @ /c4_working/Unity_PullRequest_Build_Driver_Sles15_RTM_1.1/clariion/components/adapters/SystemAPI/framework/src/ConfigMgr.cpp:403] Timeout action (poll): abort
Resolution
Dit is opgelost in Unity OE 5.2.0 en hoger. Als taken die niet meer reageren worden gevonden, neemt u contact op met Dell Technische Support en vermeldt u dit artikel. Vastgelopen taken zijn te zien in Unisphere in het gedeelte Gebeurtenis/Taken. Support helpt bij het wissen van de vastgelopen taken met behulp van het interne gedeelte van KB-000059274.
Dell Unity: Vastgelopen of onderbroken batchtaken verwijderen, foutcode: 0x7d13151 (op te lossen door Dell)
https://www.dell.com/support/kbdoc/en-us/000059274/dell-emc-unity-deleting-stuck-or-suspended-batch-jobs-error-code-0x7d13151
Nadat de vastgelopen taken zijn verwijderd, moet de ECOM-service opnieuw worden opgestart met behulp van KB-000019807.
Dell Unity: Een failover van Management Services (ECOM) uitvoeren (op te lossen door Dell)
https://www.dell.com/support/kbdoc/000019807
Referentie: UnityD-54308, UnityD-59297, UEE-16306, UEE-17969
Affected Products
Dell EMC Unity