Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: Systém ESXi s grafickou kartou Nvidia zobrazuje chybu „Failed to initialize NVML: Unknown Error“

Zusammenfassung: Chcete-li tento problém vyřešit, nastavte možnost Memory Mapped I/O Base setting na hodnotu 512 GB

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Popis

Při pokusu o instalaci grafické karty NVIDIA (např. M10) do podporovaného serveru 14G (R740 a R740XD) se po instalaci souboru vib ovladače může zobrazit následující chyba při pokusu o spuštění příkazu nvidia-smi:

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


V protokolu nvidia-bug-report.log se v části /var/log/vmkernel.log zobrazí události podobné následujícím:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


Řešení

Hardware pracuje správně. Chcete-li tento problém vyřešit, nastavte možnost Memory Mapped I/O Base na hodnotu 512GB (výchozí hodnota je 56TB) nebo 12TB (pokud má server více než 512 GB RAM):

SLN308065_en_US__2PSE2940biossetting


Tento problém je zdokumentován v uživatelské příručce k hardwaru R740:

Memory Mapped I/O above 4 GB – Povolí nebo zakáže podporu zařízení PCIe, která potřebují velké množství paměti. Tuto možnost povolte pouze pro 64bitové operační systémy. Tato možnost je ve výchozím nastavení nastavena na hodnotu Enabled.

Memory Mapped I/O above Base – Při nastavení na 12 TB systém namapuje základnu MMIO na 12 TB. Tuto možnost povolte u operačního systému, který vyžaduje 44bitové adresování PCIe.
Při nastavení na 512 GB systém namapuje základnu MMIO na 512 GB a sníží maximální podporu paměti na méně než 512 GB. Tuto možnost povolte pouze při problému DGMA se 4 grafickými kartami. Tato možnost je ve výchozím nastavení nastavena na hodnotu 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (strana 52)

 

SLN308065_en_US__3icon Upozorňujeme, že tím se omezí velikost systémové paměti na 512 GB (je-li nastavena na 512 GB).

 

Po změně tohoto nastavení a restartování systému by měl příkaz nvidia-smi vygenerovat podobný výstup:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640
Artikeleigenschaften
Artikelnummer: 000144038
Artikeltyp: Solution
Zuletzt geändert: 07 Okt. 2021
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.