Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: ESXi returnerer "Kan ikke initialisere NVML: Ukendt fejl" med NVidia GPU

Zusammenfassung: For at løse dette problem skal du angive indstillingen for hukommelsestilknyttet I/O-basis til 512 GB

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

Beskrivelse

Når du forsøger at installere en NVidia GPU (f.eks. M10) i en understøttet 14G-server (R740 og R740XD), efter at du har installeret VIB-driveren, kan følgende fejl opstå, når du forsøger at udføre kommandoen nvidia-smi:

[root@localhost:~] nvidia-smi
kunne ikke initialisere NVML: Ukendt fejl


SLN308065_en_US__1PSE2940error


I nvidia-bug-report.log vises hændelserne i stil med følgende i sektionen /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: indlæsning af NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Dette er en 64-bit bar tilknyttet over 16 TB af systemets
NVRM: BIOS eller VMware ESXi-kernen. Dette PCI I/O-område er tildelt
NVRM: til din NVIDIA-enhed understøttes ikke af kernen.
NVRM: BAR1 er 256M ved 0x382fe00 USD



 


Løsning

Hardwaren fungerer fint. For at løse dette problem skal du indstille indstillingen for hukommelsestilknyttet I/O-basis til 512 GB (standard er 56 TB) eller 12 TB (hvis serveren har >512 GB RAM):

SLN308065_en_US__2PSE2940biossetting


Dette problem er dokumenteret i brugervejledningen til R740-hardwaren:

Hukommelsestilknyttet I/O over 4 GB - Aktiverer eller deaktiverer understøttelsen af PCIe-enheder, der har brug for store mængder hukommelse. Aktiver kun denne indstilling på 64-bit operativsystemer. Denne indstilling er som standard aktiveret.

Hukommelsestilknyttet I/O over basis – Når den er indstillet til 12 TB, angiver systemet MMIO-basen til 12 TB. Aktiver denne indstilling for et operativsystem, der kræver 44-bit PCIe-adressering.
Når den er indstillet til 512 GB, angiver systemet MMIO-basen til 512 GB og reducerer den maksimale understøttelse af hukommelsen til mindre end 512 GB. Aktiver kun denne indstilling for 4 GPU DGMA-problemet. Denne indstilling er som standard angivet til 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (side 52)

 

SLN308065_en_US__3icon Bemærk , at dette begrænser systemhukommelsen til 512 GB (hvis den er indstillet til 512 GB).

 

Når denne indstilling ændres, og systemet er genstartes, bør nvidia-smi generere noget i stil med:

SLN308065_en_US__4PSE2940noerror

Ursache

Lösung

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640
Artikeleigenschaften
Artikelnummer: 000144038
Artikeltyp: Solution
Zuletzt geändert: 07 Okt. 2021
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.