Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: ESXi geeft de foutmelding "Failed to initialize NVML: Unknown Error" met NVIDIA GPU

Zusammenfassung: Om dit probleem op te lossen, moet u de instelling Memory Mapped I/O Base instellen op 512GB

Dieser Artikel gilt für   Dieser Artikel gilt nicht für 

Symptome

Beschrijving

Bij het installeren van een NVIDIA GPU (bijv. M10) in een ondersteunde 14G-server (R740 en R740XD), kan na het installeren van de VIB-driver de volgende foutmelding verschijnen bij de poging om de nvidia-smi opdracht uit te voeren:

[root@localhost:~] nvidia-smi
Kan NVML niet initialiseren: Onbekende fout


SLN308065_en_US__1PSE2940error


In nvidia-bug-report.log worden gebeurtenissen van de volgende strekking weergegeven in het gedeelte /var/log/vmkernel.log:

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: laden van NVIDIA UNIX x86_64 Kernel Module 384.73 ma 1 augustus 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: Dit is een 64-bits BALK die boven 16 TB door het systeem NVRM is
toegewezen: BIOS of de VMware ESXi-kernel. Deze PCI I/O-regio waaraan
NVRM is toegewezen: aan uw NVIDIA-apparaat wordt niet ondersteund door de kernel.
NVRM: BAR1 is 256 miljoen bij 0x382fe00$



 


Oplossing

Hardware werkt prima. U kunt dit probleem oplossen door de Memory Mapped I/O Base-instelling in te stellen op 512 GB (standaard is 56 TB) of 12 TB (als de server >512 GB RAM heeft): Dit probleem wordt beschreven in de gebruikershandleiding van de

SLN308065_en_US__2PSE2940biossetting


R740 hardware:

Memory Mapped I/O above 4 GB - Hiermee kunt u de ondersteuning voor de PCIe-apparaten die grote hoeveelheden geheugen nodig hebben in- of uitschakelen. Schakel deze optie alleen in voor 64-bits besturingssystemen. Deze optie is standaard ingeschakeld.

Memory Mapped I/O above Base - Indien ingesteld op 12 TB, zal het systeem MMIO-base toewijzen aan 12 TB. Schakel deze optie in voor een besturingssysteem waarvoor 44-bits PCIe-adressering vereist is.
Wanneer het systeem is ingesteld op 512 GB, zal het MMIO-basis toewijzen aan 512 GB en de maximale ondersteuning voor geheugen verminderen tot minder dan 512 GB. Schakel deze optie alleen in voor het 4 GPU DGMA-probleem . Deze optie is standaard ingesteld op 56 TB.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf (pagina 52)

 

SLN308065_en_US__3icon Houd er rekening mee dat hiermee het systeemgeheugen wordt beperkt tot 512GB (indien ingesteld op 512GB).

 

Nadat deze instelling is gewijzigd en het systeem opnieuw is opgestart, moet nvidia-smi iets doen wat lijkt op:

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640