Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: NVidia GPU를 탑재한 ESXi에서 "Failed to initialize NVML: Unknown Error"를 반환함

Zusammenfassung: 이 문제를 해결하려면 Memory Mapped I/O Base 설정을 512GB로 설정하십시오.

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

설명

드라이버 vib를 설치한 후 지원되는 14G 서버(R740 및 R740XD)NVidia GPU(예: M10)를 설치하려고 할 때 nvidia-smi command: 명령을 실행하려고 하면 다음 오류가 나타날 수 있습니다.

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


nvidia-bug-report.log에서 다음과 유사한 이벤트가 /var/log/vmkernel.log 섹션에 표시됩니다.

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module 384.73 Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


해결책

하드웨어가 제대로 작동합니다. 이 문제를 해결하려면 Memory Mapped I/O Base 설정을 512GB(기본값은 56TB) 또는 12TB(서버에 512GB 이상의 RAM이 있는 경우)로 설정하십시오.

SLN308065_en_US__2PSE2940biossetting


이 문제는 R740 하드웨어 사용자 설명서에 설명되어 있습니다.

Memory Mapped I/O above 4 GB - 대용량 메모리가 필요한 PCIe 디바이스에 대한 지원을 활성화하거나 비활성화합니다. 이 옵션은 64비트 운영 체제에서만 활성화합니다. 이 옵션은 기본적으로 활성화되어 있습니다.

Memory Mapped I/O above Base - 12TB로 설정하면 시스템이 MMIO 베이스를 12TB로 매핑합니다. 44비트 PCIe 주소 지정이 필요한 OS에서 이 옵션을 활성화합니다.
512GB로 설정하면 MMIO 베이스를 512GB로 매핑하고 최대 메모리 지원 용량을 512GB 미만으로 줄입니다. 이 옵션은 4 GPU DGMA 문제인 경우에만 활성화합니다. 이 옵션은 기본적으로 56TB로 설정됩니다.

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf(52페이지)

 

SLN308065_en_US__3icon 참고: 이렇게 하면 시스템 메모리가 512GB로 제한됩니다(512GB로 설정된 경우).

 

이 설정이 변경되고 시스템이 재부팅되면 nvidia-smi는 다음과 유사한 결과를 출력합니다.

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640
Artikeleigenschaften
Artikelnummer: 000144038
Artikeltyp: Solution
Zuletzt geändert: 07 Okt. 2021
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.