Zu den Hauptinhalten
  • Bestellungen schnell und einfach aufgeben
  • Bestellungen anzeigen und den Versandstatus verfolgen
  • Profitieren Sie von exklusiven Prämien und Rabatten für Mitglieder
  • Erstellen Sie eine Liste Ihrer Produkte, auf die Sie jederzeit zugreifen können.

Dell PowerEdge 14G: ESXiが「Failed to initialize NVML: Unknown Error」をNVidia GPUで返す

Zusammenfassung: この問題を解決するには、[Memory Mapped I/O Base]を512GBに設定してください。

Dieser Artikel gilt für Dieser Artikel gilt nicht für Dieser Artikel ist nicht an ein bestimmtes Produkt gebunden. In diesem Artikel werden nicht alle Produktversionen aufgeführt.

Symptome

説明

サポートされている14Gサーバー(R740およびR740XD)NVidia GPU(例:M10)をインストールしようとすると、ドライバーVIBのインストール後にnvidia-smiコマンドを実行しようとしたときに次のエラーが表示されることがあります。

[root@localhost:~] nvidia-smi
Failed to initialize NVML: Unknown Error


SLN308065_en_US__1PSE2940error


nvidia-bug-report.logの「/var/log/vmkernel.log」セクションには、次のようなイベントが表示されます。

2017-11-02T18:28:19.707Z cpu45:66263)NVRM: loading NVIDIA UNIX x86_64 Kernel Module  384.73  Mon Aug 21 15:16:25 PDT 2017
2017-11-02T18:28:19.710Z cpu3:66145)NVRM: This is a 64-bit BAR mapped above 16 TB by the system
NVRM: BIOS or the VMware ESXi kernel. This PCI I/O region assigned
NVRM: to your NVIDIA device is not supported by the kernel.
NVRM: BAR1 is 256M @ 0x382fe00$



 


対処方法

ハードウェアは正常に動作しています。この問題を解決するには、Memory Mapped I/O Base設定を512 GB(デフォルトは56TB)または12 TB(サーバーに > 512 GB RAMがある場合)に設定してください。

SLN308065_en_US__2PSE2940biossetting


この問題は、R740ハードウェア オーナーズ マニュアルに記載されています。

Memory Mapped I/O above 4 GB] - 大量のメモリーを必要とするPCIeデバイスのサポートを有効または無効にします。このオプションは、64ビットのオペレーティング システムでのみ有効にします。このオプションは、デフォルトで[Enabled]に設定されています。

Memory Mapped I/O above Base] - 12TBに設定すると、システムはMMIOベースを12TBにマップします。44ビットPCIeアドレス指定が必要なOSの場合は、このオプションを有効にします。
512 GBに設定すると、システムはMMIOベースを512 GBにマップし、メモリーの最大サポートを512 GB未満に減らします。このオプションは、4 GPU DGMA問題に対してのみ有効にします。このオプションは、デフォルトで56TBに設定されています。

http://topics-cdn.dell.com/pdf/poweredge-r740_owner's%20manual_en-us.pdf(ページ52)

 

SLN308065_en_US__3icon :これにより、システム メモリーが512GBに制限されます(512GBに設定した場合)。

 

この設定を変更してシステムを再起動すると、nvidia-smiは次のような内容を出力します。

SLN308065_en_US__4PSE2940noerror

Ursache

-

Lösung

-

Betroffene Produkte

PowerEdge R740, PowerEdge R740XD, PowerEdge T640
Artikeleigenschaften
Artikelnummer: 000144038
Artikeltyp: Solution
Zuletzt geändert: 07 Okt. 2021
Version:  4
Antworten auf Ihre Fragen erhalten Sie von anderen Dell NutzerInnen
Support Services
Prüfen Sie, ob Ihr Gerät durch Support Services abgedeckt ist.